Art des Artikels
Themen-Überblick
Autor
geek-andi

In Sache Kartevonmorgen: Warum Daten-Sync ein roter Hering ist

Bild
Freie Schlagwörter
Zusammenfassung

In unserem letzten Artikel haben wir Qualitätskriterien für Nachhaltigkeits-Suchmaschinen formuliert und Transiscope als gutes Vorbild genannt. Nun möchten wir erläutern, warum "Daten-Sync" kein Ersatz für Lizenz-Vielfalt und Gleichbehandlung ist.

Haupt-Inhaltsfeld

Zu unserem letzen Artikel zu diesem Thema: Qualitätskriterien für Vernetzer von Vernetzungsplattformen

Transiscope ist deshalb ein gutes Vorbild, weil es die Lizenzen der Redaktionen respektiert und nicht mit ihnen in Konkurrenz tritt. Z.B. verweist Transiscope zum Aktualisieren von Einträgen auf den ursprünglichen Anbieter.

Beide Punkte sind zentral für unsere Forderung nach Lizenz-Diversität und Gleichbehandlung. In der Kommunikation mit Kvm hören wir nun immer wieder den Hinweis, dass viele Probleme in Zukunft von "Sync" gelöst werden. Für uns ist das ein sogenannter "roter Hering", der vom eigentlichen Problem ablenkt. Oft wird dies nicht bewusst oder geplant eingesetzt.

"Sync" machts dann schon

Die Annahme hinter der Sync Idee ist: "Alle können alle Einträge auf allen Plattformen bearbeiten, und Sync bietet einen effizienten Weg, dass alle Änderungen sinnvoll zusammenfließen". Es geht also um die (automatisierte) Synchronisierung der Einträge auf verschiedenen Portalen.

Nehmen wir als Beispiel den Eintrag des Weltladens Freiburg. Er erscheint auf der Website des Weltladen Verbands, dem Regioportal StadtWandler, der Karte von morgen und möglicherweise weiteren Portalen. Nun kann es passieren, dass gleichzeitig Änderungen an dem Eintrag auf zwei Portalen vorgenommen werden. Dank "Sync" werden beide Änderungen auf allen Portalen übernommen. Es erscheint überall der gleiche Eintrag mit beiden Aktualisierungen.

Wir werden zeigen, das:

  • der "Alle können alles überall bearbeiten"-Ansatz nicht effizient umsetzbar ist,
  • der "Alle können alles überall bearbeiten"-Ansatz gar nicht wünschenswert ist
  • und es einen anderen, besser geeigneten Lösungsansatz für das beschriebene Problem gibt.

Automatisches "Sync" ist eine Illusion

Stell dir vor: Du schreibst an einem langen Text, etwa einer Master-Arbeit. Du bist in der Phase, wo du viele kleine Änderungen und Korrekturen quer über den Text machst. Auf einmal denkst du dir: "Hab ich das nicht schon einmal korrigiert?". Nun gehst du der Sache auf den Grund, und es stellt sich heraus, dass du eine Datei-Version verwechselt hast, und vor sechs Wochen angefangen hast, mit einer 12 Wochen alten Version deines Textes zu arbeiten.

Nun stehst du vor dem Sync-Problem: Zwei verschiedene Datei-Versionen, beide mit unterschiedlichen Änderungen. Dein Textprogramm hat glücklicherweise "Sync" in Form einer "Zusammenführen" Funktion. Das Textprogramm meldet Erfolg: "1322 Anderungen automatisch zusammengeführt." Gerade setzt du zu einem Freudenruf an, als du liest: "Weitere 1789 Änderungen benötigen manuelle Unterstützung". Du wirst wohl weitere 3 Wochen dafür benötigen, sie einzuarbeiten.

Manuelles "Sync" ist nicht bezahlbar

Was ist passiert? Programmierer kennen das: Wenn Änderungen im Text an ganz unterschiedlichen Stellen passieren, kann "Sync" sie automatisch zusammen führen. Doch in den Fällen, wo Änderungen am gleichen Satz gemacht wurden, bleibt nichts weiter als selbst Hand anzulegen. Das ist aufwändig.

Für unser Weltladen Beispiel sieht es ähnlich aus: Nehmen wir an, dass beide Änderungen die Kurzbeschreibung des Weltladens betreffen . Eine Änderung stammt von Kvm, die andere stammt von StadtWandler. Da beide Änderungen die Kurzbeschreibung betreffen, wird die automatische Sync-Funktion nicht funktionieren.

Stellen wir uns nun noch vor, unsere Portale haben Erfolg, sie haben zehnmal so viele Einträge, und alle wollen darauf verzeichnet sein. Die Zahl der Änderungen und die Zahl der damit verbundenen Sync-Konflikte nimmt rapide zu.

Das bedeutet also ziemliches Chaos und unnötige Redaktions-Arbeit, die durch kein "Sync" der Welt automatisiert werden kann.

"Sync" ist nicht einmal wünschenswert

Wenn unsere Portale erfolgreich sind, kommt noch etwas hinzu: Einige Eintragende möchten z.B. ihr eigenes Unternehmen etwas besser darstellen als es eigentlich ist. Oder sogar den Eintrag eines Konkurrenz-Unternehmens etwas "anpassen". Die unerwünschten von den erwünschten Änderungen zu unterscheiden wird also immer aufwändiger. Es ist auch unklar, wer überhaupt entscheidet, welche Änderungen korrekt sind und welche nicht.

Es braucht also verantwortliche Redaktionen. Und die Redaktionen sind darauf angewiesen ihren Unterhalt zu finanzieren, sprich: Sie brauchen ein Geschäftsmodell. .

Wie es gehen könnte

Die Ideenfolge "Alle können alles überall bearbeiten" plus "Sync machts dann schon" bringt uns also nicht zur Lösung des Problems der ineffizienten Redaktionsarbeit. Was könnte ein besserer Ansatz sein?

Schauen wir uns an, wo die Daten entstehen. Oder anders gesagt: Was sind unsere Wertschöpfungsketten? Ein Bioverband weiß genau, welcher Landwirt sein Zertifikat trägt und welcher nicht. Der Weltladen Verband weiß genau, wer bei ihm Mitglied ist und wer nicht. Das Regioportal kennt alle kleineren Initiativen und Unternehmen vor Ort. Es gibt also unterschiedliche Datenanbieter, die alle davon profitieren, wenn ihre Daten leicht auffindbar sind. Unter welcher Lizenz sie jeweils ihre Daten bereitstellen, hängt sehr stark von ihrem jeweiligen Geschäftsmodell ab.

Es geht also darum, unterschiedliche Datenbanken mit unterschiedlichen Nutzungsrechten übersichtlich in einer Suchmaschine zusammenzuführen.

Der Eintrag des Weltladen Freiburgs besteht aus mehreren Datenpunkten:

  • Name und Adresse
  • Öffnungszeiten
  • Mitglied im Weltladen Dachverband oder freier Weltladen
  • Demeter-Händler Zertifikat (nehmen wir an, der Weltladen wäre demeter Händler)

Der Weltladen Dachverband pflegt einige dieser Datenpunkte, nämlich Name und Adresse, Öffnungszeiten und ob der Laden Mitglied im Weltladen Dachverband oder ein freier Weltladen ist.

Demeter weiß welche Händler Demeter Produkte verkaufen und stellen diesen Datenpunkt bereit. Für all diese Daten ist klar, dass nicht irgendwer Änderungen daran vornehmen können soll. Wenn es Änderungen am Namen, der Adresse, den Öffnungszeiten oder dem Mitgliedschafts-Status gibt, meldet der Betreiber diese ohnehin an den Dachverband. Wenn sich etwas an der Demeter Zertifizierung ändert, gibt dies der Demeter-Verband bekannt.

Das heißt: Für jeden Datenpunkt gibt es eine eindeutige Heimat. Im Fachjargon heißt das "Single Source of Truth". Dadurch kann sich ein Partnerportal sicher sein, wo es die aktuellen Daten herbekommt.

Wir sehen auch, dass ein Eintrag aus mehreren Datenpunkten bestehen kann, die aus unterschiedliche Quellen kommen. Und das ist auch gut so, denn die Expertisen der beteiligten Akteure liegen eben in unterschiedlichen Bereichen.

Technisch bedeutet dies, dass wir einen Mechanismus brauchen um einen Eintrag eindeutig identifizieren zu können. Nur so können wir Datenpunkte aus mehreren Quellen korrekt zusammenführen. Wie genau dieser Mechanismus funktioniert, sollte das Resultat eines gemeinsamen Prozesses der beteiligten Akteure sein. Wir stellen dadurch sicher, dass wir keine Anwendungsfälle vergessen und eine breite Akzeptanz, quasi als "Branchenstandard" schaffen.

Mit diesem Ansatz stellen wir sicher, dass aktualisierte Daten immer von der Stelle geprüft werden, die die Expertise hat. Das Regioportal kann dann die Einträge des Weltladen Verbands und von Demeter (und vielen anderen) zusammenführen und anzeigen und muss diese nicht selber pflegen. Das Regioportal oder jedes andere Portal hat natürlich immer noch die Möglichkeit zusätzliche Daten selber zu erstellen, z.B. die Information, wie man beim Weltladen mitmachen kann. Ob dieser Datenpunkt auch per Schnittstelle für andere freigegeben wird, entscheidet das Regioportal (bzw gemeinsam mit den dort verzeichneten Organisationen).

Die Suchmaschine kann so jederzeit auf die aktuellen Daten zugreifen und sich sicher sein, dass diese auch korrekt sind.

Wir sind erst am Anfang davon, funktionierende Wertschöpfungsketten für Nachhaltigkeits-Daten aufzubauen. Dafür braucht es gemeinsame Regeln, Lizenz-Diversität und Suchmaschinen, die diese Lizenz-Diversität respektieren. Das Beispiel der Initiativensuchmaschine Transiscope zeigt, wie es gehen kann.

Zuletzt geändert
06.12.23, 23:57