Gewiss kein Grüner Schwan? Plädoyer für ein Datengütesiegel in Zeiten Künstlicher Intelligenz.

Grüner Schwan bezeichnet eine neue Klasse systemischer Risiken, vor allem aus dem Kontext des Klimawandels, die ebenso unvorhersehbar wie unumkehrbar sind und dabei die Stabilität von Wirtschaft und Gesellschaft tiefgreifend gefährden können. Er baut auf dem Begriff des „Schwarzen Schwans“ von Taleb auf, der in seinem gleichnamigen Buch damit seltene Ereignisse mit enormer Wirkung, wie etwa die Finanzkrise 2008 beschreibt. Seinen Namen verdankt das Konzept der historischen Annahme, alle Schwäne seien weiß – bis 1697 in Australien zum ersten Mal ein schwarzer Schwan tatsächlich beobachtet wurde. Grüne Schwäne hingegen existieren (nach wie vor) nicht.

Die Datenwirtschaft teilt seit vielen Jahren ihre Daten auf Lizenzbasis. Die Nutzer bezahlen für die Erstellung, Bereitstellung und Art der Datennutzung. Lizenz- und Preisstandards dazu gibt es nicht. Doch nicht nur das. Es fehlt dem Markt an Qualitätsorientierung. Nehmen wir das Beispiel der Vollständigkeit. So lange alle Objekte unserer Welt nicht vollständig in Raum und Zeit digital erfasst sind, fehlt es an der objektiven Referenz. Was gibt es alles und wieviel davon? Über die sogenannten „unknown unknowns“ wissen wir nichts. Das ist gewiss. Mit welchem Maß an Gewissheit können wir also sagen, dass der fehlende „Grüne Schwan“ in unseren Daten wirklich fehlt oder ein möglich enthaltener schwarze Schwan wirklich stimmt? Übertragen in die Praxis: Was stellt beispielsweise die Referenz dar, ob eine am Datenmarkt verfügbare Liste aller Kindergärten, Kitas und privater „Tagesmütter“ für eine Versorgungsanalyse in Deutschland wirklich Vollständigkeit ist? Sie gibt es nicht.

Durch die fortschreitende Datafication, wie man auch die Digitalisierung unserer Welt nennt, mehren sich fortlaufend die Echtdaten. Schätzungen und Hochrechnungen werden entsprechend weniger notwendig. Doch die Ungewissheit (Uncertainty) darüber, ob Grundgesamtheit bzw. Teilpopulation in einem bestimmten Gebiet zu einem bestimmten Zeitpunkt (Aktualität) vollständig abgebildet ist, bleibt. Dazu zählen auch Präzision der Datenerfassung (Exaktheit) und Schätzung (Vorhersagegüte) bei nicht vorhandenen Echtdaten.

Den Käufern sowie Nutzern von Daten fehlt ein verlässliches Maß an „Certainty“. Der Datenmarkt setzt Lizenzbedingungen und Preise fest, ohne ein Maß an Gewissheit zu liefern. Man schenkt lieber einer aufbereitenden Information, dem Outcome auf Daten, seinen Glauben und sinniert höchstens noch über die angewendete Analyse, als dass die Qualität der eingehenden Daten, das Income selbst hinterfragt wird. Ganz in der Hoffnung „no garbage in, no garbage out“. Ob aber der grüne Schwan einfach nur vergessen wurde zu erfassen oder gewiss keiner vorhanden ist, weiß man nicht. Was jedoch gewiss fehlt: Ein Datengütesiegel.

Datengütesiegel der dai

Das data analytics institute hat es sich zur Aufgabe gemacht, die CERTAINTY als Qualitätsmaß für Daten zu entwickeln. Kontaktieren Sie uns gerne, wenn Sie Fragen dazu haben oder Ihre Daten in ihrer Qualität in unserem Data Lab überprüfen lassen wollen.

Weiterführender Artikel zur Uncertainty & ML u.a. [2305.16703] Sources of Uncertainty in Supervised Machine Learning — A Statisticians‘ View

Neue Partnerschaft für mehr Wertschöpfung aus Agrardaten

Q-Farm-Hub und Data Analytics Institute bündeln Kräfte zur Nutzung land- und forstwirtschaftlicher Daten für mehr Resilienz, Transparenz und Wirtschaftlichkeit. Dazu werden getrennt bestehende Datensilos im Agrarsektor miteinander verknüpft und so ein europäischer Datenraum für Agrardaten geschaffen.

Bonn, 2. Juni 2025 – Daten, Daten, Daten – sie entstehen auch fortlaufend in der Landwirtschaft. Sogenannte Agrardaten können konkret dabei helfen, Risiken zu minimieren, Wertschöpfung zu steigern und den gesellschaftlichen Nutzen zu erhöhen. Zwei Partner, die sich dieser Aufgabe verschrieben haben, bündeln ab sofort ihre Kräfte. Der Q-Farm-Hub der EQA und das Data Analytics Institute (dai) mit Sitz im Digital Hub agieren künftig gemeinsam vom Standort Bonn aus, um land- und forstwirtschaftliche Betriebe datenbasiert zu stärken.

Der Q-Farm-Hub – die neue Daten- und Informationsdrehscheibe für die Agrarwirtschaft

Initiiert von der Education and Qualification Alliance SCE (EQASce), ist der Q-Farm-Hub Europas erster webbasierten Agrar-Cloud-Hub. Ziel ist es, Daten aus der Landwirtschaft (sog. Agrardaten) als Vermögenswert zu erfassen, aufzubereiten und weiterzugeben. Nutzer der Agrardaten sind die Landwirt:innen, Marktpartner, Dienstleister und öffentliche Stellen. Der Hub erfüllt dabei auch eine neue Funktion im Sinne des Onlinezugangsgesetzes (OZG), indem er standardisierte digitale Schnittstellen zur Kommunikation mit Veterinär-, Gesundheits- und Umweltämtern sowie Forschungs- und Bildungseinrichtungen etabliert.

Das Data Analytics Institute – Daten zur Wertschöpfung bringen

Das Data Analytics Institute (dai) bietet ein breites Spektrum datenwissenschaftlicher und interdisziplinärer Expertise: Von der rechtlichen Einordnung der Daten über die Modellierung und Analyse bis zur auf den Punkt gebrachten Informationsbereitstellung. Ziel des Instituts ist es, Daten in greifbaren Mehrwert zu transformieren – und dabei auch organisationsübergreifende Kooperationen zu ermöglichen. Im Fokus steht dabei stets: Wissen generieren, Entscheidungen fundieren, Wirkung entfalten. Und das gilt selbstverständlich auch für Agrardaten.

Maul- und Klauenseuche zeigt Handlungsbedarf: Agrardaten als Frühwarnsystem

Ein aktuelles Beispiel für die Notwendigkeit intelligenter Datenlösungen ist der Ausbruch der Maul- und Klauenseuche (MKS) im Januar 2025 in Brandenburg. Die unmittelbaren Auswirkungen auf Fleisch- und Milchlieferketten waren gravierend. EU-Hilfen in Höhe von 15 Millionen Euro sollen jetzt nach Deutschland, Tschechien und Slowenien fließen. Doch der wirtschaftliche Schaden für die Betriebe bleibt.

„Ein schnellerer, transparenterer und zielgerichteter Daten- und Informationsfluss kann bei zukünftigen Krisen Schäden deutlich minimieren“, betont Prof. Dr. Brigitte Petersen, Vorstandsvorsitzende der EQASce. Dafür brauche es klare Regeln: „Welche Daten sind relevant, welche Betriebe und Lieferketten sind wie und vor allem wo betroffen – und in welcher Form gelangen die Informationen effizient zu den zuständigen Akteuren?“ ergänzt Michael Herter, CEO des Data Analytics Institute. Die Herausforderung liegt darin, diese Daten so zu strukturieren und bereitzustellen, dass sie grundsätzlich, vor allem aber im Krisenfall sofort handlungsleitend sind.

Gemeinsam für eine resiliente und datengetriebene Landwirtschaft

Der Schulterschluss von EQASce und dai zeigt: Datenräume im Agrarsektor können konkrete wirtschaftliche und gesellschaftliche Mehrwerte schaffen – wenn sie sinnvoll gestaltet, standardisiert und strategisch genutzt werden. Die Kooperation in Bonn ist ein klares Signal: Die Datenzukunft der Landwirtschaft ist digital, vernetzt – und resilient.


Kontakt:

Data Analytics Institute (dai)

Digital Hub Bonn

presse@dai.institute

www.dai.institute

Erstes unabhängiges und interdisziplinäres Dateninstitut für Wirtschaft, Wissenschaft und Politik in Deutschland gegründet.

  • Evaluation, Qualifizierung und Entwicklung von Daten durch hochspezialisierte Data Scientisten in Kombination mit AI-gestützter Verfahren
  • Datenschutz- und lizenzrechtliche Fragestellungen, z.B. wem gehört ein Datum?

Bereits in der Gründungsphase startet das dai mit folgenden wegweisenden Forschungsprojekten:

  • Umsetzung einer datenspezifischen AI-Infrastruktur (DAII) für Organisationen
  • Thomas Losse-Müller, Vorsitzender des Aufsichtsrats, ist einer der führenden Politiker für Digitalisierung und Klimaneutralität. Er ist u.a. Direktor der Stiftung Klimaneutralität sowie des Sozial-Klimarats.
  • Jörn Bielfeldt, Gründungsgesellschafter und Geschäftsführer der Public Good GmbH, komplettiert das Team beratend.
Von links: Özlem Doger-Herter, Björn Schmidt, Göran Kauermann, Ursula Berger, Jörn Bielfeldt, Michael Herter