Willkommen Sascha! Als Director für Sales & Data Products baut der erfahrene Business Manager am Dateninstitut einen neuen Bereich auf.

Bonn, 1. November 2025. Dai dai – es geht los! Ab heute trifft das auch für Sascha Jablonski zu. Der erfahrene Business Manager war noch bis vor kurzem Prokurist und Mitglied der Geschäftsleitung bei infas 360 und wechselt nun nahtlos zum data analytics institute (dai). Hier baut er den Vertrieb für Data Products auf, was sich rund um das Datenmodell TWIN und daia-x, Deutschlands einzigartigen Datenplattform bewegt.

Director Sales & Data Products: Sascha Jablonski wechselt zur dai

Sascha Jablonski (36) hat sich bei der infas 360 über Jahre zum Spezialisten im Data Consulting entwickelt. Er war dort u.a. zuständig für den Auf- und Ausbau von Unternehmensdaten und maßgeblich beteiligt an der Schaffung eines nachhaltigen Datennetzwerks in der Branche. Nun geht er einen Schritt weiter und baut das Data Products Portfolio auch in Richtung Wohnen und Gebäude mit aus. Als gelernter Kaufmann bildet er die Schnittstelle aus Kundenmanagement, Produkten und Projekten. Folgen wird somit in Kürze eine weitere Sales Verantwortung für Kundenprojekte. „Entsprechende Gespräche werden diesbzgl. gerade geführt“, kommentiert Sascha, gerne per Du, den Wachtsumskurs der dai. „Die Expertise des gesamten dai-Teams aus Wissenschaft und Wirtschaft in Kombination mit den großen Chancen am sich verändernden Datenmarkt, machen die Herausforderung so spannend. Ich freue mich sehr!“


Die ersten Data Products stehen

Der erste Open Geocoder kommt in Kürze auf den Markt. Er wird einen neuen Standard in Deutschland setzen. Es folgen Gebäudedaten und Weiterentwicklungen mikrogeographischer Datenbanken. Ganz speziell hier Daten für den Energiemarkt.

Kontakt

presse@dai.institute

Dateninstitut startet daia-x

Bonn, 30. Oktober 2025. Mit daia-x startet das data analytics institute (dai) eine Initiative, die das Denken über Datenräume in Deutschland grundlegend verändern soll. Aufbauend auf den Prinzipien der europäischen gaia-x-Initiative schafft daia-x eine vernetzte Dateninfrastruktur, die Datenquellen aus Wirtschaft, Wissenschaft und Verwaltung systematisch miteinander verbindet und sektorübergreifend zur Verfügung stellt.

Von gaia-x zu daia-x: Die Idee der europäischen Datenräume

gaia-x steht für die Vision eines europäischen Datenökosystems, das technologische Innovation mit digitaler Souveränität verbindet. Diese Vision wird nun inhaltlich umgesetzt. Hier setzt das Netzwerk daia-x an. Es stellt die praktische Brücke zwischen Infrastruktur und Anwendung für sektorübergreifende Datenräume auf Basis eines einheitlichen Datenmodells (TWIN) dar.

daia-x schafft Strukturen, in denen Daten nicht zentralisiert, sondern qualitativ vernetzt werden. Es soll so den Herausforderungen unserer gesellschaftlichen Transformation wie beispielsweise der Energie- und Mobilitätswende evidenzbasiert begegnet werden.

Die neue Infrastruktur für vertrauenswürdige Datenräume in Deutschland

Im Zentrum von daia-x steht ein Netzwerk spezialisierter Dateninstitute und ihren Datenräumen, die unterschiedliche Lebens- und Wirtschaftsbereiche abbilden:

  1. daia-W – Datenraum für Wohnen und Soziales
    Daten über Gebäude, Wohn- und Lebenssituationen insbesondere Energie und Gesundheit.
  2. daia-M – Datenraum für Mobilität
    Daten über Mobilitätsverhalten.
  3. daia-A – Datenraum für Arbeit & Ökonomie
    Daten über Unternehmen, Arbeitsmarkt, Bildung und Beschäftigung.
  4. daia-K – Datenraum für Kommunikation & Journalismus
    Geprüfte Daten für Journalismus, Diskurs und gesellschaftliche Teilhabe.
  5. daia-S – Datenraum für Statistik & AI
    Methodische Brücke zur Wissenschaft, die die Standards für Qualität und Validität von Daten und Analysen definiert (TRUST).

Neues Forschungsdatenzentrum (FDZ) geplant

Im Rahmen der Initiative ist zudem geplant, ein Forschungsdatenzentrum (FDZ) zu etablieren. Ein FDZ ist eine wissenschaftliche Einrichtung, die den sicheren Zugang zu sensiblen, personen- oder unternehmensbezogenen Mikrodaten für Forschung und Politikberatung ermöglicht. Ziel ist es, hochwertige Datenbestände – z. B. aus amtlichen, wirtschaftlichen oder sozialwissenschaftlichen Quellen – unter klar definierten Datenschutz- und Qualitätsstandards bereitzustellen.

Kontakt
presse@dai.institute

Open Geocoder: Freistaat Bayern und Niedersachsen sind alles andere als Open (Data)

Bonn, 22.10.2025. In Kürze veröffentlicht das data analytics institute (dai) den ersten Open Geocoder zur freien Verwendung mit rund 23 Mio. adressgenauen Koordinaten für alle Bundesländer. Für alle? Nein, denn Bayern und Niedersachen scheren aus. Nur durch die Verknüpfung mit anderen öffentlichen und privaten Datenbanken findet sich eine Lösung. Das ist alles andere als im Sinne der europäischen Open Data Initiative. Frei sein, heißt scheinbar nicht auch „offen“ sein.

Open Geocoder erscheint noch in diesem Quartal

Der Open Geocoder wird in den nächsten Wochen als Open Source Software im GIT-Hub kostenlos zur Verfügung gestellt. Er nutzt das TWIN-Datenmodell, was die Anonymisierung von Adressen durch räumliche Aggregation (zB pro Siedlungsblock oder Ortsteil) ermöglicht. Damit ist der Open Geocoder wesentlicher Baustein des DSGVO-Frameworks SAFeDY.

Adressen und Hauskoordinaten als Open Data in Baden-Würtemberg (Quelle: Geoportal BaWü)


Adressbasis mit Koordinaten offen und modular integrierbar

Alle Bundesländer außer Bayern und Niedersachsen stellen ihre Verzeichnisse als Open Data zur Verfügung. Um eine bundesweite Lösung zu ermöglichen, muss man Brücken zu weiteren Public & Private Datenquellen schlagen, was der dai nun gelungen ist. Die Datenbasis ist somit modular aufgebaut. Der Bereitstellung von Software und Daten steht also nichts mehr im Wege: Geocodierung für alle – und damit auch Anonymisierung für alle! So die Devise des Dateninstituts dai.

SAFeDY als grundlegender Bestandteil von daia-x

Das DSGVO-konforme Framework SAFeDY wird beim Austausch von Daten auf der neuen Datenplattform daia-x eine grundlegende Rolle spielen. daia-x wird spezielle Datenräume für Wissenschaft, Wirtschaft, Journalismus und Politik bereitstellen.

Use Case Kommunale Wärmeplanung

Seit die Energiewende operativ durch die kommunale Wärmeplanung bei den Gemeinden und örtlichen Energieversorgern angekommen ist, gilt es (spätestens mit dem Wärmeplanungsgesetz) Daten untereinander auszutauschen, damit Strategie und Planung auf einer möglichst evidenten Datenbasis erfolgt. Der Open Geocoder stellt dazu ein effektives und kostenloses Basistool dar.

Kontakt

presse@dai.institute

TWIN nimmt weiter Form an: Verteilte Open Data aller Länder ab sofort aus einer Hand verfügbar. Elementare Daten für Planungen jeder Art. Extrem kostengünstig. Einfach lizenziert.

9. Oktober 2025. TWIN ist das neue Datenmodell der data analytics institute AG. Es vereint erstmals Menschen und die Objekte unserer Welt in einem, holistischen digitalen Abbild. Im ersten Schritt liegen nun alle verfügbaren Open Data der 16 Bundesländer zusammengefasst in einer Datenbank vor. Aber nicht das einheitliche Datenmodell ist von großem Vorteil: Open Data führt zu extrem günstigen und einfachen Lizenzbedingungen.

3D-Gebäudedaten mit allen Adressen

Karl-Schumacher-Str. 2 in Bonn als 3D-Gebäude (LOD2) mit der Nachbaradresse Heussallee 40 als Doppelhaus-Villa. Zur OPEN DATA zählen Adressen, Flurstücke und Siedlungsblöcke. Quelle: https://www.dz.nrw.de/

Zum Datenmodell TWIN zählen vor allem alle 3D-Gebäude Deutschlands mit zugehörigen rund 23 Mio. Adressen aus denen sich wichtige Gebäude-Merkmale wie

  • Gebäudetyp
  • Gebäudegrundfläche
  • Gebäudevolumen
  • Gebäudehöhe
  • Gebäudegeschosse
  • Gebäudedachform
  • Gebäudefunktion
  • Gebäudeausrichtung
  • Gebäudedachfläche
  • Gebäudefassadenfläche

ableiten lassen. Die Daten werden als einfache Adressdatenbank auf Wunsch inkl. der 3D-Gebäude in einem Gesamtdatenpaket TWIN.BUILDING zur Verfügung gestellt.

Neuer OPEN GEOCODER nutzt Datenmodell von TWIN

Im Datenmodell TWIN sind alle rund 23 Mio. Adressen zu allen räumlichen Aggregationsebenen referenziert. Dazu zählen amtliche Gebäudeobjekte, Flurstücke, Siedlungsblöcke und Gemarkungen. Die Ebenen reihen sich nahtlos in die Struktur einer Gemeinde ein. Alle Adressen haben zusätzlich eine Lagekoordinate. Unter TWIN.GEOCODES sind die Daten verfügbar und werden aktuell in einem Projekt des Instituts in einen OPEN GEOCODER als Teil des datenschutzkonformen Frameworks SAFeDY eingebaut (siehe dazu Dateninstitut entwickelt neues, offenes Framework SAFeDY zur Anonymisierung von Adressen durch räumliche Aggregation)

Kontakt

presse@dai.institut

Dateninstitut entwickelt neues, offenes Framework SAFeDY zur Anonymisierung von Adressen durch räumliche Aggregation

Bonn, 8. Oktober 2025. Die Anonymisierung personenbezogener Daten ist in der Datenverarbeitung eine grundlegende Aufgabe. Die räumliche Aggregation spielt dabei eine zentrale Rolle. Das data analytics institute (dai) arbeitet gerade an einem entsprechenden Framework (SAFeDY), dass Institutionen ein offenes Set an Werkzeugen zur Hand gibt, um Adressen DSGVO-konform anonymisieren zu können. Gerade beim Daten teilen zur Umsetzung einer effektiven Datenökonomie wie beispielsweise in der kommunalen Wärmeplanung soll das neue Framework SAFeDY Grundlage jeder anstehenden Verarbeitung von Adressen oder GPS-Daten werden.

SAFeDY – Spatial Aggregation Framework for Data Privacy – bietet ein Set an Tools zur Anonymisierung personenbezogener Daten durch räumliche Aggregation

Räumliche Aggregation zur Anonymisierung von Positionen wie Adressen oder GPS-Daten gehören zur grundlegenden Herausforderung in der Verarbeitung personenbezogener Daten. Das neue und offene Framework SAFeDY bietet Institutionen den dafür notwendigen Werkzeugkasten. Zum Framework zählt u.a.

  • Ein offenes, hierarchisches Mehrebenen-Raummodell, was Adressen und Standorte in beliebige Gebiete wie beispielsweise Wohnblöcke, Quartiere und Stadteile oder Kacheln (100x100m, 1x1km usw.) zusammenfassen lässt
  • Eine offene Geokodierung, die sich flexibel in jede Infrastruktur implementieren lässt und Adressen innerhalb einer Institution verarbeiten lässt, um die Raumebenen anreichern zu können
  • Die flexible, DSGVO-konforme Aggregation (und Darstellung) personenbezogener Daten in beliebige Gebiete


Open Geocoder – offene Geokodierung für Alle

Die Open Source & Data Initiativen machen es möglich. Das Dateninstitut dai plant noch im Laufe dieses Quartals und damit bis Ende des Jahres erstmals einen Open Geocoder auf den Markt zu bringen. Hauptelement der dazu notwendigen Referenzdaten sind die offenen Geodaten der einzelnen Bundesländer (u.a. die 3D-Gebäudedaten), die im Datenmodell TWIN am Institut zusammenfließen und harmonisiert werden. Die Softwareentwicklung und spätere Lizenz folgt dabei den Möglichkeiten von Open Source Richtlinien. Geokodierung ist somit erstmals für alle da (und weiterentwickelbar).

Kontakt

Sie haben Fragen zur räumlichen Aggregation oder zum Framework SAFeDY? Dann kontaktieren Sie uns unter presse@dai.institute

Kurt-Schumacher-Str. 2 – das Dateninstitut in neuen, ehrwürdigen Räumen mit klarer Wachstumsstrategie

01. Oktober 2025. Die data analytics institute AG verlegt ihren Hauptsitz in die ehrwürdigen Räume der Kurt-Schumacher-Str. 2 in Bonn und setzt damit ihre klare Wachstumsstrategie weiter um. Damit verbunden starten drei weitere Data Science Profis, um den inhaltlichen Aufbau des Dateninstituts voranzutreiben.

Neue Data Science Profis nehmen ihre Arbeit auf

Mit Beatrice Nolte (Mitte) gewinnt die dai eine der erfahrensten Spezialistinnen für Marktdaten und Mikrogeographie. Die gelernte Volkswirtin betreute zuletzt die Entwicklung entscheidender Kennziffern für Energiebranche und Bundespolitik. Sebastian Hugo (2. vr), ebenfalls Volkswirt, ist Datenbankspezialist und wird das neue Datenmodell TWIN gemeinsam mit Jens Gladis (Dipl. Geodät, 2. vl) zum Leben erwecken.

Das Team wird in den neuen Räumlichkeiten der Kurt-Schumacher-Str. 2 begrüßt vom Vorstandsvorsitzenden Björn Schmidt (Mitte) und Aufsichtsrätin Özlem Doger-Herter (links).

Die ehrwürdigen Räume der Kurt-Schumacher-Str. 2 und ihre (politische) Geschichte

„Dieser Konferenzraum hatte eine Live-Schalte in den Bundestag“, berichtet der Vermieter Dr. Schönborn. „Hier saßen die großen Tages- und Wochenzeitungen“. Die Villa liegt am Ende der Straße des Posttowers, stellt aber den Beginn dar, direkt gegenüber vom Platz der Vereinten Nationen (UN-Gebäude) und dem alten Bundestag bzw. dem heutigen World-Conference-Center.

Nachdem Bonn 1949 Regierungssitz der Bundesrepublik Deutschland wurde, befand sich die Villa inmitten des neuen Parlaments- und Regierungsviertels, unmittelbar südlich des Bundeshauses. Das Erdgeschoss der Halbvilla Heussallee 40 wurde spätestens im Dezember 1951 vom Bund übernommen, der dieses nun von der Bundesbaudirektion in zwei Wohnungen aufzuteilen beabsichtigte. Die Halbvilla Kurt-Schumacher-Straße 2, deren Dachgeschoss ab 1951 erneut eine eigene Wohnung bildete, diente später als Sitz eines Pressebüros. Im April 1969 richtete in der Heussallee 40 die Mittelstands- und Wirtschaftsvereinigung der CDU/CSU ihre erste Bundesgeschäftsstelle ein und blieb dort bis zur Verlegung des Regierungssitzes nach Berlin (1999) ansässig. Das Dachgeschoss dieser Haushälfte wurde mindestens bis 1972 durch den Deutschen Bundestag zu Bürozwecken genutzt. Heute dient die Halbvilla Kurt-Schumacher-Str. 2 unter dem Namen House of Consulting als Sitz verschiedener Organisationen (Quelle: Kurt-Schumacher-Str. 2 / Heussallee 40 – Wikipedia)

Platz der Vereinten Nationen (360-Grad-Blick): Im Zentrum steht die Doppelhaus-Villa der Kurt-Schumacher-Str. 2 und Heussallee 40.


Dateninstitut dai mit klarer Ausrichtung und Wachstumsstrategie

Nicht zuletzt das in Kraft treten des EU Data Acts am 12. September 2025 zeigt die Notwendigkeit eine nachhaltige Datenökonomie in Europa und damit Deutschland zu etablieren. Das data analytics institute (dai) fungiert dabei als Intermediate zwischen Wirtschaft, Wissenschaft und Öffentlichem Sektor, um Politik und damit Gesellschaft den Zugriff auf relevante Nutzen zu ermöglichen. Verwirklicht wird das mit dem neuartigen und mehrdimensionalen Datenbankmodell TWIN sowie der Datenplattform daia-x.

Kontakt

presse@dai.institute

Gebäudedaten für die Energiewende

Neues Konsortium aus drei Spezialisten der Datenwirtschaft führt zur einzigartigen Datenbank für Gebäudedaten. Der Nutzen ist sektorübergreifend groß. So liegt nun beispielsweise der Energiewärmebedarf je Haushalt für über 23,3 Millionen Gebäude adressgenau vor. Denn der strategische Datenzusammenschluss erfolgt erstmals mit der Deutschen Post Direkt und ihrer postalisch hochaktuellen Gebäudebasisdatenbank microdialog, Spezialdaten für Energie von ENEKA sowie nicht zuletzt die damit kombinierten und disaggregierten Zensusdaten des data analytics instituts (dai).

Postalische Gebäudebasisdaten

Bereits seit vielen Jahren verlässt sich die Arbeitsgemeinschaft der Vermessungsverwaltungen (AdV) bei ihren deutschlandweiten, hochpräzisen 3D-Gebäudedaten auf die postalische Grundsubstanz und Kompetenz der Deutschen Post. Bisher ungenutzt blieben dabei sozi-ökonomische Daten der microdialog wie beispielsweise Haushalte und gewerbliche Informationen, die Aufschluss über Nutzung im Gebäude je Adresse liefern. Der Datenkatalog dazu ist über die dai ab sofort erhältlich.

Amtliche Gebäudebasisdaten

Aus den amtlichen 3D-Gebäudedaten in Kombination mit den Adressen lassen sich neben Lage und Gebäudeform hochpräsize Informationen ableiten wie z.B.

  • Gebäudegrundfläche
  • Gebäudevolumen
  • Gebäudehöhen nach Trauf und First
  • Gebäudegeschosse
  • Gebäudedachform
  • Gebäudefunktion
  • Gebäudeausrichtung
  • Gebäudedachfläche
  • Gebäudefassadenfläche

Energiedaten pro Gebäude

Durch die Kombination der amtlichen Gebäudedaten mit den weiterführenden sozio-ökonomischen Informationen lassen sich spezifische Energiedaten je postalischer Adresse berechnen wie beispielsweise der Raumwärmebedarf, der durch Bilanzierung von Kennwerten entsteht und zwar auf Basis der Gebäudespezifika, die sich typologisch durch die Auswertung von Gebäudetyp, -nutzung, Baujahr und Kubatur ergeben. Darauf ausgerichtet hat sich der Energiedatenspezialist ENEKA, neben Deutscher Post Direkt und dai der Dritte im Bunde.

Zensusdaten

Komplettiert wird die Erstversion der Datenbank durch die weitere Kombination mit den Zensusdaten 2022. So entsteht eine einzigartige Datenvielfalt aus Private & Public Data. Eines der wichtigsten Merkmale – ob für strategische Planungen oder operative Maßnahmen – ist die (geschätzte) Anzahl der Einwohner pro Gebäude. Das data analytics institute hat für diese Fragestellung das Projekt „INHABITAT“ mit der Wissenschaft aufgesetzt.

TWIN – Die Datenbank für die Datenwirtschaft

Die Gebäudedaten sind Bestandteil der (verteilten) Datenbank TWIN. Sie hat zum Ziel, ein möglichst reales, digitales Abbild von Mensch & Raum widerzugeben. Grundgedanke dabei ist, dass die (private & öffentliche) Datenwirtschaft ihre Datensilos bereitstellt und teilt, damit sie fragestellungsbezogen miteinander verknüpft werden können. Der Gedanke folgt der EU-weiten Datenstrategie, so die Datenökonomie zu fördern und zu stärken. Das data analytics institute versteht sich hier als Intermediate – so, dass die Datenbank fortlaufend wächst durch verschiedenste Datenquellen und deren Kombinationen untereinander.


TWIN.Building.Geo als Open Data Initiative

Wichtig zu wissen: Es gibt die amtlichen Geobasisdaten der Gebäude in 3D, dazu die Adressen mit postalischer Anschrift und Lage als Open Data aus einem Guss (vollständiger Datensatz der 16 Länder) an unserem Institut, den wir auf Anfrage gerne bereitstellen.

Kontakt

Sie interessieren sich für unseren Datenkatalog oder weiterführende Informationen? Dann kontaktieren Sie uns ganz einfach unter presse@dai.institute

Geoinformationen als Schlüsselressource für unsere Transformation

Geoinformationen als strategisches Gut verstehen: Positionspapier der Branche adressiert an die Politik, dass die brennenden gesellschaftlichen Themen wie Klimawandel und Energiewende nur datengetrieben gelöst werden können.

Zahlreiche Verbände der Geoinformationsbranche wie beispielsweise der Bund der Öffentlich bestellten Vermessungsingenieure e.V. (BDVI) oder die Deutsche Gesellschaft für Kartographie haben gemeinsam unter dem Deutschen Dachverband für Geoinformation, kurz DDGI ein Positionspapier für Geoinformationen zur 21. Legislaturperiode veröffentlicht. Es setzt konkrete Impulse für eine resiliente, digitale und nachhaltige Zukunft.

Die zentralen Forderungen:
✅ Geoinformation als strategisches Gut verstehen & verankern.
✅ Den Digitalen Zwilling unserer Welt auf Basis von Geodaten gesetzlich integrieren.
✅ Raumbezogene Daten für Klimaschutz & Energieplanung verpflichtend nutzen.
✅ Open Geodata durch Rechtsanspruch und Standardisierung ermöglichen.
✅ Bildung, Forschung und Fachkräfte gezielt fördern.

Der Vorstand und CEO des data analytics institute, Michael Herter, ist Beirat im DDGI und unterstützt ausdrücklich die gezielte Erfassung unserer Welt als Digitaler Zwilling. Er stellt die Basis für den strategischen Einsatz von Geodaten gemäß der EU-Datennutzung (EU Data Act).

Geoinformationsbranche will aktiv unterstützen

Die Herausforderungen unserer Zeit – digitale Transformation, geopolitische Unsicherheiten, Klimawandel, Energiewende – erfordern belastbare und raumbezogene
Entscheidungsgrundlagen. Das Positionspapier formuliert konkrete Forderungen an die neue Bundesregierung, um die Potenziale von Geoinformation gezielt für die nächste Legislaturperiode zu erschließen.

Die Geoinformationsbranche steht bereit, dafür ihre hohe Expertise aktiv einzubringen. Sie möchte damit eine moderne Verwaltung, nachhaltige Entwicklung und digitale Souveränität gewährleisten. Die Branche bietet konkrete, technologiegestützte Lösungen zur Bewältigung zentraler Zukunftsfragen. Die Verbände fordern die Bundesregierung auf, ihre strategische Rolle anzuerkennen, gezielt zu fördern und in die gesetzgeberischen, infrastrukturellen und digitalpolitischen Maßnahmen der Legislaturperiode zu integrieren.

„Schlimm genug, dass sie überhaupt aktiv angeboten werden muss“, ergänzt Herter, denn immerhin ist die politische Bedeutung von Daten bereits auf EU-Ebene seit 2014 klar verankert und sollte „für eine florierende datengesteuerte Wirtschaft“ auch umgesetzt werden. Nur passiert ist seitdem wenig.

Hier geht’s zum Positionspapier für Geoinformationen:
https://lnkd.in/e3GaEVmc

Kontakt

presse@dai.institute

Gewiss kein Grüner Schwan? Plädoyer für ein Datengütesiegel in Zeiten Künstlicher Intelligenz.

Grüner Schwan bezeichnet eine neue Klasse systemischer Risiken, vor allem aus dem Kontext des Klimawandels, die ebenso unvorhersehbar wie unumkehrbar sind und dabei die Stabilität von Wirtschaft und Gesellschaft tiefgreifend gefährden können. Er baut auf dem Begriff des „Schwarzen Schwans“ von Taleb auf, der in seinem gleichnamigen Buch damit seltene Ereignisse mit enormer Wirkung, wie etwa die Finanzkrise 2008 beschreibt. Seinen Namen verdankt das Konzept der historischen Annahme, alle Schwäne seien weiß – bis 1697 in Australien zum ersten Mal ein schwarzer Schwan tatsächlich beobachtet wurde. Grüne Schwäne hingegen existieren (nach wie vor) nicht.

Die Datenwirtschaft teilt seit vielen Jahren ihre Daten auf Lizenzbasis. Die Nutzer bezahlen für die Erstellung, Bereitstellung und Art der Datennutzung. Lizenz- und Preisstandards dazu gibt es nicht. Doch nicht nur das. Es fehlt dem Markt an Qualitätsorientierung. Nehmen wir das Beispiel der Vollständigkeit. So lange alle Objekte unserer Welt nicht vollständig in Raum und Zeit digital erfasst sind, fehlt es an der objektiven Referenz. Was gibt es alles und wieviel davon? Über die sogenannten „unknown unknowns“ wissen wir nichts. Das ist gewiss. Mit welchem Maß an Gewissheit können wir also sagen, dass der fehlende „Grüne Schwan“ in unseren Daten wirklich fehlt oder ein möglich enthaltener schwarze Schwan wirklich stimmt? Übertragen in die Praxis: Was stellt beispielsweise die Referenz dar, ob eine am Datenmarkt verfügbare Liste aller Kindergärten, Kitas und privater „Tagesmütter“ für eine Versorgungsanalyse in Deutschland wirklich Vollständigkeit ist? Sie gibt es nicht.

Durch die fortschreitende Datafication, wie man auch die Digitalisierung unserer Welt nennt, mehren sich fortlaufend die Echtdaten. Schätzungen und Hochrechnungen werden entsprechend weniger notwendig. Doch die Ungewissheit (Uncertainty) darüber, ob Grundgesamtheit bzw. Teilpopulation in einem bestimmten Gebiet zu einem bestimmten Zeitpunkt (Aktualität) vollständig abgebildet ist, bleibt. Dazu zählen auch Präzision der Datenerfassung (Exaktheit) und Schätzung (Vorhersagegüte) bei nicht vorhandenen Echtdaten.

Den Käufern sowie Nutzern von Daten fehlt ein verlässliches Maß an „Certainty“. Der Datenmarkt setzt Lizenzbedingungen und Preise fest, ohne ein Maß an Gewissheit zu liefern. Man schenkt lieber einer aufbereitenden Information, dem Outcome auf Daten, seinen Glauben und sinniert höchstens noch über die angewendete Analyse, als dass die Qualität der eingehenden Daten, das Income selbst hinterfragt wird. Ganz in der Hoffnung „no garbage in, no garbage out“. Ob aber der grüne Schwan einfach nur vergessen wurde zu erfassen oder gewiss keiner vorhanden ist, weiß man nicht. Was jedoch gewiss fehlt: Ein Datengütesiegel.

Datengütesiegel der dai

Das data analytics institute hat es sich zur Aufgabe gemacht, die CERTAINTY als Qualitätsmaß für Daten zu entwickeln. Kontaktieren Sie uns gerne, wenn Sie Fragen dazu haben oder Ihre Daten in ihrer Qualität in unserem Data Lab überprüfen lassen wollen.

Weiterführender Artikel zur Uncertainty & ML u.a. [2305.16703] Sources of Uncertainty in Supervised Machine Learning — A Statisticians‘ View

Erstes unabhängiges und interdisziplinäres Dateninstitut für Wirtschaft, Wissenschaft und Politik in Deutschland gegründet.

  • Evaluation, Qualifizierung und Entwicklung von Daten durch hochspezialisierte Data Scientisten in Kombination mit AI-gestützter Verfahren
  • Datenschutz- und lizenzrechtliche Fragestellungen, z.B. wem gehört ein Datum?

Bereits in der Gründungsphase startet das dai mit folgenden wegweisenden Forschungsprojekten:

  • Umsetzung einer datenspezifischen AI-Infrastruktur (DAII) für Organisationen
  • Thomas Losse-Müller, Vorsitzender des Aufsichtsrats, ist einer der führenden Politiker für Digitalisierung und Klimaneutralität. Er ist u.a. Direktor der Stiftung Klimaneutralität sowie des Sozial-Klimarats.
  • Jörn Bielfeldt, Gründungsgesellschafter und Geschäftsführer der Public Good GmbH, komplettiert das Team beratend.
Von links: Özlem Doger-Herter, Björn Schmidt, Göran Kauermann, Ursula Berger, Jörn Bielfeldt, Michael Herter