data analytics institute https://dai.institute the aftermath of data Wed, 08 Apr 2026 12:29:03 +0000 en-US hourly 1 https://wordpress.org/?v=6.9.4 https://dai.institute/wp-content/uploads/2025/02/cropped-cropped-logo_erde-32x32.jpg data analytics institute https://dai.institute 32 32 Rechtlicher Rahmen zu Public & Open Data https://dai.institute/index.php/2026/04/08/public-data-und-open-data/ Wed, 08 Apr 2026 07:59:31 +0000 https://dai.institute/?p=2251 Bonn, 8. April 2026. Die Begriffe Public Data und Open Data werden häufig gleichgesetzt – doch sie beschreiben unterschiedliche Konzepte. Während Open Data für maximale Nutzungsfreiheit steht, geht es bei Public Data mehr um die gesellschaftliche Relevanz bei staatlicher Verantwortung (als Datenquelle) oftmals mit beschränktem Zugang und Einsatz. Dieser Unterschied ist nicht nur theoretisch, sondern hat konkrete Auswirkungen auf Nutzung, Geschäftsmodelle und Dateninfrastrukturen. Gerade in der Praxis zeigt sich, dass Offenheit nicht der Standard ist. Wer datenbasierte Anwendungen, Analysen oder Datenräume entwickeln will, muss verstehen: Nicht jede öffentliche Datenquelle ist automatisch frei nutzbar. Unser Vorstandsvorsitzende und Jurist Björn Schmidt zeigt den rechtlichen Rahmen dazu auf.

 

Public Data vs. Open Data – Entwicklung und rechtlicher Rahmen (EU & Deutschland)

Der heutige Unterschied beider Begrifflichkeiten ist das Ergebnis einer mehrjährigen rechtlichen und nutzerbasierten Entwicklung auf europäischer und nationaler Ebene. Ausgangspunkt war die Frage, wie Daten des öffentlichen Sektors (Public) nicht nur verwaltet, sondern aktiv und am besten frei verfügbar (Open) genutzt werden können.

Bereits 2003 legte die EU mit der PSI-Richtlinie (Public Sector Information) den Grundstein. Sie verfolgte das Ziel, die Weiterverwendung öffentlicher Daten zu erleichtern und wirtschaftliche Potenziale zu erschließen. Der Fokus lag zunächst auf der Nutzbarkeit vorhandener Daten, nicht auf deren vollständiger Offenheit. Mit der Open Data Richtlinie (EU 2019/1024), die die PSI-Richtlinie aus 2003 ersetzte, verschob sich der Schwerpunkt deutlich. Neben der Weiterverwendung wurde nun auch die aktive Bereitstellung offener Daten in den Mittelpunkt gestellt. Insbesondere wurden sogenannte „High Value Datasets“ definiert – Datensätze, die aufgrund ihres wirtschaftlichen und gesellschaftlichen Potenzials verpflichtend kostenfrei, maschinenlesbar und möglichst über APIs bereitgestellt werden sollen.

Deutschland setzte diese Richtlinie 2021 mit dem Datennutzungsgesetz (DNG) um. Dieses schafft den rechtlichen Rahmen für die Weiterverwendung öffentlicher Daten und konkretisiert die Anforderungen an deren Bereitstellung. Parallel dazu wurde das E-Government-Gesetz (EGovG) angepasst, um Open-Data-Prinzipien – insbesondere im Bund – stärker zu verankern. Doch die praktische Umsetzung erfolgte fragmentiert und unterschiedlich zwischen Bund und Ländern. Erst in jüngster Zeit zeigt sich ein operativer Durchbruch: Mit der Entscheidung der Vermessungsverwaltungen (AdV), Geobasisdaten ab 2024 bundesweit als Open Data bereitzustellen, wird deutlich, wie aus regulatorischen Vorgaben konkrete Open Data Strukturen entstehen. Da aber auch weiterhin große Public Data Bestände eben nicht frei, sondern unter strikteren Nutzungsbedingungen und Lizenz- und Aufwandsgebühren verfügbar sind, etablierten sich die Begrifflichkeiten Public Data und Open Data.

Die Bezeichnung Public Data beschreibt dabei mehr die Quelle (Amt) mit einer von mehreren unterschiedlichen Lizenzformen und Open Data nur die freie Nutzungsform und damit eine rechtliche Regelung bei offener Verfügbarkeit mit bewusster Freigabeentscheidung.

 

Was ist Open Data?

Open Data beschreibt ein Prinzip der freien Zugänglichkeit und Nutzung von Daten. Daten gelten als offen, wenn sie ohne Einschränkungen zugänglich sind, in maschinenlesbaren Formaten vorliegen und unter einer offenen Lizenz stehen, die Weiterverwendung, Veränderung und Verbreitung erlaubt. Entscheidend ist dabei: Nicht die Herkunft der Daten ist maßgeblich, sondern die Lizenz. Ein zentrales Beispiel ist die „Datenlizenz Deutschland – Zero 2.0“ (https://www.govdata.de/dl-de/zero-2-0). Diese erlaubt die uneingeschränkte Nutzung – auch kommerziell und ohne Namensnennung. Damit werden staatliche Daten erst durch die Lizenz zu Open Data. Weitere Beispiele sind OpenStreetMap oder offene APIs von Unternehmen, die Daten gezielt zur freien Nutzung bereitstellen. In all diesen Fällen gilt: Offenheit ist kein Zufall, sondern eine bewusste Entscheidung.

Open Data ist damit ein klar definierter Idealzustand: Daten sind vollständig frei nutzbar, ohne rechtliche, technische oder wirtschaftliche Hürden. In der Realität betrifft dies jedoch meist nur einen Teil der tatsächlich verfügbaren Datenbestände – insbesondere im öffentlichen Sektor.

 

Was ist Public Data?

Public Data bezeichnet Daten, die im öffentlichen Interesse stehen und typischerweise von staatlichen Institutionen erhoben oder bereitgestellt werden. Dazu zählen etwa Registerdaten, Geobasisdaten, Statistik- oder Umweltdaten. Im Gegensatz zu Open Data beschreibt Public Data nicht die Zugänglichkeit, sondern die gesellschaftliche Funktion und Herkunft der Daten. Ein zentrales Missverständnis ist, dass „öffentlich“ gleichbedeutend mit „frei“ sei. Tatsächlich sind viele Public Data bewusst reguliert. Ein Beispiel ist das Registerportal der Länder (https://www.handelsregister.de). Hier können Informationen zu Unternehmen und Organisationen eingesehen werden. Gleichzeitig gelten klare Einschränkungen: nur Einzelabfragen, keine systematischen Massenabrufe, Zugriffslimits und rechtliche Vorgaben. Die Daten sind öffentlich einsehbar – aber nicht frei nutzbar.

Ein weiteres Beispiel sind Geobasisdaten der Bayerischen Vermessungsverwaltung (https://www.ldbv.bayern.de/mam/ldbv/dateien/nutzungsbedingungen_daten.pdf). Diese Daten sind essenziell für Planung, Verwaltung und Wirtschaft. Ihre Nutzung ist jedoch lizenzbasiert, teilweise kostenpflichtig und unterscheidet klar zwischen interner und externer Nutzung. Externe Weitergabe ist stark eingeschränkt.

Public Data folgt damit nicht dem Prinzip der Offenheit, sondern der Zweckbindung. Die Daten sind öffentlich relevant, aber ihre Nutzung wird bewusst gesteuert – aus Gründen des Datenschutzes, der Qualitätssicherung und der Finanzierung staatlicher Dateninfrastrukturen.

 

Die Public Data Lizenz des Dateninstituts (dai)

Die Public Data Lizenz des data analytics institute (dai) positioniert sich zwischen Open Data und klassischem Public Data. Sie greift ein etabliertes Prinzip aus der öffentlichen Verwaltung auf: Die Nutzung von Daten ist frei, ihre Bereitstellung jedoch kostenpflichtig. Grundlage ist die dai-Lizenzvereinbarung: https://dai.institute/wp-content/uploads/2026/02/Lizenzvereinbarung_OGC_19122025-V1.pdf

Dieses Prinzip findet sich beispielsweise auch in den Gebührenmodellen der Vermessungsverwaltungen (AdV), etwa in den Bezugsbedingungen für Geodaten: https://www.adv-online.de/AdV-Produkte/Bezugsbedingungen/AdV-GR_4_0_1_f6f8a.pdf

Die dai-Lizenz orientiert sich an diesem Modell – ist jedoch deutlich einfacher und freier gestaltet. Sie reduziert komplexe Unterscheidungen (z. B. interne vs. externe Nutzung, verschiedene Gebührenarten) auf ein klares Prinzip: Zugang gegen Bereitstellungsgebühr, Nutzung weitgehend frei.

Der entscheidende Unterschied liegt in der ökonomischen Logik: Nicht die Nutzung wird bepreist, sondern die Bereitstellung eines nutzbaren Datenprodukts. Damit entsteht ein Modell, das sowohl wirtschaftlich tragfähig als auch praktisch nutzbar ist – und die Lücke zwischen Offenheit und Regulierung schließt.

 

Unterschied Public vs. Open Data – ein Fazit

Die Unterscheidung zwischen Open Data und Public Data ist mehr als semantisch – sie bestimmt, wie Daten tatsächlich genutzt werden können. Open Data steht für maximale Freiheit, ist jedoch in der Praxis oft nur für ausgewählte Datensätze realisierbar. Public Data hingegen bildet die Grundlage staatlicher Informationssysteme, ist aber häufig reguliert und eingeschränkt nutzbar. Die Beispiele machen das deutlich: GovData zeigt, wie Daten durch offene Lizenzen vollständig nutzbar werden (https://www.govdata.de/dl-de/zero-2-0). Das Registerportal zeigt, wie Public Data bewusst begrenzt zugänglich ist (https://www.handelsregister.de). Geodaten der Vermessungsverwaltungen zeigen, wie Nutzung über Lizenzen gesteuert wird (https://www.ldbv.bayern.de/mam/ldbv/dateien/nutzungsbedingungen_daten.pdf). Und die AdV verdeutlicht, dass Bereitstellungsgebühren ein etabliertes Modell sind (https://www.adv-online.de/AdV-Produkte/Bezugsbedingungen/AdV-GR_4_0_1_f6f8a.pdf). Die entscheidende Frage ist daher nicht, ob Daten offen sind, sondern ob sie nutzbar sind. Die Public Data Lizenz bietet hier einen pragmatischen Ansatz: Sie verbindet die gesellschaftliche Relevanz von Public Data mit einer hohen praktischen Nutzbarkeit, ohne vollständige Offenheit vorauszusetzen.

Die Zukunft entscheidet sich nicht an „open oder nicht open“, sondern an nutzbar oder nicht nutzbar.

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Zensusdaten disaggregiert für jede Adresse https://dai.institute/index.php/2026/04/01/zensusdaten/ Wed, 01 Apr 2026 10:03:23 +0000 https://dai.institute/?p=2231 Bonn, 1. April 2026. Alles andere als ein Aprilscherz: Die Zensusdaten 2022 werden durch die Kombination unterschiedlicher Datenquellen und Informationen auf Gebäude- und Adressebene durch das Dateninstitut disaggregiert und fortgeschrieben. Damit liegt ein riesiger amtlicher Datenfundus, von der Anzahl der Einwohner bis hin zum Energieträger des Hauses, als Public Data für rund 19,4 Mio. Wohngebäude vor. Das Bild zeigt ein KI-Gebäudemodell des Goldbergwegs 13 in 53177 Bonn generiert auf Basis eines Luftbildes. Echt dazu: Baujahr 2013 und Wärmepumpe-Technologie.

 

Ausgangsquelle: Zensusdaten im 100x100m Gitter 

Goldbergweg 13 in 53177 Muffendorf: Gebaut 2013 mit Wärmepumpe als Energeiträger

 

 

Die Zensusdaten disaggeriert für 19,4 Mio. Wohngebäude  

In einem mehrdimensionalen Schätzverfahren werden die 19,4 Mio. Adressen der Wohngebäude verschnitten mit den 100x100m Gitter und dann disaggregiert. Damit werden die Daten präziser und einfacher im Handling. Natürlich als Public Data. Es erfolgt nur eine Bereitstellungsgebühr wie auch beim Nationales Adress- und Gebäuderegister, was auch die Referenzbasis für die Zensusdaten darstellt. Nicht alle Merkmalsausprägungen lassen sich (u.a. aus Datenschutzgründen) je Adresse schätzen, werden aber mit dem Adress- und Gebäuderegister ausgeliefert: 

Anzahl Einwohner Adresse
Altersklassen Adresse
Ausländeranteil Rasterzelle
Familienstand Rasterzelle
Religion Rasterzelle
Staatsangehörigkeit Rasterzelle
Geburtsland Rasterzelle
Anzahl Haushalte Adresse
Durchschnittliche Haushaltsgröße Adresse
Haushaltstyp Rasterzelle
Haushalte mit Kindern Rasterzelle
Seniorenhaushalte Adresse
Nettokaltmiete Adresse
Wohnfläche Adresse
Leerstandsquote Adresse
Wohneinheiten Adresse
Wohnungen nach Gebäudetyp Wohnen Adresse
Wohnungen nach Raumanzahl Rasterzelle
Gebäude nach Gebäudetyp Wohnen Adresse
Gebäude nach Baujahresklassen Adresse
Gebäude nach Heizungsart Adresse
Gebäude nach Energieträger Adresse

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
TWIN Germany – alle Geobasisdaten in einem Public Data Paket https://dai.institute/index.php/2026/03/25/twin-germany/ Wed, 25 Mar 2026 15:41:41 +0000 https://dai.institute/?p=2210 Bonn, 25. März 2026. Unglaublich: TWIN Germany beinhaltet in der Basis über 55 Mio. Gebäude in 3D. Alle 23 Mio. Adressen mit exakter Lage und den Straßenverläufen. Rund 60 Mio. Flurstücke und 3 Mio. Siedlungsblöcke. Dazu noch über 60.000 Ortsteile in fast 11.000 Gemeinden. Alles in einem Datenpaket. In einem Datenmodell und mit einer Lizenz: Public Data. Nur eine Bereitstellungsgebühr, sonst kostenlos. Für beliebige Nutzer in einer Organisation, egal wie groß. Ein Meilenstein beim digitalen Zwilling.   

 

Die Geobasisdaten Deutschlands als Public Data

Die Public Data Licence (PDL) des data analytics institute (dai) regelt die Nutzung aller Geobasisdaten. Sie erlaubt eine kostenlose Nutzung gegen Bereitstellungspauschale, unterscheidet lediglich zwischen interner (PDL intern) und externer Nutzung (PDL extern). Intern dürfen Daten uneingeschränkt innerhalb der Organisation verwendet werden, jedoch nicht an Dritte weitergegeben oder für externe Dienstleistungen genutzt werden. Mit PDL extern ist auch die Nutzung für Dienstleistungen erlaubt, nicht jedoch die Weitergabe der Daten selbst. In beiden Fällen bleiben die Daten geschützt, es besteht keine Gewähr für Richtigkeit oder Vollständigkeit, und Verstöße führen zur sofortigen Beendigung der Lizenz. Die Bereitstellungspauschale für 

    • 55 Mio. 3D-Gebäude
    • 57 Mio. Flurstücke
    • 23 Mio. Adressen mit Koordinaten
    • Rund 3 Mio. Siedlungsblöcke
    • Alle Verkehrsflächen und Grünflächen
    • Alle rund 60.000 Gemarkungen bzw. Ortsteile
    • Alle rund 8.200 Postleitzahlen und 10.800 Gemeinden

 

liegt bei NUR 8.750 EUR, einmalig bei zeitlich unbegrenzter Nutzung.  

 

TWIN Building: Wichtige Gebäudedaten auf Wunsch direkt integriert  

Diese Geobasis- und Gebäudedaten stehen auch allen Nutzern des Geo Data Space Germany standardmäßig zur Verfügung

 

dai als Mitglied des Deutschen Dachverbands für Geoinformation (DDGI)

Die vom data analytics institute (dai) bereitgestellten Geobasis- und Gebäudedaten im TWIN-Modell schaffen erstmals eine einheitliche, standardisierte und deutschlandweit verfügbare Datenbasis. Für die Geoinformationsbranche sind sie entscheidend, da sie heterogene Datenquellen integrieren und interoperabel nutzbar machen. Dadurch entstehen konsistente Raumbezüge, die Analysen über Sektoren hinweg ermöglichen – etwa für Energie, Mobilität oder Stadtentwicklung. Insbesondere für datengetriebene Anwendungen wie digitale Zwillinge oder die Wärmewende bilden sie die notwendige Grundlage. Als Mitglied im Deutschen Dachverband für Geoinformation, kurz DDGI, trägt das dai damit aktiv zur Weiterentwicklung der Geodateninfrastruktur bei – ein Meilenstein für Skalierbarkeit, Vergleichbarkeit und Innovation in der gesamten Branche.

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Geo Data Space Germany – Basisdatenraum für Deutschlands Datenökonomie https://dai.institute/index.php/2026/03/06/geo-data-space-germany/ Fri, 06 Mar 2026 08:58:57 +0000 https://dai.institute/?p=2013 Bonn, 6. März 2026. Endlich – Deutschland wird digital! In Zusammenarbeit mit dem Fraunhofer ISST entsteht der Geo Data Space Germany. Ein Datenraum, der die Grundlage für die nationale Datenökonomie darstellt. Als räumlicher Datenzwilling (GeoTWIN) ist der Geo Data Space Germany das digitale Abbild unserer Welt. Damit haben alle Nutzer Zugriff auf sämtliche 3D-Gebäudedaten, Infrastrukturen, Liegenschaften und vieles vieles mehr. Alles aus einer Hand – alles Public Data! Möglich wird das, indem das data analytics institute (dai) als Datentreuhänder aller Open Data der 16 Bundesländer auftritt. Der Geo Data Space Germany ist DER Basisdatenraum, über den sich viele weitere sektorspezifische Datenräume erschließen lassen wie beispielsweise Wärmeplanung oder Katastrophenschutz.   

 

Der Geo Data Space Germany – Nationaler Geodatenraum mit TRUST-Qualität

Mit dem Forschungs- und Entwicklungsprojekt Geo Data Space Germany entsteht eine neue nationale Infrastruktur für Geobasisdaten in Deutschland. Aufbauend auf den im Projekt InGeoDTM entwickelten Grundlagen wird erstmals ein bundesweit harmonisierter, souveräner Geodatenraum geschaffen. Die Umsetzung erfolgt in enger Zusammenarbeit mit dem Fraunhofer ISST, das bereits im Vorprojekt zentrale Konzepte zur Datentreuhand und Datenraum-Governance erarbeitet hat. Der Geo Data Space Germany wird die systematische Zusammenführung und Harmonisierung sämtlicher verfügbarer Public- und Open-Geodaten der Bundesländer und Kommunen beinhalten. Dazu gehören insbesondere 3D-Gebäudedaten, Adress- und Straßendaten, Verwaltungsgrenzen sowie Flurstücks- und Katasterinformationen. Diese bislang föderal fragmentierten Datenbestände werden in einem einheitlichen Datenmodell zusammengeführt und als GeoTWIN bereitgestellt – einem deutschlandweiten digitalen Zwilling der Geobasisinfrastruktur. Eine zentrale Innovation des Datenraums ist die erstmalige technische Implementierung des TRUST-Siegels direkt in einem Datenraum-Connector. TRUST steht für Transparency, Reliability, Uncertainty, Spacetime und Traceability.

 

Alle amtlichen Geo- und Gebäudedaten aus einer Hand – alles Public Data!

Diese Geobasis- und Gebäudedaten stehen allen Nutzern des Geo Data Space Germany standardmäßig zur Verfügung

 

daia-x – Domänspezifisches Datenraumnetzwerk 

Datenräume sind interoperable, vertrauenswürdige Infrastrukturen, in denen unterschiedliche Akteure Daten souverän teilen und nutzen können. Sie verknüpfen verteilte Datensilos über gemeinsame Standards, Governance-Regeln und sichere Schnittstellen, ohne dass Daten ihre Herkunft verlieren. Zentrale Prinzipien sind Transparenz, Nachvollziehbarkeit, Interoperabilität und kontrollierter Zugriff.

Besonders relevant sind domänspezifische Datenräume, die auf die Anforderungen einzelner Sektoren zugeschnitten sind. In der Energiewirtschaft integrieren sie Erzeugungs-, Netz-, Verbrauchs- und Wetterdaten für bessere Prognosen und Netzsteuerung. Im Gesundheitswesen (Health) ermöglichen sie die sichere Verknüpfung von Versorgungs-, Forschungs- und Patientendaten. In der Mobilität verbinden sie Verkehrs-, Infrastruktur- und Sensordaten, um Planung, Steuerung und Nachhaltigkeit datenbasiert zu optimieren. Das Dateninstitut baut in Zusammenarbeit mit dem Fraunhofer ISST nun daia-x auf – im nächsten Schritt für Energie.

 

Das Dateninstitut dai als Data Trustee 

Ein Data Trustee (Datentreuhänder) ist eine unabhängige Vertrauensinstanz in Datenräumen. Er vermittelt zwischen Datengebenden und Datennutzenden und stellt sicher, dass Daten unter klaren Regeln, transparent und souverän genutzt werden können. Dabei koordiniert er Zugriffsrechte, Nutzungsbedingungen und technische Prozesse des Datenaustauschs. Im Kontext des Geo Data Space Germany übernimmt diese Rolle das dai: Als wissenschaftlich orientierte, neutrale Institution werden die Daten aus Verwaltung und Wirtschaft integriert, ihre Nutzung transparent gestaltet und Vertrauen zwischen den Beteiligten schaffen. Damit wird das dai zum zentralen Vertrauensanker eines offenen Geodatenraums und ermöglicht eine souveräne, interoperable Datenökonomie.

 

dai als Mitglied der International Data Spaces Association

Das data analytics institute (dai) ist der International Data Spaces Association (IDSA) beigetreten. Mit diesem Schritt stärkt das dai seine Rolle im Aufbau souveräner Datenräume in Deutschland und Europa. Ziel ist es, die Entwicklung von domänenspezifischen Datenräumen im Rahmen von daia-x aktiv voranzutreiben. Während der Geo Data Space Germany die räumliche Grundlage einer interoperablen Dateninfrastruktur bildet, geht es bei dai-x darum, darauf aufbauend fachliche Datenräume – etwa für Energie, Mobilität oder Stadtentwicklung – zu entwickeln und miteinander zu verbinden. Durch die internationale Zusammenarbeit innerhalb der IDSA möchte das dai diese Ansätze nicht nur national, sondern auch europaweit weiterentwickeln und damit einen Beitrag zur Stärkung der europäischen Datenökonomie leisten.

 

Von gaia-x zu daia-x

gaia-x ist eine europäische Initiative zum Aufbau einer offenen, sicheren und souveränen Dateninfrastruktur. Ziel ist es, Datenräume zu schaffen, in denen Unternehmen, Verwaltung und Forschung Daten interoperabel teilen können, ohne die Kontrolle über ihre Daten zu verlieren. gaia-x definiert dafür Prinzipien wie Transparenz, Datensouveränität, Interoperabilität und Vertrauen sowie eine entsprechende technische und organisatorische Architektur für Datenökosysteme.

daia-x setzt diese Prinzipien konkret um. Es versteht sich als praktische Datenraumarchitektur, in der domänenspezifische Datenräume aufgebaut und miteinander verbunden werden. Damit wird die Vision von gaia-x operationalisiert: Daten aus unterschiedlichen Bereichen können strukturiert integriert, sicher geteilt und für innovative Anwendungen in Wirtschaft, Verwaltung und Wissenschaft nutzbar gemacht werden.

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Willkommen Lisa! Willkommen Science & Public. https://dai.institute/index.php/2026/03/02/head-of-science-public/ Mon, 02 Mar 2026 13:24:18 +0000 https://dai.institute/?p=2001 Bonn, 2. März 2026. Mit dem Transfer von Dr. Lisa Zirbes zum Dateninstitut baut die data analytics institute AG ihr Consulting-Team weiter aus. Lisa ist nicht nur eine Fachexpertin für die Energiewende, sie war auch wesentlich beteiligt an dem Leuchtturmprojekt Daten teilen zur Gründung eines Bundesdateninstituts. Denn Daten für domänspezifische Datenräume sind ihr Metier – vor allem für Wissenschaft und Öffentliche Hand. Sie beginnt bei der dai am 1. April als Head of Science & Public. 

 

Lisas Werdegang

Dr. Lisa Zirbes arbeitete nach ihrem Master of Science in Wirtschaftsgeographie (2017-2019) als wissenschaftliche Mitarbeiterin an der Justus-Liebig-Universität in Giessen (2019-2023) im Verbundprojekt der BULE+ zu Hidden Champions als zentrales Element der Stabilisierung ländlicher Regionen in Zeiten der Digitalisierung. Sie schloss dies mit ihrer Promotion ab. 

Danach wechselte sie zur infas 360 als Consultant. Dort beriet, akquirierte und leitete sie sehr erfolgreich Projekte für die öffentliche Hand, einschließlich Kommunen, Hochschulen und Forschungseinrichtungen, mit Fokus auf die Bearbeitung datenwissenschaftlicher Kundenanfragen und wissenschaftlicher Projekte. Sie vertiefte dabei ihr Wissen in der Bereitstellung von Datenlösungen für kommunale und wissenschaftliche Anwendungen, Geodaten oder mikrogeographische Analysen. Damit entwickelte sie dann sukzessive den Produkt- und Geschäftsbereich für die “kommunale Wärmeplanung”.  

 

Domänspezifische Datenräume

Datenräume sind interoperable, vertrauenswürdige Infrastrukturen, in denen unterschiedliche Akteure Daten souverän teilen und nutzen können. Sie verknüpfen verteilte Datensilos über gemeinsame Standards, Governance-Regeln und sichere Schnittstellen, ohne dass Daten ihre Herkunft verlieren. Zentrale Prinzipien sind Transparenz, Nachvollziehbarkeit, Interoperabilität und kontrollierter Zugriff.

Besonders relevant sind domänspezifische Datenräume, die auf die Anforderungen einzelner Sektoren zugeschnitten sind. In der Energiewirtschaft integrieren sie Erzeugungs-, Netz-, Verbrauchs- und Wetterdaten für bessere Prognosen und Netzsteuerung. Im Gesundheitswesen (Health) ermöglichen sie die sichere Verknüpfung von Versorgungs-, Forschungs- und Patientendaten. In der Mobilität verbinden sie Verkehrs-, Infrastruktur- und Sensordaten, um Planung, Steuerung und Nachhaltigkeit datenbasiert zu optimieren. Das Dateninstitut baut in Zusammenarbeit mit dem Fraunhofer ISST nun daia-x auf.

 

Datenräume für die Hidden Champions

Ein Datenraum für Hidden Champions in Deutschland schafft eine sichere, souveräne Infrastruktur, in der mittelständische Weltmarktführer sektorspezifisch Daten miteinander teilen können. Ziel ist es, gemeinsam hochwertige Trainingsdaten für leistungsfähige KI-Modelle zu generieren, ohne Geschäftsgeheimnisse oder Wettbewerbsvorteile preiszugeben. Durch klare Governance, standardisierte Schnittstellen und kontrollierte Zugriffsrechte entsteht Vertrauen zwischen den Partnern. In Kooperation von dai und Fraunhofer IPA in Stuttgart wird dieser Datenraum technologisch, organisatorisch und rechtlich ausgestaltet. So bündeln Hidden Champions ihre Innovationskraft, verkürzen Entwicklungszyklen und steigern Effizienz. Der gemeinsame KI-Hebel stärkt ihre internationale Wettbewerbsfähigkeit gegenüber datengetriebenen Plattformökonomien aus den USA und China nachhaltig.

 

Keinen Newsletter verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Netze und Versorger erstmals als Public Data https://dai.institute/index.php/2026/02/24/netze-und-versorger/ Tue, 24 Feb 2026 08:32:39 +0000 https://dai.institute/?p=1972 Bonn, 24. Februar 2026. Die Bundesnetzagentur hat das data analytics institute (dai) damit beauftragt, die regionalen Versorgungsgebiete für Strom und Gas nach den jeweiligen Netzbetreibern als Public Data zu erstellen. Noch im ersten Quartal diesen Jahres soll es so weit sein. Dann stehen die beiden Datensätze erstmals auf Basis amtlicher Geobasisdaten zur Verfügung und werden vom Dateninstitut auch fortlaufend für Bund und Organisationen gepflegt.

 

Netze und Versorger für Strom und Gas

Der regionale Netzbetreiber ist das Energieunternehmen, das in einem bestimmten Netzgebiet die Haushalte und Gewerbe mit Strom (Niederspannungsebene) oder Gas beliefert. Er ist gesetzlich im Energiewirtschaftsgesetz (EnWG) geregelt. Der Netzbetreiber wird über einen Konzessionsvertrag mit der Kommune bestimmt. Wichtig ist: Der Netzbetreiber für Strom und/oder Gas können unterschiedlich sein, da sie jeweils getrennt für das Strom- und das Gasnetz ermittelt werden. Weiterhin sind im Energiesystem die Netze und Versorger klar voneinander zu unterscheiden. Das Netz bezeichnet die physische Infrastruktur – also Leitungen, Umspannwerke, Druckregelstationen oder Hausanschlüsse –, über die Strom oder Gas transportiert wird. Der Netzbetreiber ist für den sicheren Betrieb, die Wartung und den Ausbau dieser Infrastruktur verantwortlich.

Der Versorger hingegen ist das Unternehmen, das Energie einkauft oder erzeugt und an Endkunden weiterverkauft. Letztere können ihren Versorger frei wählen. Der Netzbetreiber im jeweiligen Gebiet bleibt dabei aber fest zuständig. Diese Trennung – auch „Unbundling“ genannt – sorgt für Wettbewerb im Vertrieb bei gleichzeitig regulierter Netzinfrastruktur.

 

Gasnetzbetreiber: Kooperation zwischen WGI und dai

Gemeinsam mit der WGI GmbH entwickelt und pflegt die dai ab sofort den Datensatz „Versorgungsgebiete der Gasnetzbetreiber in Deutschland“ als strukturierte Public Data. Die WGI hat sich u.a. auf die Erfassung und Bereitstellung der Gasnetzkarte für Deutschland spezialisiert. Ziel ist es, eine bundesweit einheitliche, digitale und regelmäßig aktualisierte Übersicht aller Gas-Versorgungsgebiete bereitzustellen – einschließlich der zuständigen Netzbetreiber und relevanter Versorgerinformationen.

Während die WGI über langjährige Expertise im Bereich energiewirtschaftlicher Geodaten und Netzinfrastruktur verfügt, bringt die dai ihre Kompetenz in Datenharmonisierung, Qualitätssicherung und Public-Data-Bereitstellung ein. Gemeinsam entsteht ein belastbarer Geodatensatz, der die geografischen Abgrenzungen der Gasnetzgebiete transparent darstellt und mit standardisierten Attributen versieht.

Der Datensatz dient als zentrale Referenz für Kommunen, Energieversorger, Forschungseinrichtungen und politische Entscheidungsträger. Durch die Bereitstellung als Public Data wird die Nutzung deutlich vereinfacht und die Transparenz im Energiemarkt gestärkt.

Mit dieser Kooperation leisten WGI und dai einen wichtigen Beitrag zur digitalen Infrastruktur Deutschlands und schaffen eine verlässliche Datengrundlage für Analysen, Planung und Energiewende.

 

Netze und Versorger als Teil der Public Data Strategie

Public Data ist für das data analytics institute (dai) ein strategischer Baustein moderner Dateninfrastruktur. Ziel ist es, öffentlich verfügbare Geodaten systematisch zu harmonisieren, qualitätszusichern und nachhaltig bereitzustellen. Grundlage bildet eine konsistente Geodatenbasis, die über das TWIN-Datenmodell strukturiert und semantisch vereinheitlicht wird. Dadurch werden föderal fragmentierte Datenbestände interoperabel und vergleichbar nutzbar. Public Data bedeutet dabei nicht nur offene Lizenzierung, sondern auch Transparenz, Nachvollziehbarkeit und standardisierte Metadaten. So entsteht eine belastbare Datenbasis für Kommunen, Wirtschaft und Wissenschaft – als Fundament für digitale Zwillinge, Energieplanung und datenbasierte Entscheidungsprozesse.

 

 

]]>
TRUST. Erstes Qualitätssiegel für den Datentausch. https://dai.institute/index.php/2026/02/18/trust-datensiegel/ Wed, 18 Feb 2026 08:26:13 +0000 https://dai.institute/?p=1876 Bonn, 18. Februar 2026. In einer datengetriebenen Gesellschaft entscheidet nicht allein die Verfügbarkeit von Daten über Fortschritt, sondern deren Vertrauenswürdigkeit. Genau hier setzt TRUST an – ein systematisches Qualitäts- und Governance-Modell für Datenräume, Datenprodukte und KI-Systeme. TRUST ist ein strukturierter Bewertungsrahmen zur Sicherstellung von Transparenz, Verlässlichkeit und methodischer Integrität.

 

Die fünf Prinzipien von TRUST

TRUST steht für fünf Prinzipien: Transparency, Reliability, Uncertainty, Spacetime und Traceability.

T-ransparency verlangt eine vollständige Offenlegung von Datenquellen, Modellen, Transformationen und Lizenzbedingungen. Nur wenn Datenherkunft und Verarbeitungslogik dokumentiert sind, können sie überprüft und eingeordnet werden.

R-eliability stammt direkt aus der wissenschaftlichen Methodik. Ergebnisse müssen unter gleichen Bedingungen wiederholbar sein. Modelle, Algorithmen und Ableitungsprozesse dürfen nicht nur funktionieren – sie müssen überprüfbar reproduzierbar sein.

U-ncertainty ist statistisch der zentrale Kern von TRUST. In der Statistik ist Unsicherheit kein Mangel, sondern ein fundamentales Strukturmerkmal jeder Messung und jedes Modells. Beobachtungsfehler, Stichprobenvariabilität, Modellannahmen, Interpolationen oder Prognosen erzeugen stets eine Verteilungsbreite möglicher Ergebnisse. Konzepte wie Standardabweichung, Konfidenzintervalle, Varianz, Fehlerfortpflanzung oder Modellunsicherheit beschreiben genau diese Bandbreite. Alternativ liegt kein Schätzmodell vor, sondern eine Angabe über die Realität.

S-pacetime macht Angaben über die räumliche und zeitliche Referenz und um welchen räumlich-zeitlichen Ausschnitt es sich handelt. Auch hier spielen Vollständigkeit & Genauigkeit eine Rolle. 

T-raceability verlangt eine lückenlose Dokumentation aller Verarbeitungsschritte. Nur so können Daten auditierbar und revisionssicher genutzt werden.

 

Warum ist TRUST beim Datenaustausch so wichtig?

Moderne Datenräume sind föderiert. Unterschiedliche Akteure tauschen Daten aus, ohne vollständige institutionelle Vertrauensbeziehungen. In solchen Systemen muss Vertrauen technisch erzeugt werden. TRUST transformiert Daten von bloßen Informationsobjekten zu qualitätsgesicherten Entscheidungsgrundlagen.

Insbesondere der statistisch fundierte Umgang mit Unsicherheit macht TRUST zu mehr als einem Governance-Konzept: Es wird zu einer epistemischen Infrastruktur. Wer Entscheidungen auf Daten stützt, muss nicht nur wissen, was der Wert ist – sondern auch, wie sicher dieser Wert ist. TRUST macht diese Sicherheit messbar.

 

Zusammenarbeit mit Fraunhofer ISST

Mit der Vorstudie zum geplanten Forschungs- und Entwicklungsprojekt Geo Data Space Germany entsteht eine neue nationale Infrastruktur für Geobasisdaten in Deutschland. Aufbauend auf den im Projekt InGeoDTM – Data trustee for horizontal geospatial data spaces entwickelten Grundlagen soll erstmals ein bundesweit harmonisierter, souveräner Geodatenraum geschaffen werden. Die Umsetzung erfolgt in enger Zusammenarbeit mit dem Fraunhofer ISST, das bereits im aktuellen Vorprojekt zentrale Konzepte zur Datentreuhand und Datenraum-Governance erarbeitet.

Zentrale Innovation des Projekts ist die erstmalige technische Implementierung des TRUST-Siegels direkt in einem Datenraum-Connector. TRUST steht für Transparency, Reliability (bzw. Reproducibility), Uncertainty, Spacetime und Traceability. Während viele Datenplattformen lediglich Daten bereitstellen, geht Geo Data Space Germany einen entscheidenden Schritt weiter: Der Connector wird um eine TRUST-Enforcement- und TRUST-Evidence-Schicht erweitert. Dadurch wird bei jeder Datenbereitstellung nicht nur der Datensatz selbst, sondern zusätzlich eine maschinenlesbare Güteaussage ausgegeben.

 

Terminhinweis

Abschlussveranstaltung des Förderprojekts “Datentreuhandmodell für horizontale Geodatenräume – InGeoDTM” mit Vortrag von CEO Michael Herter (dai) zum Thema Strategien für eine Verstetigung (Rollen, Organisationformen & Businessmodell). Mehr dazu unter Abschlussveranstaltung: Datentreuhandmodell für horizontale Geodatenräume – InGeoDTM – Fraunhofer IGD

 

 

]]>
Innovative Standortentwicklung: Neuer Datenzwilling für Brownfields https://dai.institute/index.php/2026/02/10/datatwin-brownfields/ Tue, 10 Feb 2026 11:22:54 +0000 https://dai.institute/?p=1757 Bonn, 10. Februar 2026. Der Datenzwilling für Brownfields dient der systematischen Analyse ehemals genutzter, heute untergenutzter oder brachliegender Gewerbe- und Industrieflächen. Er verknüpft adressgenaue Informationen zu Standorten, aktuellen und historischen Nutzungen, Infrastrukturen und Grundstücksinformationen. Als dai verfügen wir über nahezu alle relevanten Datenquellen, um Brownfields flächendeckend abzubilden und präzise zu identifizieren. 

Was sind Brownfields?

Als Brownfields bezeichnet man ehemals genutzte, heute untergenutzte oder brachliegende Gewerbe- und Industrieflächen. Sie sind als urbane Landreserven innerhalb bestehender Siedlungsstrukturen verortet. Sie entstehen überwiegend im Zuge wirtschaftlicher und funktionaler Transformationsprozesse, etwa durch Produktionsverlagerungen, Stilllegungen oder Nutzungsänderungen. Aus planerischer und analytischer Perspektive stellen Brownfields Flächen mit hoher struktureller Relevanz dar, da sie häufig über bestehende Erschließung, technische Infrastruktur und günstige Lagen verfügen. Gleichzeitig sind sie durch Unsicherheiten hinsichtlich Nutzungsgeschichte, Umweltbelastungen, Eigentumsverhältnissen und rechtlicher Rahmenbedingungen gekennzeichnet. Die Reaktivierung von Brownfields ist daher weniger eine rein bauliche Aufgabe als eine datengetriebene Bewertungs- und Entscheidungsaufgabe, die eine systematische Erfassung, Integration und Analyse heterogener Informationen voraussetzt.


Der Datenzwilling

Der Datenzwilling für Brownfields ist die systematische digitale Abbildung ehemals genutzter, heute untergenutzter oder brachliegender Gewerbe- und Industrieflächen. Er bildet Brownfields nicht nur als Flächenkulisse ab, sondern als raum-zeitliches Wirklichkeitsmodell: mit Standorten, Nutzungen, Akteuren, Infrastrukturen, Risiken und Entwicklungspfaden. Im Sinne des TWIN-Ansatzes entsteht damit ein datenbasierter Zwilling, der Planung, Bewertung und Aktivierung von Flächen nicht nur visualisiert, sondern analytisch fundiert und strategisch steuerbar macht.

Die zentrale Voraussetzung für einen solchen Datenzwilling ist der Zugriff auf möglichst vollständige, adressgenaue und interoperable Daten. Genau hier liegt ein entscheidender Vorteil: Als dai verfügen wir bereits heute über nahezu alle relevanten Datenquellen, um Brownfields flächendeckend und systematisch abzubilden. Das bedeutet: Wir kennen die aktuellen Gewerbestandorte und Unternehmensstrukturen adressgenau, einschließlich ihrer räumlichen Einbettung in Gewerbegebiete, Gebäude und Parzellen. Darüber hinaus können wir über historische Datenbestände auch inaktive Firmen, Stilllegungen und Standortverlagerungen rekonstruieren. Diese historische Tiefenschärfe ist zentral, um Brownfields nicht nur als Status quo, sondern als Ergebnis wirtschaftlicher und struktureller Transformation zu verstehen.

Ein TWIN-Datenzwilling für Brownfields integriert zudem detaillierte Informationen zur Flächennutzung – sowohl aktuell als auch historisch. Produktion, Lager, Logistik, Handel, Handwerk oder gemischte Nutzungsformen werden nicht nur kategorisiert, sondern in ihrer räumlichen Struktur und zeitlichen Dynamik erfasst. Damit entsteht eine belastbare Grundlage für Typisierungen, Priorisierungen und die Ableitung realistischer Nachnutzungsszenarien.

Eine weitere entscheidende Ebene betrifft die Infrastrukturen vor Ort. Der Brownfield-Zwilling bildet Verkehrserschließung, ÖPNV-Anbindung, technische Netze sowie digitale Infrastruktur ab. Dazu gehören insbesondere Daten zu Energieträgern und Energieinfrastrukturen: Stromnetzkapazitäten, Gasanschlüsse, Fern- oder Nahwärmepotenziale, erneuerbare Möglichkeiten (z. B. Photovoltaik oder Geothermie) sowie die Frage, ob eine Fläche energieintensive oder klimaneutrale Nachnutzungen überhaupt tragen kann. Ebenso zentral ist die Breitband- und Glasfaseranbindung, die zunehmend über die Zukunftsfähigkeit von Gewerbeflächen entscheidet – von moderner Industrie bis hin zu datengetriebenen Dienstleistungsclustern.


Umfassende Datenbasis über Standortfaktoren

Das Datennetzwerk dai-x liefert auf Basis des TWIN-Datenmodells nahezu beliebige Datenschichten je nach Fragestellung. Alle Adressen, auch historische, alle über 5 Millionen Gewerbestandorte nach Branchen, auch historische, mit allen rund 66 Mio. Flurstücken und deren Nutzungen sowie infrastrukturelle Erschließungen. dai identifiziert so datenbasiert zielsicher jedes potenzielle Brownfield und kann alle relevanten Standortfaktoren zu einem Standortprofil verdichten. Wir arbeiten fortlaufend an der Erweiterung der Datenvielfalt bis hin zur Schaffung eines Datenraums für Brachflächen.

]]>
Germany goes Public Data. Kostenlos & standardisiert. https://dai.institute/index.php/2025/12/29/public-data/ Mon, 29 Dec 2025 13:56:21 +0000 https://dai.institute/?p=1868 Bonn, 29. Dezember 2025. Von Public Data haben schon viele gehört. Als Lizenzmodell ist es immer noch eine Seltenheit – und das soll sich jetzt ändern. Mit Jahresende etabliert das Dateninstitut dai ein Format, dass Daten kostenlos, standardisiert und qualitätsgeprüft anbietet. Das nationale Adress- und Gebäuderegister ist hier erst der Anfang.

 

Das neue Lizenzmodell Public Data

Die Data Analytics Institute AG, kurz dai, setzt von Beginn an, auf die Zusammenführung und Homogenisierung von Open, Private und Public Data Quellen. Und das bedeutet, Daten werden aus verschiedenen Quellen bereinigt, zusammengeführt und vereinheitlicht. Entscheidend hierbei ist das Überführen in eine konsistente Datenstruktur, wozu das parallel dazu entwickelte Datenmodell TWIN eingesetzt wird. Nach eingehender Prüfung der Daten erhalten diese dann – wenn möglich – eine sogenannte Public Data Lizenz, unter der die Daten seitens dai für eine Servicepauschale Kunden bereitgestellt werden. Die Nutzungslizenz selber ist kostenlos und zeitlich unbefristet. Erstes und sehr gutes Fallbeispiel ist das nationale Adress- und Gebäudeverzeichnis. Das dazugehörige Lizenzmodell ist u.a. hier zu finden

Public Data Lizenzmodell Lizenzvereinbarung OGC

 

In Kürze viel mehr Public

2026 wird am Dateninstitut das Jahr der Public Data. Im Januar wird das Datenmodell erweitert um zahlreiche Gebäudemerkmale sowie infrastrukturelle Energiedaten. Dazu gehören u.a. die Energieträger wie Öl, Gas, Wärmepumpe und Fernwärme sowie Gas- und Stromnetze. Soviel darf gesagt sein: Besonderes Augenmerk wird auf die nationalen Standards für Kennziffern in der Energie- und Mobilitätswende gelegt.

]]>
Lasst uns feiern: Der Open Geocoder (OGC) ist da! https://dai.institute/index.php/2025/12/23/open-geocoder-ogc/ Tue, 23 Dec 2025 15:30:47 +0000 https://dai.institute/?p=1818 Bonn, 23.12.2025. Weihnachten und Jahreswechsel stehen an. Gerade rechtzeitig und wie ein Geschenk an alle: Der Open Geocoder (OGC) ist da, kostenlos und als Open Source. Die Software ist ab sofort auf GitHub verfügbar und ermöglicht gemeinsam an der Architektur zur Geocodierung von Adressen weiter zu arbeiten. Teil des offenen Systems ist auch das nationale Adress- und Gebäuderegister. Als Public Data versetzt es jede Organisation in die Lage, millionenfach Adressen DSGVO-konform zu validieren, lokalisieren und (räumlich) zu aggregieren.

 

OGC als Open Source auf GitHub verfügbar

GitHub ist ein webbasierter Dienst für Entwickler, um ihren Code online zu speichern, Code-Änderungen vorzunehmen, Codes zu kontrollieren und gemeinsam an Projekten zu arbeiten. So auch am Open Geocoder (OGC). Es ermöglicht eine Community zu bilden, um die bestehende Software stetig zu verbessern und sich darüber (z.B. Architektur, Installation) auszutauschen. Der OGC ist im Standard bereits voll funktionsfähig. Es gilt nur zu entscheiden, welche offenen Daten integriert und genutzt werden sollen.

Hier geht’s zum OGC auf GitHub https://github.com/data-analytics-institute-AG

Hier geht’s zu den Lizenzbedingungen Public Data (PDL)

Hier geht’s zum API-Test mit den Demodaten der Stadt Wedel (SH) https://opengeocoder.dai.institute/geocode?ort=Wedel&plz=22880&hnr=4&stn=Rathausplatz

“Wichtig zu wissen: Der Open Geocoder (OGC) kann komplett lokal installiert werden, so dass keine Adressen das Unternehmen verlassen.”

 

Offen und sofort integrierbar: Das nationale Adress- und Gebäuderegister

Gebäude mit Anschriften und Hauskoordinaten in Düsseldorf. Quelle: https://www.geoportal.nrw

Im Standard umfasst das Register mit 22,7 Mio. Einträgen jede postalische Adresse, das zugehörige Gebäude, die Hauskoordinate sowie die entsprechende Flurstücksinformation und die Siedlungsblock-ID. Das ist das Ergebnis nach wochenlanger Recherche und Datenmodellierung (TWIN). Das nationale Adress- und Gebäuderegister auf amtlicher Basis steht so nun zu den Festtagen zeitgleich als Public Data zur Verfügung. Durch die zusätzliche Integration von Lagen und Liegenschaften ermöglicht es nahezu beliebige Nutzungsmöglichkeiten, so dass sich das Verzeichnis als nationaler Standard präsentiert. Kostenlos und einfach in der Lizenzierung.

Hier geht’s zum Testdatensatz inkl. Datenstruktur der Stadt Wedel DAI_OGC_Wedel

 

Hohe Adressqualität und amtliche Stadtteile inklusive.

Dank starker Kooperationen mit Acxiom & panadress

Stadtteile sind in vielen Städten Deutschlands zwar vorhanden, jede Kommune unterteilt aber weder nach einem Standard noch sind die Gebiete deckungsgleich mit mit Fluren, Siedlungsblöcken oder Gemarkungen. Für fast 1.000 Städte liegen deren Stadtteilsgliederung im Datensatz mit vor. Ein riesisger Benefit, dank der Rechercheleistung durch Acxiom.

Genauso verhält es sich bei der Postleitzahl und den Gemeinden zu einem bestimmten Gebietsstand. Das nämlich gewährleisten nicht alle Bundesländer. panadress pflegt fortlaufend die PLZ-Gemeinde-Struktur zu einem bestimmten Zeitpunkt.

Beide führenden Adressdienstleister ermöglichen so einen Public Data Adressregister höchster Qualität. Das gab es noch nie in Deutschland und macht Feierlaune!

]]>