Von Public Data haben schon viele gehört. Als Lizenzmodell ist es immer noch eine Seltenheit. Das soll sich jetzt ändern. Mit Jahresende etabliert das Dateninstitut dai ein Format, dass Daten kostenlos, standardisiert und qualitätsgeprüft anbietet. Das nationale Adress- und Gebäuderegister ist hier erst der Anfang.
Das neue Lizenzmodell Public Data
Das Data Analytics Institute (dai) setzt von Beginn an, auf die Konsolidierung von Open, Private und Public Data Quellen. Das bedeutet, Daten werden aus verschiedenen Quellen bereinigt, zusammengeführt und vereinheitlicht. Entscheidend hierbei ist das Überführen in eine konsistente Datenstruktur, wozu das parallel dazu entwickelte Datenmodell TWIN eingesetzt wird. Nach eingehender Prüfung der Daten erhalten diese dann – wenn möglich – eine sogenannte Public Data Lizenz, unter der die Daten seitens dai für eine Servicepauschale Kunden bereitgestellt werden. Die Nutzungslizenz selber ist kostenlos und zeitlich unbefristet. Erstes und sehr gutes Fallbeispiel ist das nationale Adress- und Gebäudeverzeichnis. Das dazugehörige Lizenzmodell ist u.a. hier zu finden (als Teilkomponente des Open Geocoders).
2026 wird am Dateninstitut das Jahr der Public Data. Im Januar wird das Datenmodell erweitert um zahlreiche Gebäudemerkmale sowie infrastrukturelle Energiedaten. Dazu gehören u.a. die Energieträger wie Öl, Gas, Wärmepumpe und Fernwärme sowie Gas- und Stromnetze. Soviel darf gesagt sein: Besonderes Augenmerk wird auf die nationalen Standards für Kennziffern in der Energie- und Mobilitätswende gelegt.
Weihnachten und Jahreswechsel stehen an. Gerade rechtzeitig und wie ein Geschenk an alle: Der Open Geocoder (OGC) ist da, kostenlos und als Open Source. Die Software ist ab sofort auf GitHub verfügbar und ermöglicht gemeinsam an der Architektur zur Geocodierung von Adressen weiter zu arbeiten. Teil des offenen Systems ist auch das nationale Adress- und Gebäuderegister. Als Public Data versetzt es jede Organisation in die Lage, millionenfach Adressen DSGVO-konform zu validieren, lokalisieren und (räumlich) zu aggregieren.
OGC als Open Source auf GitHub verfügbar
GitHub ist ein webbasierter Dienst für Entwickler, um ihren Code online zu speichern, Code-Änderungen vorzunehmen, Codes zu kontrollieren und gemeinsam an Projekten zu arbeiten. So auch am Open Geocoder (OGC). Es ermöglicht eine Community zu bilden, um die bestehende Software stetig zu verbessern und sich darüber (z.B. Architektur, Installation) auszutauschen. Der OGC ist im Standard bereits voll funktionsfähig. Es gilt nur zu entscheiden, welche offenen Daten integriert und genutzt werden sollen.
Im Standard umfasst das Register mit 22,7 Mio. Einträgen jede postalische Adresse, das zugehörige Gebäude, die Hauskoordinate sowie die entsprechende Flurstücksinformation und die Siedlungsblock-ID. Das ist das Ergebnis nach wochenlanger Recherche und Datenmodellierung (TWIN). Das nationale Adress- und Gebäuderegister auf amtlicher Basis steht so nun zu den Festtagen zeitgleich als Public Data zur Verfügung. Durch die zusätzliche Integration von Lagen und Liegenschaften ermöglicht es nahezu beliebige Nutzungsmöglichkeiten, so dass sich das Verzeichnis als nationaler Standard präsentiert. Kostenlos und einfach in der Lizenzierung.
Hohe Adressqualität und amtliche Stadtteile inklusive – Dank starker Kooperationen mit Acxiom & panadress
Stadtteile sind in vielen Städten Deutschlands zwar vorhanden, jede Kommune unterteilt aber weder nach einem Standard noch sind die Gebiete deckungsgleich mit mit Fluren, Siedlungsblöcken oder Gemarkungen. Für fast 1.000 Städte liegen deren Stadtteilsgliederung im Datensatz mit vor. Ein riesisger Benefit, dank der Rechercheleistung durch Acxiom.
Genauso verhält es sich bei der Postleitzahl und den Gemeinden zu einem bestimmten Gebietsstand. Das nämlich gewährleisten nicht alle Bundesländer. panadress pflegt fortlaufend die PLZ-Gemeinde-Struktur zu einem bestimmten Zeitpunkt.
Beide führenden Adressdienstleister ermöglichen so einen Public Data Adressregister höchster Qualität. Das gab es noch nie in Deutschland und macht Feierlaune!
Kontakt
Sie möchten mehr erfahren über den Open Geocoder (OGC) und/oder das nationale Adress- und Gebäuderegister? Dann kontaktieren Sie unseren Director Data Products Sascha Jablonski sascha.jablonski@dai.institute
Die dai AG wünscht Frohes Fest und einen guten Rutsch ins Neue Jahr 2026!
Für alle, die Adressen präzise lokalisieren oder anonymisieren wollen, ist es wie Weihnachten: Deutschlands erster Open Geocoder erscheint noch im Dezember. Er beinhaltet alle rund 23 Mio. amtlichen Adressen mit allen verfügbaren Raumstrukturen als TWIN-Datenmodell. So können beliebige Nachbarschaften durch räumliche Aggregation gebildet werden. Der Open Geocoder ist Teil des Spatial Aggregation Framework for Data Privacy(SAFeDY).
Geschafft: Open Data aller Länder als Basis
Das data analytics institute (dai) arbeitet seit Wochen intensiv an einer Lösung, die Deutschland im Bereich der Nutzung von Geodaten und dem datenschutzkonformen Umgang mit Adressen einen deutlichen Push geben soll:
Eine Open Source Software, die auf Open Data zugreift.
Eine Lösung, die sich jede Institution kostenlos installieren kann und
die lokal und sicher im eigenen Netz Adressen so verarbeitet, dass
präzise Koordinaten ermittelt werden können und/oder
beliebig räumlich aggregiert werden können
zur Anonymisierung oder
zur Berechnung gebietsbezogener Kennziffern
Das alles beinhaltet der neue Open Geocoder. Grundlage und Datenbasis dafür bildet erstmals ein homogener, komplett auf Open Data der Länder basierender Datensatz.
Alle Adressen, alle Siedlungsblöcke, Flurstücke und Gemarkungen
Das Dateninstitut dai hat erstmals alle rund 23 Mio. Adressen aus unterschiedlichen Open Data Quellen der 16 Bundesländer zusammengetragen. Dazu gehören auch alle Siedlungsblöcke, die die wesentliche Planungsebene für die kommunale Wärmewende darstellen. Der Datensatz beinhaltet auch alle amtlichen Gemarkungen (Orts- und Stadtteile) und alle verfügbaren Flurstücke. Letztere allerdings ohne Bayern. Hier schert der Freistaat immer noch aus. Der Datensatz folgt dem TWIN-Datenmodell und ist ebenfalls offen.
Damit stellt der Open Geocoder einen wesentlichen Bestandteildes Spatial Aggregation Framework for Data Privacy(SAFeDY) dar. SAFeDY dient der räumlichen Aggregation von Daten unter Wahrung des Datenschutzes. Der Open Geocoder ist ein Werkzeug innerhalb dieses Frameworks, das Adressen, Koordinaten oder räumliche Referenzen datenschutzkonform verarbeiten lässt – in diesem Fall über Generalisierung oder Clustering. Oberstes Ziel ist: Präzise, aber nicht identifizierbare Geodatenverarbeitung – also die Balance zwischen räumlicher Genauigkeit und Privatsphäre.
Jetzt schon Version sichern!
Das Dateninstitut ist weiter im Aufbau und so gibt es viel zu tun. Die erste Version des Open Geocoders wird noch von uns mit begleitet. Danach steht die Lösung zum freien Download zur Verfügung. Ansprechpartner ist Herr Sascha Jablonski sascha.jablonski@dai.institute
Bonn, 30. Oktober 2025. Mit daia-x startet das data analytics institute (dai) eine Initiative, die das Denken über Datenräume in Deutschland grundlegend verändern soll. Aufbauend auf den Prinzipien der europäischen gaia-x-Initiative schafft daia-x eine vernetzte Dateninfrastruktur, die Datenquellen aus Wirtschaft, Wissenschaft und Verwaltung systematisch miteinander verbindet undsektorübergreifend zur Verfügung stellt.
Von gaia-x zu daia-x: Die Idee der europäischen Datenräume
gaia-x steht für die Vision eines europäischen Datenökosystems, das technologische Innovation mit digitaler Souveränität verbindet. Diese Vision wird nun inhaltlich umgesetzt. Hier setzt das Netzwerk daia-x an. Es stellt die praktische Brücke zwischen Infrastruktur und Anwendungfür sektorübergreifende Datenräume auf Basis eines einheitlichen Datenmodells (TWIN) dar.
daia-x schafft Strukturen, in denen Daten nicht zentralisiert, sondern qualitativ vernetzt werden. Es soll so den Herausforderungen unserer gesellschaftlichen Transformation wie beispielsweise der Energie- und Mobilitätswende evidenzbasiert begegnet werden.
Die neue Infrastruktur für vertrauenswürdige Datenräume in Deutschland
Im Zentrum von daia-x steht ein Netzwerk spezialisierter Dateninstitute und ihren Datenräumen, die unterschiedliche Lebens- und Wirtschaftsbereiche abbilden:
daia-W – Datenraum für Wohnen und Soziales Daten über Gebäude, Wohn- und Lebenssituationen insbesondere Energie und Gesundheit.
daia-A – Datenraum für Arbeit & Ökonomie Daten über Unternehmen, Arbeitsmarkt, Bildung und Beschäftigung.
daia-K – Datenraum für Kommunikation& Journalismus Geprüfte Daten für Journalismus, Diskurs und gesellschaftliche Teilhabe.
daia-S – Datenraum für Statistik & AI Methodische Brücke zur Wissenschaft, die die Standards für Qualität und Validität von Daten und Analysen definiert (TRUST).
Neues Forschungsdatenzentrum (FDZ) geplant
Im Rahmen der Initiative ist zudem geplant, ein Forschungsdatenzentrum (FDZ) zu etablieren. Ein FDZ ist eine wissenschaftliche Einrichtung, die den sicheren Zugang zu sensiblen, personen- oder unternehmensbezogenen Mikrodaten für Forschung und Politikberatung ermöglicht. Ziel ist es, hochwertige Datenbestände – z. B. aus amtlichen, wirtschaftlichen oder sozialwissenschaftlichen Quellen – unter klar definierten Datenschutz- und Qualitätsstandards bereitzustellen.
Bonn, 22.10.2025. In Kürze veröffentlicht das data analytics institute (dai) den ersten Open Geocoder zur freien Verwendung mit rund 23 Mio. adressgenauen Koordinaten für alle Bundesländer. Für alle? Nein, denn Bayern und Niedersachen scheren aus. Nur durch die Verknüpfung mit anderen öffentlichen und privaten Datenbanken findet sich eine Lösung. Das ist alles andere als im Sinne der europäischen Open Data Initiative. Frei sein, heißt scheinbar nicht auch „offen“ sein.
Open Geocoder erscheint noch in diesem Quartal
Der Open Geocoder wird in den nächsten Wochen als Open Source Software im GIT-Hub kostenlos zur Verfügung gestellt. Er nutzt das TWIN-Datenmodell, was die Anonymisierung von Adressen durch räumliche Aggregation (zB pro Siedlungsblock oder Ortsteil) ermöglicht. Damit ist der Open Geocoder wesentlicher Baustein des DSGVO-Frameworks SAFeDY.
Adressen und Hauskoordinaten als Open Data in Baden-Würtemberg (Quelle: Geoportal BaWü)
Adressbasis mit Koordinaten offen und modular integrierbar
Alle Bundesländer außer Bayern und Niedersachsen stellen ihre Verzeichnisse als Open Data zur Verfügung. Um eine bundesweite Lösung zu ermöglichen, muss man Brücken zu weiteren Public & Private Datenquellen schlagen, was der dai nun gelungen ist. Die Datenbasis ist somit modular aufgebaut. Der Bereitstellung von Software und Daten steht also nichts mehr im Wege: Geocodierung für alle – und damit auch Anonymisierung für alle! So die Devise des Dateninstituts dai.
SAFeDY als grundlegender Bestandteil von daia-x
Das DSGVO-konforme Framework SAFeDY wird beim Austausch von Daten auf der neuen Datenplattform daia-x eine grundlegende Rolle spielen. daia-x wird spezielle Datenräume für Wissenschaft, Wirtschaft, Journalismus und Politik bereitstellen.
Use Case Kommunale Wärmeplanung
Seit die Energiewende operativ durch die kommunale Wärmeplanung bei den Gemeinden und örtlichen Energieversorgern angekommen ist, gilt es (spätestens mit dem Wärmeplanungsgesetz) Daten untereinander auszutauschen, damit Strategie und Planung auf einer möglichst evidenten Datenbasis erfolgt. Der Open Geocoder stellt dazu ein effektives und kostenloses Basistool dar.
Bonn, 8. Oktober 2025. Die Anonymisierung personenbezogener Daten ist in der Datenverarbeitung eine grundlegende Aufgabe. Die räumliche Aggregation spielt dabei eine zentrale Rolle. Das data analytics institute (dai) arbeitet gerade an einem entsprechenden Framework (SAFeDY), dass Institutionen ein offenes Set an Werkzeugen zur Hand gibt, um Adressen DSGVO-konform anonymisieren zu können. Gerade beim Daten teilen zur Umsetzung einer effektiven Datenökonomie wie beispielsweise in der kommunalen Wärmeplanung soll das neue Framework SAFeDY Grundlage jeder anstehenden Verarbeitung von Adressen oder GPS-Daten werden.
SAFeDY – Spatial Aggregation Framework for Data Privacy – bietet ein Set an Tools zur Anonymisierung personenbezogener Daten durch räumliche Aggregation
Räumliche Aggregation zur Anonymisierung von Positionen wie Adressen oder GPS-Daten gehören zur grundlegenden Herausforderung in der Verarbeitung personenbezogener Daten. Das neue und offene Framework SAFeDY bietet Institutionen den dafür notwendigen Werkzeugkasten. Zum Framework zählt u.a.
Ein offenes, hierarchisches Mehrebenen-Raummodell, was Adressen und Standorte in beliebige Gebiete wie beispielsweise Wohnblöcke, Quartiere und Stadteile oder Kacheln (100x100m, 1x1km usw.) zusammenfassen lässt
Eine offene Geokodierung, die sich flexibel in jede Infrastruktur implementieren lässt und Adressen innerhalb einer Institution verarbeiten lässt, um die Raumebenen anreichern zu können
Die flexible, DSGVO-konforme Aggregation (und Darstellung) personenbezogener Daten in beliebige Gebiete
Open Geocoder – offene Geokodierung für Alle
Die Open Source & Data Initiativen machen es möglich. Das Dateninstitut dai plant noch im Laufe dieses Quartals und damit bis Ende des Jahres erstmals einen Open Geocoder auf den Markt zu bringen. Hauptelement der dazu notwendigen Referenzdaten sind die offenen Geodaten der einzelnen Bundesländer (u.a. die 3D-Gebäudedaten), die im Datenmodell TWIN am Institut zusammenfließen und harmonisiert werden. Die Softwareentwicklung und spätere Lizenz folgt dabei den Möglichkeiten von Open Source Richtlinien. Geokodierung ist somit erstmals für alle da (und weiterentwickelbar).
Kontakt
Sie haben Fragen zur räumlichen Aggregation oder zum Framework SAFeDY? Dann kontaktieren Sie uns unter presse@dai.institute
Bonn [11.04.2025] – Mit der Gründung des data analytics institute (dai) entsteht das erste unabhängige, interdisziplinäre Dateninstitut für Wirtschaft, Wissenschaft und Politik. Die Aktiengesellschaft mit Hauptsitz in Bonn und Niederlassungen in Berlin und Stuttgart setzt auf die innovative Kombination aus Data Science und Artificial Intelligence (AI), um datengetriebene Lösungen für gesellschaftsrelevante Fragestellungen zu entwickeln.
Daten als Mehrwert für unsere Gesellschaft
Die Pandemie hat deutlich gezeigt, wie wichtig Daten für ein objektives Verständnis aktueller und zukünftiger Herausforderungen sind. Nur qualitativ hochwertige, belastbare Daten fehlen oft. Nicht ohne Grund findet der Begriff Datenwüste Deutschland seinen Weg über Wissenschaft und Wirtschaft in die Medien. Das data analytics institute soll das als erstes unabhängiges und interdisziplinäre Dateninstitut ändern. Durch die gezielte Identifikation von Datenlücken, neuer Einsatzmöglichkeiten von AI und daraus resultierende datenwirtschaftsrechtliche Fragestellungen schafft die dai AG qualitatives Wissen, auf das man sich verlassen kann. So erst werden evidenzbasierte, richtige Entscheidungen in Wirtschaft und Politik möglich.
Das Dateninstitut und seine Ziele
Das data analytics institute versteht sich als unabhängiger Berater und Informationslieferant, um sektorübergreifend Institutionen beim strategischen Einsatz von Daten zu unterstützen.
Im Fokus dabei stehen:
Evaluation, Qualifizierung und Entwicklung von Daten durch hochspezialisierte Data Scientisten in Kombination mit AI-gestützter Verfahren
Datenschutz- und lizenzrechtliche Fragestellungen, z.B. wem gehört ein Datum?
Verknüpfung von Daten aus Quellen der Public, Private und Science Data als bestmöglichen „Digitalen Zwilling“ sowie die dazu notwendige Beratung und bedarfsgerechte Bereitstellung von Daten
Schließen von Datenlücken und Fördern von Datenwissen in Deutschland
Umsetzung einer datenspezifischen AI-Infrastruktur (DAII) für Organisationen
Entwicklung des agentenbasierten Data Scientist MAIK und einem neuen statistischen Vorhersagefaktor CERTAIN
Zum Gründungsteam
Die dai AG baut von Beginn an auf die Expertise führender Datenwissenschaftler Deutschlands. Gründer, Vorstand und Aufsichtsrat setzen sich aus einem einzigartigen, interdisziplinären Team zusammen
Björn Schmidt, CFO & Vorstandsvorsitzender ist Rechtsanwalt mit der Spezialisierung auf Datenschutz- und Datenwirtschaftsrecht, was u.a. auch das Urheber- und Lizenzrecht umfasst. Sein Wissen und Expertise beeinflusst seit Jahren die deutsche Datenlandschaft.
PD Dr. oec. publ. Ursula Berger, CSO, ist Biostatistikerin und Epidemiologin. Als Chief Science Officer ist sie im Vorstand zuständig für datenwissenschaftliche Forschungfragen – insbesondere für komplexe Datenmodelle im Bereich Health Care.
Michael Herter, CEO, übernimmt die operative Führung der dai AG und baut dabei auf mehr als zwei Jahrzehnte Erfahrung im Management und Marketing für Daten & Analysen.
Thomas Losse-Müller, Vorsitzender des Aufsichtsrats, ist einer der führenden Politiker für Digitalisierung und Klimaneutralität. Er ist u.a. Direktor der Stiftung Klimaneutralität sowie des Sozial-Klimarats.
Özlem Doger-Herter, Aufsichtsrätin, ist Gründungsgeschäftsführerin von ASK-A-WOMAN.COM und Vorständin der German Data Science Society sowie Ambassador für Women in Data Science der Stanford University mit dem Fokus „Diversity in Data Science“.
Prof. Dr. Göran Kauermann, Aufsichtsrat, ist Professor für Statistik an der LMU München, Vorstand der German Data Science Society (GDS) und Gründungsvorsitzender der Deutschen Arbeitsgemeinschaft für Statistik (DAGStat). Er ist ausgesprochener Fachexperte für statistische Methodik, u.a. in der Bestimmung von Uncertainty in AI-Modellen.
Jörn Bielfeldt, Gründungsgesellschafter und Geschäftsführer der Public Good GmbH, komplettiert das Team beratend.
Von links: Özlem Doger-Herter, Björn Schmidt, Göran Kauermann, Ursula Berger, Jörn Bielfeldt, Michael Herter
Pressekontakt
Für weitere Informationen steht Ihnen jederzeit Michael Herter (CEO) unter 0151 6767 6600 zur Verfügung.