Data Science – data analytics institute https://dai.institute the aftermath of data Wed, 08 Apr 2026 12:29:03 +0000 en-US hourly 1 https://wordpress.org/?v=6.9.4 https://dai.institute/wp-content/uploads/2025/02/cropped-cropped-logo_erde-32x32.jpg Data Science – data analytics institute https://dai.institute 32 32 Rechtlicher Rahmen zu Public & Open Data https://dai.institute/index.php/2026/04/08/public-data-und-open-data/ Wed, 08 Apr 2026 07:59:31 +0000 https://dai.institute/?p=2251 Bonn, 8. April 2026. Die Begriffe Public Data und Open Data werden häufig gleichgesetzt – doch sie beschreiben unterschiedliche Konzepte. Während Open Data für maximale Nutzungsfreiheit steht, geht es bei Public Data mehr um die gesellschaftliche Relevanz bei staatlicher Verantwortung (als Datenquelle) oftmals mit beschränktem Zugang und Einsatz. Dieser Unterschied ist nicht nur theoretisch, sondern hat konkrete Auswirkungen auf Nutzung, Geschäftsmodelle und Dateninfrastrukturen. Gerade in der Praxis zeigt sich, dass Offenheit nicht der Standard ist. Wer datenbasierte Anwendungen, Analysen oder Datenräume entwickeln will, muss verstehen: Nicht jede öffentliche Datenquelle ist automatisch frei nutzbar. Unser Vorstandsvorsitzende und Jurist Björn Schmidt zeigt den rechtlichen Rahmen dazu auf.

 

Public Data vs. Open Data – Entwicklung und rechtlicher Rahmen (EU & Deutschland)

Der heutige Unterschied beider Begrifflichkeiten ist das Ergebnis einer mehrjährigen rechtlichen und nutzerbasierten Entwicklung auf europäischer und nationaler Ebene. Ausgangspunkt war die Frage, wie Daten des öffentlichen Sektors (Public) nicht nur verwaltet, sondern aktiv und am besten frei verfügbar (Open) genutzt werden können.

Bereits 2003 legte die EU mit der PSI-Richtlinie (Public Sector Information) den Grundstein. Sie verfolgte das Ziel, die Weiterverwendung öffentlicher Daten zu erleichtern und wirtschaftliche Potenziale zu erschließen. Der Fokus lag zunächst auf der Nutzbarkeit vorhandener Daten, nicht auf deren vollständiger Offenheit. Mit der Open Data Richtlinie (EU 2019/1024), die die PSI-Richtlinie aus 2003 ersetzte, verschob sich der Schwerpunkt deutlich. Neben der Weiterverwendung wurde nun auch die aktive Bereitstellung offener Daten in den Mittelpunkt gestellt. Insbesondere wurden sogenannte „High Value Datasets“ definiert – Datensätze, die aufgrund ihres wirtschaftlichen und gesellschaftlichen Potenzials verpflichtend kostenfrei, maschinenlesbar und möglichst über APIs bereitgestellt werden sollen.

Deutschland setzte diese Richtlinie 2021 mit dem Datennutzungsgesetz (DNG) um. Dieses schafft den rechtlichen Rahmen für die Weiterverwendung öffentlicher Daten und konkretisiert die Anforderungen an deren Bereitstellung. Parallel dazu wurde das E-Government-Gesetz (EGovG) angepasst, um Open-Data-Prinzipien – insbesondere im Bund – stärker zu verankern. Doch die praktische Umsetzung erfolgte fragmentiert und unterschiedlich zwischen Bund und Ländern. Erst in jüngster Zeit zeigt sich ein operativer Durchbruch: Mit der Entscheidung der Vermessungsverwaltungen (AdV), Geobasisdaten ab 2024 bundesweit als Open Data bereitzustellen, wird deutlich, wie aus regulatorischen Vorgaben konkrete Open Data Strukturen entstehen. Da aber auch weiterhin große Public Data Bestände eben nicht frei, sondern unter strikteren Nutzungsbedingungen und Lizenz- und Aufwandsgebühren verfügbar sind, etablierten sich die Begrifflichkeiten Public Data und Open Data.

Die Bezeichnung Public Data beschreibt dabei mehr die Quelle (Amt) mit einer von mehreren unterschiedlichen Lizenzformen und Open Data nur die freie Nutzungsform und damit eine rechtliche Regelung bei offener Verfügbarkeit mit bewusster Freigabeentscheidung.

 

Was ist Open Data?

Open Data beschreibt ein Prinzip der freien Zugänglichkeit und Nutzung von Daten. Daten gelten als offen, wenn sie ohne Einschränkungen zugänglich sind, in maschinenlesbaren Formaten vorliegen und unter einer offenen Lizenz stehen, die Weiterverwendung, Veränderung und Verbreitung erlaubt. Entscheidend ist dabei: Nicht die Herkunft der Daten ist maßgeblich, sondern die Lizenz. Ein zentrales Beispiel ist die „Datenlizenz Deutschland – Zero 2.0“ (https://www.govdata.de/dl-de/zero-2-0). Diese erlaubt die uneingeschränkte Nutzung – auch kommerziell und ohne Namensnennung. Damit werden staatliche Daten erst durch die Lizenz zu Open Data. Weitere Beispiele sind OpenStreetMap oder offene APIs von Unternehmen, die Daten gezielt zur freien Nutzung bereitstellen. In all diesen Fällen gilt: Offenheit ist kein Zufall, sondern eine bewusste Entscheidung.

Open Data ist damit ein klar definierter Idealzustand: Daten sind vollständig frei nutzbar, ohne rechtliche, technische oder wirtschaftliche Hürden. In der Realität betrifft dies jedoch meist nur einen Teil der tatsächlich verfügbaren Datenbestände – insbesondere im öffentlichen Sektor.

 

Was ist Public Data?

Public Data bezeichnet Daten, die im öffentlichen Interesse stehen und typischerweise von staatlichen Institutionen erhoben oder bereitgestellt werden. Dazu zählen etwa Registerdaten, Geobasisdaten, Statistik- oder Umweltdaten. Im Gegensatz zu Open Data beschreibt Public Data nicht die Zugänglichkeit, sondern die gesellschaftliche Funktion und Herkunft der Daten. Ein zentrales Missverständnis ist, dass „öffentlich“ gleichbedeutend mit „frei“ sei. Tatsächlich sind viele Public Data bewusst reguliert. Ein Beispiel ist das Registerportal der Länder (https://www.handelsregister.de). Hier können Informationen zu Unternehmen und Organisationen eingesehen werden. Gleichzeitig gelten klare Einschränkungen: nur Einzelabfragen, keine systematischen Massenabrufe, Zugriffslimits und rechtliche Vorgaben. Die Daten sind öffentlich einsehbar – aber nicht frei nutzbar.

Ein weiteres Beispiel sind Geobasisdaten der Bayerischen Vermessungsverwaltung (https://www.ldbv.bayern.de/mam/ldbv/dateien/nutzungsbedingungen_daten.pdf). Diese Daten sind essenziell für Planung, Verwaltung und Wirtschaft. Ihre Nutzung ist jedoch lizenzbasiert, teilweise kostenpflichtig und unterscheidet klar zwischen interner und externer Nutzung. Externe Weitergabe ist stark eingeschränkt.

Public Data folgt damit nicht dem Prinzip der Offenheit, sondern der Zweckbindung. Die Daten sind öffentlich relevant, aber ihre Nutzung wird bewusst gesteuert – aus Gründen des Datenschutzes, der Qualitätssicherung und der Finanzierung staatlicher Dateninfrastrukturen.

 

Die Public Data Lizenz des Dateninstituts (dai)

Die Public Data Lizenz des data analytics institute (dai) positioniert sich zwischen Open Data und klassischem Public Data. Sie greift ein etabliertes Prinzip aus der öffentlichen Verwaltung auf: Die Nutzung von Daten ist frei, ihre Bereitstellung jedoch kostenpflichtig. Grundlage ist die dai-Lizenzvereinbarung: https://dai.institute/wp-content/uploads/2026/02/Lizenzvereinbarung_OGC_19122025-V1.pdf

Dieses Prinzip findet sich beispielsweise auch in den Gebührenmodellen der Vermessungsverwaltungen (AdV), etwa in den Bezugsbedingungen für Geodaten: https://www.adv-online.de/AdV-Produkte/Bezugsbedingungen/AdV-GR_4_0_1_f6f8a.pdf

Die dai-Lizenz orientiert sich an diesem Modell – ist jedoch deutlich einfacher und freier gestaltet. Sie reduziert komplexe Unterscheidungen (z. B. interne vs. externe Nutzung, verschiedene Gebührenarten) auf ein klares Prinzip: Zugang gegen Bereitstellungsgebühr, Nutzung weitgehend frei.

Der entscheidende Unterschied liegt in der ökonomischen Logik: Nicht die Nutzung wird bepreist, sondern die Bereitstellung eines nutzbaren Datenprodukts. Damit entsteht ein Modell, das sowohl wirtschaftlich tragfähig als auch praktisch nutzbar ist – und die Lücke zwischen Offenheit und Regulierung schließt.

 

Unterschied Public vs. Open Data – ein Fazit

Die Unterscheidung zwischen Open Data und Public Data ist mehr als semantisch – sie bestimmt, wie Daten tatsächlich genutzt werden können. Open Data steht für maximale Freiheit, ist jedoch in der Praxis oft nur für ausgewählte Datensätze realisierbar. Public Data hingegen bildet die Grundlage staatlicher Informationssysteme, ist aber häufig reguliert und eingeschränkt nutzbar. Die Beispiele machen das deutlich: GovData zeigt, wie Daten durch offene Lizenzen vollständig nutzbar werden (https://www.govdata.de/dl-de/zero-2-0). Das Registerportal zeigt, wie Public Data bewusst begrenzt zugänglich ist (https://www.handelsregister.de). Geodaten der Vermessungsverwaltungen zeigen, wie Nutzung über Lizenzen gesteuert wird (https://www.ldbv.bayern.de/mam/ldbv/dateien/nutzungsbedingungen_daten.pdf). Und die AdV verdeutlicht, dass Bereitstellungsgebühren ein etabliertes Modell sind (https://www.adv-online.de/AdV-Produkte/Bezugsbedingungen/AdV-GR_4_0_1_f6f8a.pdf). Die entscheidende Frage ist daher nicht, ob Daten offen sind, sondern ob sie nutzbar sind. Die Public Data Lizenz bietet hier einen pragmatischen Ansatz: Sie verbindet die gesellschaftliche Relevanz von Public Data mit einer hohen praktischen Nutzbarkeit, ohne vollständige Offenheit vorauszusetzen.

Die Zukunft entscheidet sich nicht an „open oder nicht open“, sondern an nutzbar oder nicht nutzbar.

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Zensusdaten disaggregiert für jede Adresse https://dai.institute/index.php/2026/04/01/zensusdaten/ Wed, 01 Apr 2026 10:03:23 +0000 https://dai.institute/?p=2231 Bonn, 1. April 2026. Alles andere als ein Aprilscherz: Die Zensusdaten 2022 werden durch die Kombination unterschiedlicher Datenquellen und Informationen auf Gebäude- und Adressebene durch das Dateninstitut disaggregiert und fortgeschrieben. Damit liegt ein riesiger amtlicher Datenfundus, von der Anzahl der Einwohner bis hin zum Energieträger des Hauses, als Public Data für rund 19,4 Mio. Wohngebäude vor. Das Bild zeigt ein KI-Gebäudemodell des Goldbergwegs 13 in 53177 Bonn generiert auf Basis eines Luftbildes. Echt dazu: Baujahr 2013 und Wärmepumpe-Technologie.

 

Ausgangsquelle: Zensusdaten im 100x100m Gitter 

Goldbergweg 13 in 53177 Muffendorf: Gebaut 2013 mit Wärmepumpe als Energeiträger

 

 

Die Zensusdaten disaggeriert für 19,4 Mio. Wohngebäude  

In einem mehrdimensionalen Schätzverfahren werden die 19,4 Mio. Adressen der Wohngebäude verschnitten mit den 100x100m Gitter und dann disaggregiert. Damit werden die Daten präziser und einfacher im Handling. Natürlich als Public Data. Es erfolgt nur eine Bereitstellungsgebühr wie auch beim Nationales Adress- und Gebäuderegister, was auch die Referenzbasis für die Zensusdaten darstellt. Nicht alle Merkmalsausprägungen lassen sich (u.a. aus Datenschutzgründen) je Adresse schätzen, werden aber mit dem Adress- und Gebäuderegister ausgeliefert: 

Anzahl Einwohner Adresse
Altersklassen Adresse
Ausländeranteil Rasterzelle
Familienstand Rasterzelle
Religion Rasterzelle
Staatsangehörigkeit Rasterzelle
Geburtsland Rasterzelle
Anzahl Haushalte Adresse
Durchschnittliche Haushaltsgröße Adresse
Haushaltstyp Rasterzelle
Haushalte mit Kindern Rasterzelle
Seniorenhaushalte Adresse
Nettokaltmiete Adresse
Wohnfläche Adresse
Leerstandsquote Adresse
Wohneinheiten Adresse
Wohnungen nach Gebäudetyp Wohnen Adresse
Wohnungen nach Raumanzahl Rasterzelle
Gebäude nach Gebäudetyp Wohnen Adresse
Gebäude nach Baujahresklassen Adresse
Gebäude nach Heizungsart Adresse
Gebäude nach Energieträger Adresse

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Netze und Versorger erstmals als Public Data https://dai.institute/index.php/2026/02/24/netze-und-versorger/ Tue, 24 Feb 2026 08:32:39 +0000 https://dai.institute/?p=1972 Bonn, 24. Februar 2026. Die Bundesnetzagentur hat das data analytics institute (dai) damit beauftragt, die regionalen Versorgungsgebiete für Strom und Gas nach den jeweiligen Netzbetreibern als Public Data zu erstellen. Noch im ersten Quartal diesen Jahres soll es so weit sein. Dann stehen die beiden Datensätze erstmals auf Basis amtlicher Geobasisdaten zur Verfügung und werden vom Dateninstitut auch fortlaufend für Bund und Organisationen gepflegt.

 

Netze und Versorger für Strom und Gas

Der regionale Netzbetreiber ist das Energieunternehmen, das in einem bestimmten Netzgebiet die Haushalte und Gewerbe mit Strom (Niederspannungsebene) oder Gas beliefert. Er ist gesetzlich im Energiewirtschaftsgesetz (EnWG) geregelt. Der Netzbetreiber wird über einen Konzessionsvertrag mit der Kommune bestimmt. Wichtig ist: Der Netzbetreiber für Strom und/oder Gas können unterschiedlich sein, da sie jeweils getrennt für das Strom- und das Gasnetz ermittelt werden. Weiterhin sind im Energiesystem die Netze und Versorger klar voneinander zu unterscheiden. Das Netz bezeichnet die physische Infrastruktur – also Leitungen, Umspannwerke, Druckregelstationen oder Hausanschlüsse –, über die Strom oder Gas transportiert wird. Der Netzbetreiber ist für den sicheren Betrieb, die Wartung und den Ausbau dieser Infrastruktur verantwortlich.

Der Versorger hingegen ist das Unternehmen, das Energie einkauft oder erzeugt und an Endkunden weiterverkauft. Letztere können ihren Versorger frei wählen. Der Netzbetreiber im jeweiligen Gebiet bleibt dabei aber fest zuständig. Diese Trennung – auch „Unbundling“ genannt – sorgt für Wettbewerb im Vertrieb bei gleichzeitig regulierter Netzinfrastruktur.

 

Gasnetzbetreiber: Kooperation zwischen WGI und dai

Gemeinsam mit der WGI GmbH entwickelt und pflegt die dai ab sofort den Datensatz „Versorgungsgebiete der Gasnetzbetreiber in Deutschland“ als strukturierte Public Data. Die WGI hat sich u.a. auf die Erfassung und Bereitstellung der Gasnetzkarte für Deutschland spezialisiert. Ziel ist es, eine bundesweit einheitliche, digitale und regelmäßig aktualisierte Übersicht aller Gas-Versorgungsgebiete bereitzustellen – einschließlich der zuständigen Netzbetreiber und relevanter Versorgerinformationen.

Während die WGI über langjährige Expertise im Bereich energiewirtschaftlicher Geodaten und Netzinfrastruktur verfügt, bringt die dai ihre Kompetenz in Datenharmonisierung, Qualitätssicherung und Public-Data-Bereitstellung ein. Gemeinsam entsteht ein belastbarer Geodatensatz, der die geografischen Abgrenzungen der Gasnetzgebiete transparent darstellt und mit standardisierten Attributen versieht.

Der Datensatz dient als zentrale Referenz für Kommunen, Energieversorger, Forschungseinrichtungen und politische Entscheidungsträger. Durch die Bereitstellung als Public Data wird die Nutzung deutlich vereinfacht und die Transparenz im Energiemarkt gestärkt.

Mit dieser Kooperation leisten WGI und dai einen wichtigen Beitrag zur digitalen Infrastruktur Deutschlands und schaffen eine verlässliche Datengrundlage für Analysen, Planung und Energiewende.

 

Netze und Versorger als Teil der Public Data Strategie

Public Data ist für das data analytics institute (dai) ein strategischer Baustein moderner Dateninfrastruktur. Ziel ist es, öffentlich verfügbare Geodaten systematisch zu harmonisieren, qualitätszusichern und nachhaltig bereitzustellen. Grundlage bildet eine konsistente Geodatenbasis, die über das TWIN-Datenmodell strukturiert und semantisch vereinheitlicht wird. Dadurch werden föderal fragmentierte Datenbestände interoperabel und vergleichbar nutzbar. Public Data bedeutet dabei nicht nur offene Lizenzierung, sondern auch Transparenz, Nachvollziehbarkeit und standardisierte Metadaten. So entsteht eine belastbare Datenbasis für Kommunen, Wirtschaft und Wissenschaft – als Fundament für digitale Zwillinge, Energieplanung und datenbasierte Entscheidungsprozesse.

 

 

]]>
TRUST. Erstes Qualitätssiegel für den Datentausch. https://dai.institute/index.php/2026/02/18/trust-datensiegel/ Wed, 18 Feb 2026 08:26:13 +0000 https://dai.institute/?p=1876 Bonn, 18. Februar 2026. In einer datengetriebenen Gesellschaft entscheidet nicht allein die Verfügbarkeit von Daten über Fortschritt, sondern deren Vertrauenswürdigkeit. Genau hier setzt TRUST an – ein systematisches Qualitäts- und Governance-Modell für Datenräume, Datenprodukte und KI-Systeme. TRUST ist ein strukturierter Bewertungsrahmen zur Sicherstellung von Transparenz, Verlässlichkeit und methodischer Integrität.

 

Die fünf Prinzipien von TRUST

TRUST steht für fünf Prinzipien: Transparency, Reliability, Uncertainty, Spacetime und Traceability.

T-ransparency verlangt eine vollständige Offenlegung von Datenquellen, Modellen, Transformationen und Lizenzbedingungen. Nur wenn Datenherkunft und Verarbeitungslogik dokumentiert sind, können sie überprüft und eingeordnet werden.

R-eliability stammt direkt aus der wissenschaftlichen Methodik. Ergebnisse müssen unter gleichen Bedingungen wiederholbar sein. Modelle, Algorithmen und Ableitungsprozesse dürfen nicht nur funktionieren – sie müssen überprüfbar reproduzierbar sein.

U-ncertainty ist statistisch der zentrale Kern von TRUST. In der Statistik ist Unsicherheit kein Mangel, sondern ein fundamentales Strukturmerkmal jeder Messung und jedes Modells. Beobachtungsfehler, Stichprobenvariabilität, Modellannahmen, Interpolationen oder Prognosen erzeugen stets eine Verteilungsbreite möglicher Ergebnisse. Konzepte wie Standardabweichung, Konfidenzintervalle, Varianz, Fehlerfortpflanzung oder Modellunsicherheit beschreiben genau diese Bandbreite. Alternativ liegt kein Schätzmodell vor, sondern eine Angabe über die Realität.

S-pacetime macht Angaben über die räumliche und zeitliche Referenz und um welchen räumlich-zeitlichen Ausschnitt es sich handelt. Auch hier spielen Vollständigkeit & Genauigkeit eine Rolle. 

T-raceability verlangt eine lückenlose Dokumentation aller Verarbeitungsschritte. Nur so können Daten auditierbar und revisionssicher genutzt werden.

 

Warum ist TRUST beim Datenaustausch so wichtig?

Moderne Datenräume sind föderiert. Unterschiedliche Akteure tauschen Daten aus, ohne vollständige institutionelle Vertrauensbeziehungen. In solchen Systemen muss Vertrauen technisch erzeugt werden. TRUST transformiert Daten von bloßen Informationsobjekten zu qualitätsgesicherten Entscheidungsgrundlagen.

Insbesondere der statistisch fundierte Umgang mit Unsicherheit macht TRUST zu mehr als einem Governance-Konzept: Es wird zu einer epistemischen Infrastruktur. Wer Entscheidungen auf Daten stützt, muss nicht nur wissen, was der Wert ist – sondern auch, wie sicher dieser Wert ist. TRUST macht diese Sicherheit messbar.

 

Zusammenarbeit mit Fraunhofer ISST

Mit der Vorstudie zum geplanten Forschungs- und Entwicklungsprojekt Geo Data Space Germany entsteht eine neue nationale Infrastruktur für Geobasisdaten in Deutschland. Aufbauend auf den im Projekt InGeoDTM – Data trustee for horizontal geospatial data spaces entwickelten Grundlagen soll erstmals ein bundesweit harmonisierter, souveräner Geodatenraum geschaffen werden. Die Umsetzung erfolgt in enger Zusammenarbeit mit dem Fraunhofer ISST, das bereits im aktuellen Vorprojekt zentrale Konzepte zur Datentreuhand und Datenraum-Governance erarbeitet.

Zentrale Innovation des Projekts ist die erstmalige technische Implementierung des TRUST-Siegels direkt in einem Datenraum-Connector. TRUST steht für Transparency, Reliability (bzw. Reproducibility), Uncertainty, Spacetime und Traceability. Während viele Datenplattformen lediglich Daten bereitstellen, geht Geo Data Space Germany einen entscheidenden Schritt weiter: Der Connector wird um eine TRUST-Enforcement- und TRUST-Evidence-Schicht erweitert. Dadurch wird bei jeder Datenbereitstellung nicht nur der Datensatz selbst, sondern zusätzlich eine maschinenlesbare Güteaussage ausgegeben.

 

Terminhinweis

Abschlussveranstaltung des Förderprojekts “Datentreuhandmodell für horizontale Geodatenräume – InGeoDTM” mit Vortrag von CEO Michael Herter (dai) zum Thema Strategien für eine Verstetigung (Rollen, Organisationformen & Businessmodell). Mehr dazu unter Abschlussveranstaltung: Datentreuhandmodell für horizontale Geodatenräume – InGeoDTM – Fraunhofer IGD

 

 

]]>
Innovative Standortentwicklung: Neuer Datenzwilling für Brownfields https://dai.institute/index.php/2026/02/10/datatwin-brownfields/ Tue, 10 Feb 2026 11:22:54 +0000 https://dai.institute/?p=1757 Bonn, 10. Februar 2026. Der Datenzwilling für Brownfields dient der systematischen Analyse ehemals genutzter, heute untergenutzter oder brachliegender Gewerbe- und Industrieflächen. Er verknüpft adressgenaue Informationen zu Standorten, aktuellen und historischen Nutzungen, Infrastrukturen und Grundstücksinformationen. Als dai verfügen wir über nahezu alle relevanten Datenquellen, um Brownfields flächendeckend abzubilden und präzise zu identifizieren. 

Was sind Brownfields?

Als Brownfields bezeichnet man ehemals genutzte, heute untergenutzte oder brachliegende Gewerbe- und Industrieflächen. Sie sind als urbane Landreserven innerhalb bestehender Siedlungsstrukturen verortet. Sie entstehen überwiegend im Zuge wirtschaftlicher und funktionaler Transformationsprozesse, etwa durch Produktionsverlagerungen, Stilllegungen oder Nutzungsänderungen. Aus planerischer und analytischer Perspektive stellen Brownfields Flächen mit hoher struktureller Relevanz dar, da sie häufig über bestehende Erschließung, technische Infrastruktur und günstige Lagen verfügen. Gleichzeitig sind sie durch Unsicherheiten hinsichtlich Nutzungsgeschichte, Umweltbelastungen, Eigentumsverhältnissen und rechtlicher Rahmenbedingungen gekennzeichnet. Die Reaktivierung von Brownfields ist daher weniger eine rein bauliche Aufgabe als eine datengetriebene Bewertungs- und Entscheidungsaufgabe, die eine systematische Erfassung, Integration und Analyse heterogener Informationen voraussetzt.


Der Datenzwilling

Der Datenzwilling für Brownfields ist die systematische digitale Abbildung ehemals genutzter, heute untergenutzter oder brachliegender Gewerbe- und Industrieflächen. Er bildet Brownfields nicht nur als Flächenkulisse ab, sondern als raum-zeitliches Wirklichkeitsmodell: mit Standorten, Nutzungen, Akteuren, Infrastrukturen, Risiken und Entwicklungspfaden. Im Sinne des TWIN-Ansatzes entsteht damit ein datenbasierter Zwilling, der Planung, Bewertung und Aktivierung von Flächen nicht nur visualisiert, sondern analytisch fundiert und strategisch steuerbar macht.

Die zentrale Voraussetzung für einen solchen Datenzwilling ist der Zugriff auf möglichst vollständige, adressgenaue und interoperable Daten. Genau hier liegt ein entscheidender Vorteil: Als dai verfügen wir bereits heute über nahezu alle relevanten Datenquellen, um Brownfields flächendeckend und systematisch abzubilden. Das bedeutet: Wir kennen die aktuellen Gewerbestandorte und Unternehmensstrukturen adressgenau, einschließlich ihrer räumlichen Einbettung in Gewerbegebiete, Gebäude und Parzellen. Darüber hinaus können wir über historische Datenbestände auch inaktive Firmen, Stilllegungen und Standortverlagerungen rekonstruieren. Diese historische Tiefenschärfe ist zentral, um Brownfields nicht nur als Status quo, sondern als Ergebnis wirtschaftlicher und struktureller Transformation zu verstehen.

Ein TWIN-Datenzwilling für Brownfields integriert zudem detaillierte Informationen zur Flächennutzung – sowohl aktuell als auch historisch. Produktion, Lager, Logistik, Handel, Handwerk oder gemischte Nutzungsformen werden nicht nur kategorisiert, sondern in ihrer räumlichen Struktur und zeitlichen Dynamik erfasst. Damit entsteht eine belastbare Grundlage für Typisierungen, Priorisierungen und die Ableitung realistischer Nachnutzungsszenarien.

Eine weitere entscheidende Ebene betrifft die Infrastrukturen vor Ort. Der Brownfield-Zwilling bildet Verkehrserschließung, ÖPNV-Anbindung, technische Netze sowie digitale Infrastruktur ab. Dazu gehören insbesondere Daten zu Energieträgern und Energieinfrastrukturen: Stromnetzkapazitäten, Gasanschlüsse, Fern- oder Nahwärmepotenziale, erneuerbare Möglichkeiten (z. B. Photovoltaik oder Geothermie) sowie die Frage, ob eine Fläche energieintensive oder klimaneutrale Nachnutzungen überhaupt tragen kann. Ebenso zentral ist die Breitband- und Glasfaseranbindung, die zunehmend über die Zukunftsfähigkeit von Gewerbeflächen entscheidet – von moderner Industrie bis hin zu datengetriebenen Dienstleistungsclustern.


Umfassende Datenbasis über Standortfaktoren

Das Datennetzwerk dai-x liefert auf Basis des TWIN-Datenmodells nahezu beliebige Datenschichten je nach Fragestellung. Alle Adressen, auch historische, alle über 5 Millionen Gewerbestandorte nach Branchen, auch historische, mit allen rund 66 Mio. Flurstücken und deren Nutzungen sowie infrastrukturelle Erschließungen. dai identifiziert so datenbasiert zielsicher jedes potenzielle Brownfield und kann alle relevanten Standortfaktoren zu einem Standortprofil verdichten. Wir arbeiten fortlaufend an der Erweiterung der Datenvielfalt bis hin zur Schaffung eines Datenraums für Brachflächen.

]]>
Germany goes Public Data. Kostenlos & standardisiert. https://dai.institute/index.php/2025/12/29/public-data/ Mon, 29 Dec 2025 13:56:21 +0000 https://dai.institute/?p=1868 Bonn, 29. Dezember 2025. Von Public Data haben schon viele gehört. Als Lizenzmodell ist es immer noch eine Seltenheit – und das soll sich jetzt ändern. Mit Jahresende etabliert das Dateninstitut dai ein Format, dass Daten kostenlos, standardisiert und qualitätsgeprüft anbietet. Das nationale Adress- und Gebäuderegister ist hier erst der Anfang.

 

Das neue Lizenzmodell Public Data

Die Data Analytics Institute AG, kurz dai, setzt von Beginn an, auf die Zusammenführung und Homogenisierung von Open, Private und Public Data Quellen. Und das bedeutet, Daten werden aus verschiedenen Quellen bereinigt, zusammengeführt und vereinheitlicht. Entscheidend hierbei ist das Überführen in eine konsistente Datenstruktur, wozu das parallel dazu entwickelte Datenmodell TWIN eingesetzt wird. Nach eingehender Prüfung der Daten erhalten diese dann – wenn möglich – eine sogenannte Public Data Lizenz, unter der die Daten seitens dai für eine Servicepauschale Kunden bereitgestellt werden. Die Nutzungslizenz selber ist kostenlos und zeitlich unbefristet. Erstes und sehr gutes Fallbeispiel ist das nationale Adress- und Gebäudeverzeichnis. Das dazugehörige Lizenzmodell ist u.a. hier zu finden

Public Data Lizenzmodell Lizenzvereinbarung OGC

 

In Kürze viel mehr Public

2026 wird am Dateninstitut das Jahr der Public Data. Im Januar wird das Datenmodell erweitert um zahlreiche Gebäudemerkmale sowie infrastrukturelle Energiedaten. Dazu gehören u.a. die Energieträger wie Öl, Gas, Wärmepumpe und Fernwärme sowie Gas- und Stromnetze. Soviel darf gesagt sein: Besonderes Augenmerk wird auf die nationalen Standards für Kennziffern in der Energie- und Mobilitätswende gelegt.

]]>
Lasst uns feiern: Der Open Geocoder (OGC) ist da! https://dai.institute/index.php/2025/12/23/open-geocoder-ogc/ Tue, 23 Dec 2025 15:30:47 +0000 https://dai.institute/?p=1818 Bonn, 23.12.2025. Weihnachten und Jahreswechsel stehen an. Gerade rechtzeitig und wie ein Geschenk an alle: Der Open Geocoder (OGC) ist da, kostenlos und als Open Source. Die Software ist ab sofort auf GitHub verfügbar und ermöglicht gemeinsam an der Architektur zur Geocodierung von Adressen weiter zu arbeiten. Teil des offenen Systems ist auch das nationale Adress- und Gebäuderegister. Als Public Data versetzt es jede Organisation in die Lage, millionenfach Adressen DSGVO-konform zu validieren, lokalisieren und (räumlich) zu aggregieren.

 

OGC als Open Source auf GitHub verfügbar

GitHub ist ein webbasierter Dienst für Entwickler, um ihren Code online zu speichern, Code-Änderungen vorzunehmen, Codes zu kontrollieren und gemeinsam an Projekten zu arbeiten. So auch am Open Geocoder (OGC). Es ermöglicht eine Community zu bilden, um die bestehende Software stetig zu verbessern und sich darüber (z.B. Architektur, Installation) auszutauschen. Der OGC ist im Standard bereits voll funktionsfähig. Es gilt nur zu entscheiden, welche offenen Daten integriert und genutzt werden sollen.

Hier geht’s zum OGC auf GitHub https://github.com/data-analytics-institute-AG

Hier geht’s zu den Lizenzbedingungen Public Data (PDL)

Hier geht’s zum API-Test mit den Demodaten der Stadt Wedel (SH) https://opengeocoder.dai.institute/geocode?ort=Wedel&plz=22880&hnr=4&stn=Rathausplatz

“Wichtig zu wissen: Der Open Geocoder (OGC) kann komplett lokal installiert werden, so dass keine Adressen das Unternehmen verlassen.”

 

Offen und sofort integrierbar: Das nationale Adress- und Gebäuderegister

Gebäude mit Anschriften und Hauskoordinaten in Düsseldorf. Quelle: https://www.geoportal.nrw

Im Standard umfasst das Register mit 22,7 Mio. Einträgen jede postalische Adresse, das zugehörige Gebäude, die Hauskoordinate sowie die entsprechende Flurstücksinformation und die Siedlungsblock-ID. Das ist das Ergebnis nach wochenlanger Recherche und Datenmodellierung (TWIN). Das nationale Adress- und Gebäuderegister auf amtlicher Basis steht so nun zu den Festtagen zeitgleich als Public Data zur Verfügung. Durch die zusätzliche Integration von Lagen und Liegenschaften ermöglicht es nahezu beliebige Nutzungsmöglichkeiten, so dass sich das Verzeichnis als nationaler Standard präsentiert. Kostenlos und einfach in der Lizenzierung.

Hier geht’s zum Testdatensatz inkl. Datenstruktur der Stadt Wedel DAI_OGC_Wedel

 

Hohe Adressqualität und amtliche Stadtteile inklusive.

Dank starker Kooperationen mit Acxiom & panadress

Stadtteile sind in vielen Städten Deutschlands zwar vorhanden, jede Kommune unterteilt aber weder nach einem Standard noch sind die Gebiete deckungsgleich mit mit Fluren, Siedlungsblöcken oder Gemarkungen. Für fast 1.000 Städte liegen deren Stadtteilsgliederung im Datensatz mit vor. Ein riesisger Benefit, dank der Rechercheleistung durch Acxiom.

Genauso verhält es sich bei der Postleitzahl und den Gemeinden zu einem bestimmten Gebietsstand. Das nämlich gewährleisten nicht alle Bundesländer. panadress pflegt fortlaufend die PLZ-Gemeinde-Struktur zu einem bestimmten Zeitpunkt.

Beide führenden Adressdienstleister ermöglichen so einen Public Data Adressregister höchster Qualität. Das gab es noch nie in Deutschland und macht Feierlaune!

]]>
Endlich! Nationales Adress- und Gebäuderegister mit Lagen und Liegenschaften als Public Data https://dai.institute/index.php/2025/12/07/nationales-adress-und-gebauderegister/ Sun, 07 Dec 2025 15:18:06 +0000 https://dai.institute/?p=1814 Bonn, 07.12.2025. Nach wochenlanger Recherche und Datenmodellierung steht nun endlich das nationale Adress- und Gebäuderegister auf amtlicher Basis als Public Data zur Verfügung. Die zusätzliche Integration von Lagen und Liegenschaften ermöglicht nahezu beliebige Nutzungsmöglichkeiten, so dass sich das Verzeichnis als nationaler Standard präsentiert. Kostenlos und einfach in der Lizenzierung.

Nationales Adress- und Gebäuderegister mit Lagen und Liegenschaften

Alle amtlichen Adressen, 3D-Gebäude, Flurstücke und Siedlungsblöcke werden am Dateninstitut, dem data analytics institute, in einem aufwendigen Prozess zusammengetragen und in das TWIN-Datenmodell überführt.

Adressen und Gebäude mit Lage und Liegenschaften. Quelle: https://tlbg.thueringen.de

Die komplexen, unterschiedlichen Datenquellen liegen zusammengefasst als eine einfache, leicht zu handhabende Tabelle vor und können sowohl bebautes als auch unbebautes Land abbilden. Das nationale Adress- und Gebäuderegister hat dabei zwei Ausprägungen: Im Standard umfasst es jede postalische Adresse mit ihrem Gebäude, ihrer Hauskoordinate und der zugehörigen Flurstücksinformation. Das Datenmodell erlaubt es aber auch, das Register zu erweitern um alle Gebäude ohne Adressen (beispielsweise Nebengebäude) oder Flurstücke ohne Bebauung. So werden rund 23 Mio. Adress-, 55 Mio. Gebäude- und 65 Mio. Flurstücksinformationen in einem Gesamtregister gespeichert.

Endlich Public Data: Kostenlos und einfach lizenzierbar

Und damit das Adress- und Gebäuderegister zum nationalen Standardverzeichnis in nahezu jeder Organisation avanciert, ist eine einfache Lizenzierungsform zwingend. Aus diesem Grund wird das Register als Public Data deklariert, was in erster Linie kostenlos ist und nur einer geringfügigen Bereitstellungsgebühr unterliegt – vollkommen gleich ob für 23 Mio. Adressen oder für 55 Mio. Gebäude. Das hat es so noch nie gegeben.

Kontakt

Sie interessieren sich für das Nationale Adress- und Gebäudeverzeichnis? Dann kontaktieren Sie unseren Ansprechpartner sascha.jablonski@dai.institute. Bis Ende 2025 ist die Bereitstellungsgebühr noch besonders günstig!

 

 

]]>
Neue Wohnlage für München https://dai.institute/index.php/2025/12/03/wohnlage/ Wed, 03 Dec 2025 15:52:02 +0000 https://dai.institute/?p=627 Bonn, 03.12.2025. Im Auftrag von Kantar und der Stadt München erstellt das data analytics institute (dai) die Wohnlage neu. Die Herausforderung seit der Mietspiegelreform 2022 ist die adressgenaue Ermittlung eines Werts, der auf Basis objektiver Lageparameter statistisch nachvollziehbar ist. Bisher war die Wohnlage in den Städten Deutschlands geprägt von subjektiven und preisorientierten Bewertungen der Gutachterschüsse.

 

 

Bedeutung der Wohnlage seit der Mietspiegelreform 2022

Die Reform trat am 1. Juli 2022 in Kraft mit den klaren Zielen:

  • mehr Rechtsklarheit,
  • bundesweit einheitliche Standards,
  • mehr statistische Qualität,
  • höhere Transparenz und Nachvollziehbarkeit der Mietspiegel.

Dabei wird für die Erstellung der Wohnlage (§ 19 MsV) neben einer Dokumentationspflicht eine sachgerechte Untergliederung (z. B. „einfach, mittel, gut“) mit einer räumlichen Verortung (Karte oder Verzeichnis) durch klare Kriterien gefordert, wie etwa:

  • Infrastruktur,
  • Nahversorgung,
  • Verkehrsanbindung,
  • Grünraum,
  • Bebauungsdichte.

Lage, Lage, Wohnlage

Eine gute Wohnlage wirkt sich positiv auf den durchschnittlichen Mietpreis aus, eine schlechte negativ. So die Annahme. Damit Auswirkung und Höhe statistisch nachvollziehbar ermittelt werden können, muss die Lage eine unabhängige Größe vom Mietpreis selbst sein, beispielsweise die Nähe zu einer Kirche, Lärmbelastung usw.

Die Lage kann sich so bereits in einem Wohnblock unterscheiden, wenn eine Blockseite zu einem Gewässer oder einer Hauptverkehrsstraße ausgerichtet ist. Je nach Lage treffen auch schon andere Kriterien beim direkten Nachbarn auf. Das Maß der Dinge ist demnach die adressgenaue Berechnung einer Wohnlage, die dann in Klassen kategorisiert wird. Alles auf Basis von Public (Geo) Data.

Kontakt

Wir erstellen auf Wunsch für jede Stadt eine neue Wohnlagenkarte – adressgenau und statistisch nachvollziehbar. Ideales Tool zur späteren Abfrage auch hier: Der Open Geocoder! Fragen Sie unverbindlich an sascha.jablonski@dai.institute

 

 

]]>
Gasnetz nach Straßen und Versorger https://dai.institute/index.php/2025/11/27/gasnetz/ Thu, 27 Nov 2025 12:57:19 +0000 https://dai.institute/?p=600 Bonn, 28. November 2025. Wird in der Straße Gas genutzt, ja oder nein? Diese Art von Anfragen zum Gasnetz häufen sich am data analytics institute (dai). Zumal es für die zukünftigen Wärmepumpengebiete zunehmend überflüssiger wird. Und damit das nun jeder für sich selbst beantworten kann, stellt das dai auf Wunsch das Gasnetz je Straße mit zuständigem Grundversorger zur Verfügung – regional oder bundesweit.

Gasnetz: Jeder zweite Haushalt in Deutschland nutzt Gas

Laut Statistischem Bundesamt nutzen 2022 rund 50% aller deutschen Haushalte Gas (siehe auch Energieart der Beheizung). Die Daten beruhen auf der Zensus-Erhebung. Das data analytics institute hat diese mit dem Straßenverzeichnis – gebildet aus den Open Data Quellen der Länder – verknüpft. So entsteht ein bundesweit detailliertes Bild angeschlossener Gebäude ans Gasnetz.

Zensus 2022: Auswertung zum Energieträger. Quelle: Zensusatlas

Im Zuge der Energiewende gehen immer mehr Wärmepumpen ans Stromnetz. Das Gasnetz wird zunehmend überflüssig.

Wer ist der Grundversorger?

Aber nicht nur, in welcher Straße Gas genutzt wird, steht als flächendeckendes Verzeichnis zur Verfügung. Auch welcher Grundversorger dafür zuständig ist, kann miteinander kombiniert werden. Ein Grundversorger ist nach § 36 Energiewirtschaftsgesetz (EnWG) das Energieversorgungsunternehmen, das in einem bestimmten Netzgebiet die meisten Haushaltskund:innen mit Strom oder Gas beliefert. Der Grundversorger wird alle drei Jahre vom jeweiligen Netzbetreiber ermittelt und öffentlich bekannt gegeben.

Open Geocoder weist jede Adresse eindeutig dem richtigen Straßenabschnitt zu

Der Open Geocoder prüft jede eingehende Adresse und weist ihr alle verfügbaren räumliche Ebenen zu, darunter das Flurstück, der Siedlungsblock und die Gemarkung. Damit verbunden den entsprechenden Straßenabschnitt, der den Nukleus aus amtlicher und postalischer Struktur darstellt.

Beispieladresse: 53173, Kronprinzenstr. 32 in Bonn <> Gas | SWB Energie- und Wasserversorgung Bonn.

Kontakt

Sie haben Fragen zum Gasnetz oder den Versorgern? Oder möchten wissen, wo Wärmepumpen heute oder zukünftig zum Einsatz kommen werden? Dann kontaktieren Sie unseren Ansprechpartner mailto: Sascha.Jablonski@dai.institute

 

]]>