Data Legal – data analytics institute https://dai.institute the aftermath of data Wed, 08 Apr 2026 12:29:03 +0000 en-US hourly 1 https://wordpress.org/?v=6.9.4 https://dai.institute/wp-content/uploads/2025/02/cropped-cropped-logo_erde-32x32.jpg Data Legal – data analytics institute https://dai.institute 32 32 Rechtlicher Rahmen zu Public & Open Data https://dai.institute/index.php/2026/04/08/public-data-und-open-data/ Wed, 08 Apr 2026 07:59:31 +0000 https://dai.institute/?p=2251 Bonn, 8. April 2026. Die Begriffe Public Data und Open Data werden häufig gleichgesetzt – doch sie beschreiben unterschiedliche Konzepte. Während Open Data für maximale Nutzungsfreiheit steht, geht es bei Public Data mehr um die gesellschaftliche Relevanz bei staatlicher Verantwortung (als Datenquelle) oftmals mit beschränktem Zugang und Einsatz. Dieser Unterschied ist nicht nur theoretisch, sondern hat konkrete Auswirkungen auf Nutzung, Geschäftsmodelle und Dateninfrastrukturen. Gerade in der Praxis zeigt sich, dass Offenheit nicht der Standard ist. Wer datenbasierte Anwendungen, Analysen oder Datenräume entwickeln will, muss verstehen: Nicht jede öffentliche Datenquelle ist automatisch frei nutzbar. Unser Vorstandsvorsitzende und Jurist Björn Schmidt zeigt den rechtlichen Rahmen dazu auf.

 

Public Data vs. Open Data – Entwicklung und rechtlicher Rahmen (EU & Deutschland)

Der heutige Unterschied beider Begrifflichkeiten ist das Ergebnis einer mehrjährigen rechtlichen und nutzerbasierten Entwicklung auf europäischer und nationaler Ebene. Ausgangspunkt war die Frage, wie Daten des öffentlichen Sektors (Public) nicht nur verwaltet, sondern aktiv und am besten frei verfügbar (Open) genutzt werden können.

Bereits 2003 legte die EU mit der PSI-Richtlinie (Public Sector Information) den Grundstein. Sie verfolgte das Ziel, die Weiterverwendung öffentlicher Daten zu erleichtern und wirtschaftliche Potenziale zu erschließen. Der Fokus lag zunächst auf der Nutzbarkeit vorhandener Daten, nicht auf deren vollständiger Offenheit. Mit der Open Data Richtlinie (EU 2019/1024), die die PSI-Richtlinie aus 2003 ersetzte, verschob sich der Schwerpunkt deutlich. Neben der Weiterverwendung wurde nun auch die aktive Bereitstellung offener Daten in den Mittelpunkt gestellt. Insbesondere wurden sogenannte „High Value Datasets“ definiert – Datensätze, die aufgrund ihres wirtschaftlichen und gesellschaftlichen Potenzials verpflichtend kostenfrei, maschinenlesbar und möglichst über APIs bereitgestellt werden sollen.

Deutschland setzte diese Richtlinie 2021 mit dem Datennutzungsgesetz (DNG) um. Dieses schafft den rechtlichen Rahmen für die Weiterverwendung öffentlicher Daten und konkretisiert die Anforderungen an deren Bereitstellung. Parallel dazu wurde das E-Government-Gesetz (EGovG) angepasst, um Open-Data-Prinzipien – insbesondere im Bund – stärker zu verankern. Doch die praktische Umsetzung erfolgte fragmentiert und unterschiedlich zwischen Bund und Ländern. Erst in jüngster Zeit zeigt sich ein operativer Durchbruch: Mit der Entscheidung der Vermessungsverwaltungen (AdV), Geobasisdaten ab 2024 bundesweit als Open Data bereitzustellen, wird deutlich, wie aus regulatorischen Vorgaben konkrete Open Data Strukturen entstehen. Da aber auch weiterhin große Public Data Bestände eben nicht frei, sondern unter strikteren Nutzungsbedingungen und Lizenz- und Aufwandsgebühren verfügbar sind, etablierten sich die Begrifflichkeiten Public Data und Open Data.

Die Bezeichnung Public Data beschreibt dabei mehr die Quelle (Amt) mit einer von mehreren unterschiedlichen Lizenzformen und Open Data nur die freie Nutzungsform und damit eine rechtliche Regelung bei offener Verfügbarkeit mit bewusster Freigabeentscheidung.

 

Was ist Open Data?

Open Data beschreibt ein Prinzip der freien Zugänglichkeit und Nutzung von Daten. Daten gelten als offen, wenn sie ohne Einschränkungen zugänglich sind, in maschinenlesbaren Formaten vorliegen und unter einer offenen Lizenz stehen, die Weiterverwendung, Veränderung und Verbreitung erlaubt. Entscheidend ist dabei: Nicht die Herkunft der Daten ist maßgeblich, sondern die Lizenz. Ein zentrales Beispiel ist die „Datenlizenz Deutschland – Zero 2.0“ (https://www.govdata.de/dl-de/zero-2-0). Diese erlaubt die uneingeschränkte Nutzung – auch kommerziell und ohne Namensnennung. Damit werden staatliche Daten erst durch die Lizenz zu Open Data. Weitere Beispiele sind OpenStreetMap oder offene APIs von Unternehmen, die Daten gezielt zur freien Nutzung bereitstellen. In all diesen Fällen gilt: Offenheit ist kein Zufall, sondern eine bewusste Entscheidung.

Open Data ist damit ein klar definierter Idealzustand: Daten sind vollständig frei nutzbar, ohne rechtliche, technische oder wirtschaftliche Hürden. In der Realität betrifft dies jedoch meist nur einen Teil der tatsächlich verfügbaren Datenbestände – insbesondere im öffentlichen Sektor.

 

Was ist Public Data?

Public Data bezeichnet Daten, die im öffentlichen Interesse stehen und typischerweise von staatlichen Institutionen erhoben oder bereitgestellt werden. Dazu zählen etwa Registerdaten, Geobasisdaten, Statistik- oder Umweltdaten. Im Gegensatz zu Open Data beschreibt Public Data nicht die Zugänglichkeit, sondern die gesellschaftliche Funktion und Herkunft der Daten. Ein zentrales Missverständnis ist, dass „öffentlich“ gleichbedeutend mit „frei“ sei. Tatsächlich sind viele Public Data bewusst reguliert. Ein Beispiel ist das Registerportal der Länder (https://www.handelsregister.de). Hier können Informationen zu Unternehmen und Organisationen eingesehen werden. Gleichzeitig gelten klare Einschränkungen: nur Einzelabfragen, keine systematischen Massenabrufe, Zugriffslimits und rechtliche Vorgaben. Die Daten sind öffentlich einsehbar – aber nicht frei nutzbar.

Ein weiteres Beispiel sind Geobasisdaten der Bayerischen Vermessungsverwaltung (https://www.ldbv.bayern.de/mam/ldbv/dateien/nutzungsbedingungen_daten.pdf). Diese Daten sind essenziell für Planung, Verwaltung und Wirtschaft. Ihre Nutzung ist jedoch lizenzbasiert, teilweise kostenpflichtig und unterscheidet klar zwischen interner und externer Nutzung. Externe Weitergabe ist stark eingeschränkt.

Public Data folgt damit nicht dem Prinzip der Offenheit, sondern der Zweckbindung. Die Daten sind öffentlich relevant, aber ihre Nutzung wird bewusst gesteuert – aus Gründen des Datenschutzes, der Qualitätssicherung und der Finanzierung staatlicher Dateninfrastrukturen.

 

Die Public Data Lizenz des Dateninstituts (dai)

Die Public Data Lizenz des data analytics institute (dai) positioniert sich zwischen Open Data und klassischem Public Data. Sie greift ein etabliertes Prinzip aus der öffentlichen Verwaltung auf: Die Nutzung von Daten ist frei, ihre Bereitstellung jedoch kostenpflichtig. Grundlage ist die dai-Lizenzvereinbarung: https://dai.institute/wp-content/uploads/2026/02/Lizenzvereinbarung_OGC_19122025-V1.pdf

Dieses Prinzip findet sich beispielsweise auch in den Gebührenmodellen der Vermessungsverwaltungen (AdV), etwa in den Bezugsbedingungen für Geodaten: https://www.adv-online.de/AdV-Produkte/Bezugsbedingungen/AdV-GR_4_0_1_f6f8a.pdf

Die dai-Lizenz orientiert sich an diesem Modell – ist jedoch deutlich einfacher und freier gestaltet. Sie reduziert komplexe Unterscheidungen (z. B. interne vs. externe Nutzung, verschiedene Gebührenarten) auf ein klares Prinzip: Zugang gegen Bereitstellungsgebühr, Nutzung weitgehend frei.

Der entscheidende Unterschied liegt in der ökonomischen Logik: Nicht die Nutzung wird bepreist, sondern die Bereitstellung eines nutzbaren Datenprodukts. Damit entsteht ein Modell, das sowohl wirtschaftlich tragfähig als auch praktisch nutzbar ist – und die Lücke zwischen Offenheit und Regulierung schließt.

 

Unterschied Public vs. Open Data – ein Fazit

Die Unterscheidung zwischen Open Data und Public Data ist mehr als semantisch – sie bestimmt, wie Daten tatsächlich genutzt werden können. Open Data steht für maximale Freiheit, ist jedoch in der Praxis oft nur für ausgewählte Datensätze realisierbar. Public Data hingegen bildet die Grundlage staatlicher Informationssysteme, ist aber häufig reguliert und eingeschränkt nutzbar. Die Beispiele machen das deutlich: GovData zeigt, wie Daten durch offene Lizenzen vollständig nutzbar werden (https://www.govdata.de/dl-de/zero-2-0). Das Registerportal zeigt, wie Public Data bewusst begrenzt zugänglich ist (https://www.handelsregister.de). Geodaten der Vermessungsverwaltungen zeigen, wie Nutzung über Lizenzen gesteuert wird (https://www.ldbv.bayern.de/mam/ldbv/dateien/nutzungsbedingungen_daten.pdf). Und die AdV verdeutlicht, dass Bereitstellungsgebühren ein etabliertes Modell sind (https://www.adv-online.de/AdV-Produkte/Bezugsbedingungen/AdV-GR_4_0_1_f6f8a.pdf). Die entscheidende Frage ist daher nicht, ob Daten offen sind, sondern ob sie nutzbar sind. Die Public Data Lizenz bietet hier einen pragmatischen Ansatz: Sie verbindet die gesellschaftliche Relevanz von Public Data mit einer hohen praktischen Nutzbarkeit, ohne vollständige Offenheit vorauszusetzen.

Die Zukunft entscheidet sich nicht an „open oder nicht open“, sondern an nutzbar oder nicht nutzbar.

 

Keine News verpassen?

Hier gehts zur Anmeldung vom Newsletter 

 

]]>
Open Geocoder kommt! https://dai.institute/index.php/2025/11/14/open-geocoder-kommt/ Fri, 14 Nov 2025 10:38:50 +0000 https://dai.institute/?p=555 Für alle, die Adressen präzise lokalisieren oder anonymisieren wollen, ist es wie Weihnachten: Deutschlands erster Open Geocoder erscheint noch im Dezember. Er beinhaltet alle rund 23 Mio. amtlichen Adressen mit allen verfügbaren Raumstrukturen als TWIN-Datenmodell. So können beliebige Nachbarschaften durch räumliche Aggregation gebildet werden. Der Open Geocoder ist Teil des Spatial Aggregation Framework for Data Privacy (SAFeDY).

Geschafft: Open Data aller Länder als Basis

Das data analytics institute (dai) arbeitet seit Wochen intensiv an einer Lösung, die Deutschland im Bereich der Nutzung von Geodaten und dem datenschutzkonformen Umgang mit Adressen einen deutlichen Push geben soll:

  • Eine Open Source Software, die auf Open Data zugreift.
  • Eine Lösung, die sich jede Institution kostenlos installieren kann und
  • die lokal und sicher im eigenen Netz Adressen so verarbeitet, dass
  • präzise Koordinaten ermittelt werden können und/oder
  • beliebig räumlich aggregiert werden können
  • zur Anonymisierung oder
  • zur Berechnung gebietsbezogener Kennziffern

Das alles beinhaltet der neue Open Geocoder. Grundlage und Datenbasis dafür bildet erstmals ein homogener, komplett auf Open Data der Länder basierender Datensatz.

Alle Adressen, alle Siedlungsblöcke, Flurstücke und Gemarkungen

Das Dateninstitut dai hat erstmals alle rund 23 Mio. Adressen aus unterschiedlichen Open Data Quellen der 16 Bundesländer zusammengetragen. Dazu gehören auch alle Siedlungsblöcke, die die wesentliche Planungsebene für die kommunale Wärmewende darstellen. Der Datensatz beinhaltet auch alle amtlichen Gemarkungen (Orts- und Stadtteile) und alle verfügbaren Flurstücke. Letztere allerdings ohne Bayern. Hier schert der Freistaat immer noch aus. Der Datensatz folgt dem TWIN-Datenmodell und ist ebenfalls offen.

Damit stellt der Open Geocoder einen wesentlichen Bestandteildes Spatial Aggregation Framework for Data Privacy (SAFeDY) dar. SAFeDY dient der räumlichen Aggregation von Daten unter Wahrung des Datenschutzes. Der Open Geocoder ist ein Werkzeug innerhalb dieses Frameworks, das Adressen, Koordinaten oder räumliche Referenzen datenschutzkonform verarbeiten lässt – in diesem Fall über Generalisierung oder Clustering. Oberstes Ziel ist: Präzise, aber nicht identifizierbare Geodatenverarbeitung – also die Balance zwischen räumlicher Genauigkeit und Privatsphäre.


Jetzt schon Version sichern!

Das Dateninstitut ist weiter im Aufbau und so gibt es viel zu tun. Die erste Version des Open Geocoders wird noch von uns mit begleitet. Danach steht die Lösung zum freien Download zur Verfügung. Ansprechpartner ist Herr Sascha Jablonski sascha.jablonski@dai.institute

]]>
Dateninstitut startet daia-x https://dai.institute/index.php/2025/10/30/daia-x/ Thu, 30 Oct 2025 09:59:29 +0000 https://dai.institute/?p=499 Bonn, 30. Oktober 2025. Mit daia-x startet das data analytics institute (dai) eine Initiative, die das Denken über Datenräume in Deutschland grundlegend verändern soll. Aufbauend auf den Prinzipien der europäischen gaia-x-Initiative schafft daia-x eine vernetzte Dateninfrastruktur, die Datenquellen aus Wirtschaft, Wissenschaft und Verwaltung systematisch miteinander verbindet und sektorübergreifend zur Verfügung stellt.

Von gaia-x zu daia-x: Die Idee der europäischen Datenräume

gaia-x steht für die Vision eines europäischen Datenökosystems, das technologische Innovation mit digitaler Souveränität verbindet. Diese Vision wird nun inhaltlich umgesetzt. Hier setzt das Netzwerk daia-x an. Es stellt die praktische Brücke zwischen Infrastruktur und Anwendung für sektorübergreifende Datenräume auf Basis eines einheitlichen Datenmodells (TWIN) dar.

daia-x schafft Strukturen, in denen Daten nicht zentralisiert, sondern qualitativ vernetzt werden. Es soll so den Herausforderungen unserer gesellschaftlichen Transformation wie beispielsweise der Energie- und Mobilitätswende evidenzbasiert begegnet werden.

Die neue Infrastruktur für vertrauenswürdige Datenräume in Deutschland

Im Zentrum von daia-x steht ein Netzwerk spezialisierter Dateninstitute und ihren Datenräumen, die unterschiedliche Lebens- und Wirtschaftsbereiche abbilden:

  1. daia-W – Datenraum für Wohnen und Soziales
    Daten über Gebäude, Wohn- und Lebenssituationen insbesondere Energie und Gesundheit.
  2. daia-M – Datenraum für Mobilität
    Daten über Mobilitätsverhalten.
  3. daia-A – Datenraum für Arbeit & Ökonomie
    Daten über Unternehmen, Arbeitsmarkt, Bildung und Beschäftigung.
  4. daia-K – Datenraum für Kommunikation & Journalismus
    Geprüfte Daten für Journalismus, Diskurs und gesellschaftliche Teilhabe.
  5. daia-S – Datenraum für Statistik & AI
    Methodische Brücke zur Wissenschaft, die die Standards für Qualität und Validität von Daten und Analysen definiert (TRUST).

Neues Forschungsdatenzentrum (FDZ) geplant

Im Rahmen der Initiative ist zudem geplant, ein Forschungsdatenzentrum (FDZ) zu etablieren. Ein FDZ ist eine wissenschaftliche Einrichtung, die den sicheren Zugang zu sensiblen, personen- oder unternehmensbezogenen Mikrodaten für Forschung und Politikberatung ermöglicht. Ziel ist es, hochwertige Datenbestände – z. B. aus amtlichen, wirtschaftlichen oder sozialwissenschaftlichen Quellen – unter klar definierten Datenschutz- und Qualitätsstandards bereitzustellen.

Kontakt
presse@dai.institute

]]>
Open Geocoder: Freistaat Bayern und Niedersachsen sind alles andere als Open (Data) https://dai.institute/index.php/2025/10/22/open-geocoder/ Wed, 22 Oct 2025 08:59:00 +0000 https://dai.institute/?p=467 Bonn, 22.10.2025. In Kürze veröffentlicht das data analytics institute (dai) den ersten Open Geocoder zur freien Verwendung mit rund 23 Mio. adressgenauen Koordinaten für alle Bundesländer. Für alle? Nein, denn Bayern und Niedersachen scheren aus. Nur durch die Verknüpfung mit anderen öffentlichen und privaten Datenbanken findet sich eine Lösung. Das ist alles andere als im Sinne der europäischen Open Data Initiative. Frei sein, heißt scheinbar nicht auch “offen” sein.

Open Geocoder erscheint noch in diesem Quartal

Der Open Geocoder wird in den nächsten Wochen als Open Source Software im GIT-Hub kostenlos zur Verfügung gestellt. Er nutzt das TWIN-Datenmodell, was die Anonymisierung von Adressen durch räumliche Aggregation (zB pro Siedlungsblock oder Ortsteil) ermöglicht. Damit ist der Open Geocoder wesentlicher Baustein des DSGVO-Frameworks SAFeDY.

Adressen und Hauskoordinaten als Open Data in Baden-Würtemberg (Quelle: Geoportal BaWü)


Adressbasis mit Koordinaten offen und modular integrierbar

Alle Bundesländer außer Bayern und Niedersachsen stellen ihre Verzeichnisse als Open Data zur Verfügung. Um eine bundesweite Lösung zu ermöglichen, muss man Brücken zu weiteren Public & Private Datenquellen schlagen, was der dai nun gelungen ist. Die Datenbasis ist somit modular aufgebaut. Der Bereitstellung von Software und Daten steht also nichts mehr im Wege: Geocodierung für alle – und damit auch Anonymisierung für alle! So die Devise des Dateninstituts dai.

SAFeDY als grundlegender Bestandteil von daia-x

Das DSGVO-konforme Framework SAFeDY wird beim Austausch von Daten auf der neuen Datenplattform daia-x eine grundlegende Rolle spielen. daia-x wird spezielle Datenräume für Wissenschaft, Wirtschaft, Journalismus und Politik bereitstellen.

Use Case Kommunale Wärmeplanung

Seit die Energiewende operativ durch die kommunale Wärmeplanung bei den Gemeinden und örtlichen Energieversorgern angekommen ist, gilt es (spätestens mit dem Wärmeplanungsgesetz) Daten untereinander auszutauschen, damit Strategie und Planung auf einer möglichst evidenten Datenbasis erfolgt. Der Open Geocoder stellt dazu ein effektives und kostenloses Basistool dar.

Kontakt

presse@dai.institute

]]>
Dateninstitut entwickelt neues, offenes Framework SAFeDY zur Anonymisierung von Adressen durch räumliche Aggregation https://dai.institute/index.php/2025/10/08/safedy-anonymisierung-von-adressen-durch-raeumliche-aggregation/ Wed, 08 Oct 2025 05:30:49 +0000 https://dai.institute/?p=427 Bonn, 8. Oktober 2025. Die Anonymisierung personenbezogener Daten ist in der Datenverarbeitung eine grundlegende Aufgabe. Die räumliche Aggregation spielt dabei eine zentrale Rolle. Das data analytics institute (dai) arbeitet gerade an einem entsprechenden Framework (SAFeDY), dass Institutionen ein offenes Set an Werkzeugen zur Hand gibt, um Adressen DSGVO-konform anonymisieren zu können. Gerade beim Daten teilen zur Umsetzung einer effektiven Datenökonomie wie beispielsweise in der kommunalen Wärmeplanung soll das neue Framework SAFeDY Grundlage jeder anstehenden Verarbeitung von Adressen oder GPS-Daten werden.

SAFeDY – Spatial Aggregation Framework for Data Privacy – bietet ein Set an Tools zur Anonymisierung personenbezogener Daten durch räumliche Aggregation

Räumliche Aggregation zur Anonymisierung von Positionen wie Adressen oder GPS-Daten gehören zur grundlegenden Herausforderung in der Verarbeitung personenbezogener Daten. Das neue und offene Framework SAFeDY bietet Institutionen den dafür notwendigen Werkzeugkasten. Zum Framework zählt u.a.

  • Ein offenes, hierarchisches Mehrebenen-Raummodell, was Adressen und Standorte in beliebige Gebiete wie beispielsweise Wohnblöcke, Quartiere und Stadteile oder Kacheln (100x100m, 1x1km usw.) zusammenfassen lässt
  • Eine offene Geokodierung, die sich flexibel in jede Infrastruktur implementieren lässt und Adressen innerhalb einer Institution verarbeiten lässt, um die Raumebenen anreichern zu können
  • Die flexible, DSGVO-konforme Aggregation (und Darstellung) personenbezogener Daten in beliebige Gebiete


Open Geocoder – offene Geokodierung für Alle

Die Open Source & Data Initiativen machen es möglich. Das Dateninstitut dai plant noch im Laufe dieses Quartals und damit bis Ende des Jahres erstmals einen Open Geocoder auf den Markt zu bringen. Hauptelement der dazu notwendigen Referenzdaten sind die offenen Geodaten der einzelnen Bundesländer (u.a. die 3D-Gebäudedaten), die im Datenmodell TWIN am Institut zusammenfließen und harmonisiert werden. Die Softwareentwicklung und spätere Lizenz folgt dabei den Möglichkeiten von Open Source Richtlinien. Geokodierung ist somit erstmals für alle da (und weiterentwickelbar).

Kontakt

Sie haben Fragen zur räumlichen Aggregation oder zum Framework SAFeDY? Dann kontaktieren Sie uns unter presse@dai.institute

]]>
Erstes unabhängiges und interdisziplinäres Dateninstitut für Wirtschaft, Wissenschaft und Politik in Deutschland gegründet. https://dai.institute/index.php/2025/04/11/dateninstitut-gegruendet/ Thu, 10 Apr 2025 22:00:00 +0000 https://dai.institute/?p=1 Bonn [11.04.2025] – Mit der Gründung des data analytics institute (dai) entsteht das erste unabhängige, interdisziplinäre Dateninstitut für Wirtschaft, Wissenschaft und Politik. Die Aktiengesellschaft mit Hauptsitz in Bonn und Niederlassungen in Berlin und Stuttgart setzt auf die innovative Kombination aus Data Science und Artificial Intelligence (AI), um datengetriebene Lösungen für gesellschaftsrelevante Fragestellungen zu entwickeln.

  • Evaluation, Qualifizierung und Entwicklung von Daten durch hochspezialisierte Data Scientisten in Kombination mit AI-gestützter Verfahren
  • Datenschutz- und lizenzrechtliche Fragestellungen, z.B. wem gehört ein Datum?

Bereits in der Gründungsphase startet das dai mit folgenden wegweisenden Forschungsprojekten:

  • Umsetzung einer datenspezifischen AI-Infrastruktur (DAII) für Organisationen
  • Thomas Losse-Müller, Vorsitzender des Aufsichtsrats, ist einer der führenden Politiker für Digitalisierung und Klimaneutralität. Er ist u.a. Direktor der Stiftung Klimaneutralität sowie des Sozial-Klimarats.
  • Jörn Bielfeldt, Gründungsgesellschafter und Geschäftsführer der Public Good GmbH, komplettiert das Team beratend.
Von links: Özlem Doger-Herter, Björn Schmidt, Göran Kauermann, Ursula Berger, Jörn Bielfeldt, Michael Herter

]]>