Hilfe

Willkommen im Hilfebereich des Datenatlas Zivilgesellschaft

Ob Sie erstmals Daten veröffentlichen möchten oder gezielt nach offenen Datensätzen für Analysen, Projekte oder Recherchen suchen – hier finden Sie alle wichtigen Informationen, um den Datenatlas Zivilgesellschaft effektiv zu nutzen.

Diese Seite richtet sich sowohl an Organisationen, die Daten bereitstellen wollen, als auch an Personen und Institutionen, die offene Daten nutzen möchten. Sie erfahren, was offene Daten sind, wie Sie Ihre Daten vorbereiten und mit geeigneten Lizenzen versehen, welche technischen und rechtlichen Aspekte zu beachten sind – und wie der Datenatlas Sie dabei unterstützt, Ihre Daten sichtbar, nutzbar und wirkungsvoll zu machen.

Einführung

Der Datenatlas Zivilgesellschaft ist eine zentrale Plattform für offene Daten aus dem zivilgesellschaftlichen Bereich in Deutschland. Als Metadatenkatalog sammelt und erschließt er Forschungsdaten, Statistiken und Informationen von und über zivilgesellschaftliche Organisationen.

Träger: Bertelsmann Stiftung - Zentrum für Datenmanagement

Technische Basis: Piveau-Plattform mit DCAT-AP.de Standard

Vernetzung: Der Datenatlas Zivilgesellschaft wird mit nationalen und europäischen Datenportalen wie GovData und data.europa.eu vernetzt und ermöglicht so eine breite Sichtbarkeit der Daten.

  • Vereine, Stiftungen, Verbände und andere zivilgesellschaftliche Organisationen
  • Wissenschaftler*innen der Zivilgesellschaftsforschung
  • Journalistinnen und Medienvertreterinnen
  • Verwaltung und Politik
  • Interessierte Öffentlichkeit

Grundlagen von Open Data

Offene Daten, international als "Open Data" bezeichnet, sind digitale Informationen, die ohne rechtliche, technische oder finanzielle Barrieren für jedermann zugänglich sind. Diese Definition geht weit über die bloße Verfügbarkeit hinaus und umfasst ein ganzes Spektrum an Anforderungen, die erfüllt sein müssen, damit Daten als wirklich "offen" gelten können.

Das Konzept offener Daten wurzelt in der Überzeugung, dass gesellschaftlich relevante Informationen allen Mitgliedern einer Gemeinschaft zugutekommen sollten. Besonders für zivilgesellschaftliche Organisationen, die oft mit öffentlichen Mitteln arbeiten oder gesellschaftliche Aufgaben wahrnehmen, ergibt sich hieraus eine besondere Verantwortung zur Transparenz. Offene Daten schaffen nicht nur Vertrauen, sondern ermöglichen auch neue Formen der Zusammenarbeit und des gesellschaftlichen Lernens.

Im zivilgesellschaftlichen Kontext bedeutet dies konkret, dass Vereine ihre Mitgliederstatistiken teilen, Stiftungen ihre Förderdaten offenlegen oder Verbände ihre Positionspapiere strukturiert zugänglich machen. Diese Transparenz stärkt das Vertrauen der Öffentlichkeit in zivilgesellschaftliche Akteure und demonstriert verantwortungsvollen Umgang mit gesellschaftlichen Ressourcen.

Offene Daten (Open Data) sind Informationen, die:

  • Frei zugänglich sind - ohne Anmeldung oder Kosten
  • Maschinenlesbar vorliegen - in strukturierten Formaten wie CSV oder JSON
  • Unter einer offenen Lizenz stehen - zur Weiterverwendung freigegeben

Freie Zugänglichkeit

Die erste Säule offener Daten ist ihre uneingeschränkte Zugänglichkeit. Dies bedeutet, dass Interessierte ohne Registrierung, Anmeldung oder Kostenbeitrag auf die Informationen zugreifen können. Für zivilgesellschaftliche Organisationen ist dies besonders relevant, da ihre Stakeholder oft aus verschiedenen gesellschaftlichen Schichten kommen und unterschiedliche technische Voraussetzungen mitbringen.

Freie Zugänglichkeit schließt jedoch nicht aus, dass Organisationen nachvollziehen möchten, wer ihre Daten nutzt. Viele Portale bieten daher die Möglichkeit einer freiwilligen Registrierung, die zusätzliche Services wie Benachrichtigungen bei Aktualisierungen oder erweiterte Download-Optionen ermöglicht. Der Grundsatz bleibt jedoch bestehen: Der Zugang zu den Daten selbst darf niemals von einer Registrierung abhängig gemacht werden.

Maschinenlesbarkeit

Die zweite Säule betrifft die technische Aufbereitung der Daten. Maschinenlesbarkeit bedeutet, dass Informationen in strukturierten Formaten vorliegen, die von Computerprogrammen automatisch verarbeitet werden können. Dies unterscheidet offene Daten fundamental von traditionellen Veröffentlichungsformen wie PDF-Dokumenten oder eingescannten Bildern.

Für zivilgesellschaftliche Organisationen mag dieser Aspekt zunächst technisch und wenig relevant erscheinen. Tatsächlich eröffnet die Maschinenlesbarkeit jedoch völlig neue Möglichkeiten der Datennutzung. Während ein PDF-Bericht über Vereinsstatistiken nur von Menschen gelesen werden kann, ermöglicht eine CSV-Datei mit denselben Informationen automatisierte Analysen, die Erstellung von Visualisierungen oder die Verknüpfung mit anderen Datenquellen.

Die praktische Umsetzung der Maschinenlesbarkeit erfordert keine tiefgreifenden technischen Kenntnisse. Bereits die Umwandlung einer Excel-Tabelle in das CSV-Format oder die strukturierte Aufbereitung von Projektdaten in einer JSON-Datei erfüllt diese Anforderung. Wichtig ist dabei die konsistente Strukturierung der Daten, sodass beispielsweise Datumsangaben immer im gleichen Format vorliegen oder Kategorisierungen einheitlich verwendet werden.

Offene Lizenzierung

Die dritte und oft übersehene Säule offener Daten ist ihre rechtliche Freigabe durch eine offene Lizenz. Auch wenn Daten frei zugänglich und maschinenlesbar sind, können sie ohne entsprechende Lizenz rechtlich nicht als "offen" gelten. Die Lizenz definiert explizit, was Nutzer mit den Daten machen dürfen, und schafft damit Rechtssicherheit für alle Beteiligten.

Für zivilgesellschaftliche Organisationen ist die Lizenzwahl eine strategische Entscheidung, die ihre Werte und Ziele widerspiegelt. Eine Creative Commons Zero (CC0) Lizenz signalisiert völlige Offenheit und den Wunsch nach maximaler gesellschaftlicher Nutzung der Daten. Eine Creative Commons Attribution (CC BY) Lizenz zeigt ebenfalls Offenheit, verbunden mit dem verständlichen Wunsch nach Anerkennung der geleisteten Arbeit.

Die Lizenzierung schützt nicht nur die Nutzer, sondern auch die datenbereitstellende Organisation. Sie macht transparent, was erwünscht ist und was nicht, und verhindert damit Missverständnisse oder rechtliche Konflikte. Gleichzeitig dokumentiert sie den bewussten Willen zur Offenheit, was für das Vertrauen der Öffentlichkeit von großer Bedeutung ist.

Transparenz und Vertrauen

Offene Daten fungieren als Transparenz-Instrument, das das Vertrauen zwischen zivilgesellschaftlichen Organisationen und ihren verschiedenen Stakeholdern stärkt. Wenn ein Verein seine Mitgliederentwicklung offenlegt oder eine Stiftung ihre Förderpraktiken transparent macht, demonstriert dies Offenheit und Rechenschaftspflicht. Diese Transparenz ist besonders wichtig für Organisationen, die öffentliche Mittel erhalten oder steuerliche Vorteile genießen.

Das durch Transparenz gewonnene Vertrauen hat messbare Auswirkungen. Studien zeigen, dass Spender und Förderer offenere Organisationen bevorzugen und dass transparente Vereinsführung zu höherer Mitgliederzufriedenheit führt. Offene Daten werden somit zu einem Wettbewerbsvorteil im zunehmend umkämpften Markt um gesellschaftliche Aufmerksamkeit und Ressourcen.

Evidenzbasierte Entscheidungsfindung

Offene Daten ermöglichen es politischen Entscheidungsträgern, Fördergebern und anderen Akteuren, ihre Entscheidungen auf solide empirische Grundlagen zu stützen. Wenn beispielsweise Kommunen über die Förderung von Jugendarbeit entscheiden, können sie auf offene Daten von Jugendorganisationen zurückgreifen, um Bedarfe zu identifizieren und Erfolge zu messen.

Diese evidenzbasierte Herangehensweise führt zu effizienteren Ressourcenverteilungen und wirksameren Interventionen. Statt auf Vermutungen oder politische Präferenzen angewiesen zu sein, können Entscheidungen auf der Basis tatsächlicher Daten getroffen werden. Für zivilgesellschaftliche Organisationen bedeutet dies bessere Chancen auf angemessene Förderung und gesellschaftliche Unterstützung.

Mehrwerte durch Datenverknüpfung

Einer der kraftvollsten Aspekte offener Daten liegt in ihrer Kombinierbarkeit. Einzelne Datensätze gewinnen exponentiell an Wert, wenn sie mit anderen Informationen verknüpft werden können. Die Vereinsstatistiken einer Region werden beispielsweise erst dann wirklich aussagekräftig, wenn sie mit demografischen Daten, Infrastrukturinformationen oder Wirtschaftsdaten kombiniert werden.

Diese Datenverknüpfung führt oft zu unerwarteten Erkenntnissen und Innovationen. Forscher können neue Zusammenhänge entdecken, Entwickler innovative Anwendungen schaffen, und Journalisten datengetriebene Geschichten erzählen, die ohne offene Daten nicht möglich gewesen wären. Für die bereitstellenden Organisationen bedeutet dies, dass ihre Daten einen Nutzen entfalten, der weit über die ursprünglichen Verwendungszwecke hinausgeht.

Demokratische Teilhabe

Offene Daten stärken die demokratische Teilhabe, indem sie Bürger:innen die Informationen zur Verfügung stellen, die sie für fundierte Meinungsbildung und gesellschaftliche Partizipation benötigen. Wenn Umweltorganisationen ihre Messdaten teilen oder Sozialverbände ihre Beratungsstatistiken offenlegen, können Bürger die gesellschaftlichen Herausforderungen besser verstehen und sich gezielter engagieren.

Diese informierte Teilhabe führt zu einer lebendigeren Zivilgesellschaft und stärkeren demokratischen Institutionen. Bürger, die Zugang zu relevanten Daten haben, können konstruktiver an gesellschaftlichen Debatten teilnehmen und fundierte Entscheidungen bei Wahlen oder ehrenamtlichem Engagement treffen.

Interne Organisationsdaten

Nicht alle Daten einer zivilgesellschaftlichen Organisation eignen sich für die Veröffentlichung als offene Daten. Die Entscheidung, welche Daten geöffnet werden, erfordert daher eine sorgfältige Abwägung zwischen Transparenz und berechtigten Geheimhaltungsinteressen.

Diese Abgrenzung ist jedoch nicht statisch. Viele Informationen, die zunächst intern behandelt werden, können nach einer gewissen Zeit oder nach entsprechender Aufbereitung durchaus als offene Daten zur Verfügung gestellt werden. Beispielsweise können Finanzdaten nach Ablauf des Geschäftsjahres und entsprechender Anonymisierung veröffentlicht werden oder Projektergebnisse werden nach Projektabschluss für die wissenschaftliche Nachnutzung freigegeben.

Personenbezogene Daten

Eine besonders wichtige Abgrenzung betrifft personenbezogene Daten, die unter den Schutz der Datenschutz-Grundverordnung (DSGVO) fallen. Hierzu gehören nicht nur offensichtliche Informationen wie Namen und Adressen, sondern auch alle Daten, die Rückschlüsse auf identifizierbare Personen zulassen. Für zivilgesellschaftliche Organisationen, die oft eng mit Menschen arbeiten, ist dies ein besonders sensibles Thema.

Die DSGVO verbietet jedoch nicht grundsätzlich die Veröffentlichung von Daten über Personen. Entscheidend ist, dass entweder eine ausdrückliche Einwilligung der Betroffenen vorliegt oder die Daten so anonymisiert wurden, dass keine Rückschlüsse auf Individuen möglich sind. Letzteres erfordert oft mehr als nur das Entfernen von Namen, da sich Personen auch durch die Kombination scheinbar harmloser Merkmale identifizieren lassen können.

Viele wertvolle Datensätze aus der zivilgesellschaftlichen Arbeit lassen sich jedoch durch geeignete Anonymisierungsverfahren für die Öffentlichkeit zugänglich machen. Statt individueller Teilnehmerdaten können beispielsweise aggregierte Statistiken veröffentlicht werden, die wichtige Erkenntnisse über Zielgruppen und Wirkungen vermitteln, ohne einzelne Personen preisgeben.

Vertrauliche oder sicherheitsrelevante Informationen

Manche Daten zivilgesellschaftlicher Organisationen können bei Veröffentlichung Sicherheitsrisiken bergen oder die Effektivität der Arbeit gefährden. Dies gilt besonders für Organisationen, die in politisch sensiblen Bereichen arbeiten oder mit vulnerablen Gruppen. Informationen über Standorte von Frauenhäusern, Details zu Schutzprogrammen oder strategische Pläne für Menschenrechtsarbeit in autoritären Regimen müssen vertraulich bleiben.

Auch hier ist jedoch eine differenzierte Betrachtung möglich. Oft lassen sich aus vertraulichen Projekten anonymisierte Erkenntnisse ableiten, die für die Fachöffentlichkeit wertvoll sind, ohne Sicherheitsrisiken zu schaffen. Erfahrungen aus der Beratungsarbeit können beispielsweise in Form anonymisierter Fallstatistiken geteilt werden, die anderen Organisationen bei der Entwicklung eigener Angebote helfen.

Lizenzen schaffen Rechtssicherheit für alle Beteiligten. Sie definieren explizit, was mit den Daten gemacht werden darf und unter welchen Bedingungen. Ohne eindeutige Lizenzierung herrscht rechtliche Unsicherheit, die die Nachnutzung von Daten erheblich erschwert oder verhindert.

Open-Data-Lizenzen

Creative Commons Zero (CC0)

Empfehlung: Bevorzugte Lizenz für maximale Offenheit

  • Vollständiger Verzicht auf alle Urheberrechte
  • Daten können ohne jegliche Einschränkungen genutzt werden
  • Keine Namensnennung erforderlich (aber empfohlen)
  • Kommerzielle Nutzung ausdrücklich erlaubt

Creative Commons Namensnennung (CC BY)

  • Freie Nutzung unter der Bedingung der Namensnennung
  • Kommerzielle Nutzung erlaubt
  • Bearbeitung und Veränderung erlaubt
  • Einfachste Form der Namensnennung genügt

Weiterführende Ressourcen

  • Creative Commons Deutschland: creativecommons.org/licenses
  • Open Data Handbook: opendatahandbook.org

Die Entscheidung für ein bestimmtes Datenformat ist weit mehr als eine technische Detailfrage. Sie bestimmt maßgeblich, wer die Daten nutzen kann, wie sie verarbeitet werden können und welche Analysemöglichkeiten sich eröffnen. Für zivilgesellschaftliche Organisationen, die oft ein breites Spektrum von Nutzern mit unterschiedlichen technischen Kenntnissen ansprechen möchten, ist die Formatwahl daher eine strategische Entscheidung.

Offene, standardisierte Formate gewährleisten, dass die Daten auch langfristig zugänglich und nutzbar bleiben. Proprietäre Formate mögen kurzfristig praktisch erscheinen, können aber Nutzungsbarrieren schaffen und sind anfällig für technische Obsoleszenz. Die Wahl offener Formate signalisiert zudem das Bekenntnis zu echten Open Data-Prinzipien und erhöht das Vertrauen der Nutzer.

Die Formatwahl sollte sich am intendierten Verwendungszweck der Daten orientieren. Datensätze, die primär für statistische Analysen gedacht sind, erfordern andere Formate als solche, die in Webanwendungen eingebunden oder für Visualisierungen verwendet werden sollen. Eine durchdachte Formatstrategie kann dazu beitragen, dass die Daten ihr volles Potential entfalten.

CSV als Grundformat für tabellarische Daten

Das CSV-Format (Comma Separated Values) hat sich als universeller Standard für die Bereitstellung tabellarischer Daten etabliert. Seine Stärke liegt in der Einfachheit und der breiten Unterstützung durch praktisch alle Analysewerkzeuge, von Excel über spezialisierte Statistiksoftware bis hin zu Programmiersprachen wie R und Python.

Die scheinbare Einfachheit von CSV kann jedoch trügerisch sein. Während das Grundkonzept – Werte werden durch Trennzeichen getrennt – simpel ist, führen verschiedene Implementierungen und kulturelle Unterschiede oft zu Kompatibilitätsproblemen. Deutsche Nutzer erwarten beispielsweise Semikolons als Trennzeichen und Kommas als Dezimaltrennzeichen, während internationale Standards Kommas als Trennzeichen und Punkte als Dezimaltrennzeichen vorsehen.

Die Behandlung von Sonderzeichen und Umlauten erfordert besondere Aufmerksamkeit. Das UTF-8-Encoding hat sich als internationaler Standard durchgesetzt und sollte konsequent verwendet werden. Dennoch öffnen viele ältere Programme CSV-Dateien standardmäßig mit anderen Encodings, was zu Darstellungsfehlern führen kann. Eine sorgfältige Dokumentation des verwendeten Encodings und gegebenenfalls das Bereitstellen mehrerer Versionen können solche Probleme vermeiden.

Die Struktur einer CSV-Datei sollte dem Prinzip der "tidy data" folgen, bei dem jede Zeile eine Beobachtung und jede Spalte eine Variable repräsentiert. Diese Struktur mag zunächst ungewohnt erscheinen, besonders für Nutzer, die an Excel-Tabellen mit zusammengefassten Informationen gewöhnt sind. Sie ist jedoch für die maschinelle Verarbeitung essentiell und erleichtert die Analyse erheblich.

Metadaten sollten nicht in die CSV-Datei selbst eingebettet werden, da dies die maschinelle Verarbeitung erschwert. Stattdessen sollten ergänzende Informationen über die Datenerhebung, Variablendefinitionen oder methodische Hinweise in separaten Dokumentationsdateien bereitgestellt werden. Kommentarzeilen am Anfang einer CSV-Datei sind zwar technisch möglich, können aber Probleme mit Analysesoftware verursachen.

JSON für strukturierte und hierarchische Daten

JavaScript Object Notation (JSON) hat sich als bevorzugtes Format für strukturierte Daten etabliert, besonders wenn hierarchische Beziehungen oder komplexe Datenstrukturen abgebildet werden müssen. Für zivilgesellschaftliche Organisationen bietet JSON die Möglichkeit, Daten in einer Form bereitzustellen, die sowohl für Menschen lesbar als auch für Maschinen verarbeitbar ist.

Die Flexibilität von JSON ermöglicht es, komplexe Organisationsstrukturen, Projekthierarchien oder Beziehungsnetze auf natürliche Weise abzubilden. Ein Datensatz über Förderprojekte kann beispielsweise für jedes Projekt nicht nur grundlegende Informationen enthalten, sondern auch Listen von beteiligten Organisationen, Projektphasen oder Outputs. Diese Strukturierung würde in einem flachen CSV-Format zu erheblichen Redundanzen oder zur Notwendigkeit multipler verknüpfter Dateien führen.

JSON eignet sich besonders für die Bereitstellung von Daten über APIs oder für die Nutzung in Webanwendungen. Die direkte Kompatibilität mit JavaScript macht es zum bevorzugten Format für interaktive Visualisierungen oder Web-basierte Analysewerkzeuge. Viele moderne Datenvisualisierungstools können JSON-Daten direkt verarbeiten, ohne dass eine Konvertierung notwendig ist.

Die Versionierung und Erweiterung von JSON-Strukturen erfordert sorgfältige Planung. Anders als bei CSV-Dateien, wo neue Spalten einfach hinzugefügt werden können, können Änderungen an der JSON-Struktur bestehende Anwendungen zum Absturz bringen. Eine durchdachte Schema-Definition und die Verwendung von Versionsindikatoren können solche Probleme vermeiden.

Die Validierung von JSON-Daten sollte ein integraler Bestandteil des Veröffentlichungsprozesses sein. JSON Schema bietet einen standardisierten Weg, um die Struktur und Inhalte von JSON-Dokumenten zu definieren und zu validieren. Dies hilft nicht nur bei der Qualitätssicherung, sondern auch bei der Dokumentation der Datenstruktur für potentielle Nutzer.

Für Datenbereitstellende

Die Veröffentlichung eines Datensatzes auf dem Datenatlas Zivilgesellschaft erfordert keine hochkomplexe IT-Infrastruktur – aber eine strukturierte Datenbeschreibung.

Grundlage ist der Metadatenstandard DCAT-AP.de, der von Bund, Ländern und Kommunen in Deutschland verwendet wird und die Interoperabilität mit Portalen wie GovData oder data.europa.eu sicherstellt.

Drei Kernelemente eines Datensatzes:

  1. Katalog (dcat:Catalog)
    Die Sammlung oder Quelle, in der Ihre Datensätze strukturiert gebündelt sind.

  2. Datensatz (dcat:Dataset)
    Die inhaltliche Einheit Ihrer Daten – z. B. ein Projektbericht, eine Umfrage, ein Budgetdatensatz.

  3. Distribution (dcat:Distribution)
    Der tatsächliche Datenzugang – z. B. ein Link zu einer CSV-Datei, API oder JSON-Download.

Damit Ihre Organisation Daten effizient im Datenatlas Zivilgesellschaft  veröffentlichen kann, stehen Ihnen zwei flexible Wege der Anbindung zur Verfügung:

1. Manuelle Eingabe:
Über ein benutzerfreundliches Online-Formular können einzelne Datensätze direkt eingegeben werden – ideal für kleinere Organisationen oder erste Veröffentlichungsschritte.

2. Automatisierte Anbindung (Harvesting):
Organisationen mit regelmäßigen Veröffentlichungen oder bestehenden Datenkatalogen können ihre Metadaten im Standardformat DCAT-AP.de automatisiert bereitstellen. Der Datenatlas Zivilgesellschaft übernimmt dann die Einbindung über eine sogenannte Harvesting-Schnittstelle.

Beide Varianten ermöglichen es, strukturierte Metadaten zentral verfügbar zu machen – interoperabel mit anderen Open-Data-Portalen und auffindbar für Dritte.

Die manuelle Eingabe ist der einfachste Weg, Ihre offenen Daten auf dem Datenatlas Zivilgesellschaft  zu veröffentlichen – ganz ohne technische Vorkenntnisse oder automatisierte Schnittstellen. Ideal geeignet für kleinere Organisationen, Pilotvorhaben oder den ersten Einstieg in die Welt offener Daten.

Was ist das Metadatenformular?

Das Metadatenformular ist ein benutzerfreundliches Online-Tool, mit dem Sie Datensätze strukturiert beschreiben und zur Veröffentlichung auf Civora einreichen können. Es basiert auf dem anerkannten Standard DCAT-AP.de, ist jedoch so gestaltet, dass auch Personen ohne Metadaten-Erfahrung ihre Daten problemlos erfassen können.

Vorteile der manuellen Eingabe

  • Niedrige Einstiegshürden: Keine Vorkenntnisse erforderlich
  • Schneller Start: Ideal für einzelne oder punktuelle Veröffentlichungen
  • Standardkonform: Die Felder folgen dem offiziellen Open-Data-Standard DCAT-AP.de
  • Qualitätsprüfung inklusive: Das Civora-Team prüft jede Eingabe redaktionell vor der Freischaltung

Was Sie vorbereiten sollten

Bevor Sie mit der Eingabe beginnen, halten Sie bitte folgende Informationen bereit:

  • Titel und Kurzbeschreibung des Datensatzes
  • Themenzuordnung (z. B. Soziales, Umwelt, Bildung)
  • Name Ihrer Organisation und eine Kontaktadresse
  • Link zur Datei oder API (z. B. CSV, XLSX, JSON, GeoJSON)
  • Lizenzwahl (z. B. CC0, CC BY, CC BY-SA)

Gern können Sie auch Schlagwörter, Veröffentlichungsdatum oder Angaben zur geografischen Abdeckung ergänzen – diese helfen, Ihren Datensatz besser auffindbar zu machen.

Die automatisierte Anbindung über Harvesting ist die effizienteste und skalierbarste Möglichkeit, offene Daten auf dem Datenatlas Zivilgesellschaft bereitzustellen. Sie eignet sich insbesondere für Organisationen, die bereits einen eigenen Datenkatalog führen oder regelmäßig Metadaten veröffentlichen und aktualisieren möchten.

Wie funktioniert Harvesting?

Beim Harvesting wird ein strukturierter Metadatenkatalog im Format RDF/XML in festgelegten Zeitabständen automatisch vom Datenatlas Zivilgesellschaft ausgelesen und in das Portal übernommen. Änderungen in Ihrem Quellkatalog – etwa neue Datensätze oder aktualisierte Beschreibungen – werden bei jedem Durchlauf erkannt und auf dem Datenatlas Zivilgesellschaft übernommen.

Wichtig: Da immer der vollständige Katalog verarbeitet wird, müssen Änderungen stets katalogweit bereitgestellt werden.

→ Sie stellen einen Katalog im RDF/XML-Format bereit. Der Datenatlas Zivilgesellschaft  ruft diesen in festgelegten Intervallen ab (Harvesting). Dabei wird immer der gesamte Katalog aktualisiert.
→ Unterstützte Formate: RDF/XML, CKAN, JSON, OAI-PMH, SPARQL (auf Anfrage)

Voraussetzungen

  • Bereitstellung eines RDF/XML-Katalogs nach dem Standard DCAT-AP.de
  • Zugriff über eine dauerhaft erreichbare URL (z. B. auf Ihrer Website oder auf GitHub Pages)
  • Vollständige und standardkonforme Metadatenstruktur (inkl. Titel, Beschreibung, Herausgeber, Lizenz etc.)
  • Optional: Nutzung von CKAN, JSON, SPARQL oder OAI-PMH (nach Rücksprache möglich)

Vorteile der automatisierten Anbindung

  • Effizienz: Einmal eingerichtet, läuft die Veröffentlichung Ihrer Metadaten automatisiert im Hintergrund.
  • Aktualität: Ihre Daten bleiben auf Datenatlas Zivilgesellschaft stets auf dem aktuellen Stand.
  • Wiederverwendbarkeit: Die standardisierte Beschreibung sorgt für bessere Auffindbarkeit – auch über Portale wie GovData.de oder data.europa.eu.

Empfohlen für größere Organisationen oder regelmäßig aktualisierte Daten.

Zivilgesellschaftliche Organisationen verfügen oft über reichhaltige Datenbestände, die für verschiedene externe Akteure von großem Interesse sein können. Die Eignung von Daten für Open Data lässt sich nicht pauschal bestimmen, sondern hängt von vielen Faktoren ab. Dazu gehören die Art der Organisation, ihr Arbeitsfeld, ihre Zielgruppen und ihre rechtlichen Rahmenbedingungen. Ein Sportverein wird andere Daten öffnen können als eine Beratungsstelle für Gewaltopfer, und eine große Stiftung hat andere Möglichkeiten als ein kleiner Nachbarschaftsverein.

Verschiedene Typen zivilgesellschaftlicher Organisationen verfügen über charakteristische Datenbestände, die unterschiedliche Potentiale für Open Data bieten:

  • Vereine als mitgliedschaftsbasierte Organisationen sammeln naturgemäß viele Daten über ihre Mitglieder und Aktivitäten. Mitgliederstatistiken, die keine Rückschlüsse auf Einzelpersonen zulassen, sind oft gut für die Veröffentlichung geeignet. Sie zeigen die gesellschaftliche Verankerung des Vereins und können für sozialwissenschaftliche Forschung oder kommunale Planungsprozesse wertvoll sein. Dabei ist es wichtig, aggregierte Daten zu verwenden, die keine Identifikation einzelner Mitglieder ermöglichen.
  • Aktivitätsdaten von Vereinen bieten ebenfalls großes Potential. Die Anzahl und Art der Veranstaltungen, Teilnehmerzahlen bei Events oder die Nutzung von Vereinseinrichtungen sind Informationen, die für die kommunale Infrastrukturplanung, für andere Vereine oder für wissenschaftliche Studien zur Zivilgesellschaft relevant sein können. Solche Daten lassen sich meist problemlos anonymisieren und bieten dennoch wertvolle Einblicke in die Vereinslandschaft.
  • Stiftungen arbeiten mit anderen Datentypen, die ebenfalls großes Open Data-Potential haben. Förderstatistiken, die zeigen, welche Arten von Projekten in welchen Regionen und mit welchen Fördersummen unterstützt wurden, können wichtige Impulse für die Entwicklung des jeweiligen Themenfelds geben. Sie helfen anderen Akteuren dabei, Förderlücken zu identifizieren oder erfolgreiche Ansätze zu replizieren.
  • Verbände und Interessenvertretungen verfügen oft über einzigartige Branchendaten, die für politische Entscheidungsprozesse und wissenschaftliche Analysen hochrelevant sind. Mitgliedsstatistiken, Branchenanalysen oder Positionspapiere können wichtige Grundlagen für evidenzbasierte Politikgestaltung liefern. Dabei ist zu beachten, dass solche Daten oft kommerzielle Interessen der Mitgliedsunternehmen berühren können.

Datensätze, die bereits in strukturierter Form vorliegen und nur minimale Bearbeitung erfordern, sind oft gute Kandidaten für den Einstieg in Open Data. Mit wachsender Erfahrung und verfügbaren Ressourcen können dann auch komplexere Datensätze erschlossen werden.

Die nachfolgenden Beispiele von geeigneten Datentypen umfassen sowohl strukturelle Organisationsdaten als auch inhaltliche Projektdaten und berücksichtigt dabei die heterogene Landschaft zivilgesellschaftlicher Akteure – von kleinen Bürgerinitiativen bis hin zu großen Wohlfahrtsverbänden.

Organisationsstrukturdaten

Vereinsregister und Organisationsverzeichnisse

  • Vereinsregisterauszüge (anonymisiert)
  • Organisationstypen und Rechtsformen
  • Gründungsdaten und Entwicklungsverläufe
  • Tätigkeitsbereiche und Satzungszwecke
  • Mitgliederzahlen (aggregiert)
  • Geografische Verteilung von Organisationen

Governance-Strukturen

  • Vorstandsstrukturen (funktional, nicht personenbezogen)
  • Organisationsformen und Entscheidungsprozesse
  • Transparenzberichte
  • Compliance-Kennzahlen

Finanzierungsdaten

Spendenstatistiken

  • Aggregierte Spendenaufkommen nach Bereichen
  • Spendenverteilung nach Zweckbindung
  • Entwicklung des Spendenverhaltens (temporal)
  • Fundraising-Effizienz-Kennzahlen

Fördermitteldaten

  • Öffentliche Förderungen nach Programmen
  • EU-Fördermittelvergabe an NGOs
  • Stiftungsförderungen (aggregiert)
  • Projektfinanzierungsstrukturen

Engagement- und Partizipationsdaten

Freiwilligenarbeit

  • Statistiken zum ehrenamtlichen Engagement
  • Zeitaufwand und Tätigkeitsbereiche
  • Demografische Struktur von Freiwilligen
  • Qualifizierungsmaßnahmen und Kompetenzen

Bürgerbeteiligung

  • Beteiligungsformate und deren Reichweite
  • Partizipationsraten bei verschiedenen Verfahren
  • Wirksamkeitsmessungen von Beteiligungsprozessen
  • Digitale Partizipationsplattformen-Nutzung

Projektdaten und Wirkungsmessungen

Projektdurchführung

  • Projekttypen und Schwerpunkte
  • Zielgruppenerreichung (anonymisiert)
  • Projektdauer und Ressourceneinsatz
  • Kooperationsstrukturen zwischen Organisationen

Impact-Messungen

  • Wirkungsindikatorern und Kennzahlen
  • Evaluationsergebnisse (aggregiert)
  • Social Return on Investment-Berechnungen
  • Nachhaltigkeitsindikatoren

Infrastrukturdaten

Räumliche Infrastruktur

  • Standorte zivilgesellschaftlicher Einrichtungen
  • Verfügbarkeit von Beratungsstellen
  • Vernetzungsgrade zwischen Organisationen
  • Kapazitäten und Auslastungsgrade

Digitale Infrastruktur

  • Digitalisierungsgrad von Organisationen
  • Nutzung digitaler Tools und Plattformen
  • IT-Kompetenz und Schulungsbedarfe
  • Online-Präsenz und Reichweiten

Themenspezifische Datenbestände

Demokratieförderung

  • Bildungsmaßnahmen zur politischen Teilhabe
  • Monitoring von demokratiegefährdenden Entwicklungen
  • Medienkompetenzvermittlung
  • Diskriminierungserfahrungen (anonymisiert)

Soziale Gerechtigkeit

  • Präventionsmaßnahmen und deren Wirkung
  • Beratungsleistungen (anonymisiert)
  • Unterstützungsstrukturen für vulnerable Gruppen
  • Advocacy-Aktivitäten und Policy-Monitoring

Umwelt und Nachhaltigkeit

  • Umweltbildungsmaßnahmen
  • Nachhaltigkeitsprojekte und deren Ergebnisse
  • Ressourcenverbrauch von Organisationen
  • Klimaschutzaktivitäten

Vernetzungs- und Kooperationsdaten

Netzwerkstrukturen

  • Kooperationsbeziehungen zwischen Organisationen
  • Dachverbandsstrukturen
  • Internationale Vernetzungen
  • Wissensaustausch-Plattformen

Interessenvertretung

  • Stellungnahmen zu Gesetzgebungsverfahren
  • Lobbying-Aktivitäten (Transparenzregister)
  • Advocacy-Kampagnen und deren Reichweite
  • Policy-Briefings und Positionspapiere

Bildungs- und Qualifizierungsdaten

Weiterbildungsangebote

  • Schulungs- und Fortbildungsprogramme
  • Teilnehmerzahlen und Evaluationen
  • Kompetenzentwicklung im Sektor
  • Professionalisierungsgrade

Nachwuchsförderung

  • Programme für junge Engagierte
  • Karrierewege im dritten Sektor
  • Mentoring-Programme
  • Diversity-Maßnahmen

Forschungs- und Erhebungsdaten

Umfragen und Studien

  • Einstellungsforschung zu gesellschaftlichen Themen
  • Bedarfsanalysen für zivilgesellschaftliche Arbeit
  • Trendstudien zum Engagement
  • Methodische Innovations- und Evaluationsstudien

Monitoring-Daten

  • Kontinuierliche Beobachtung gesellschaftlicher Entwicklungen
  • Frühwarnsysteme für soziale Problemlagen
  • Qualitätssicherung in der Sozialarbeit
  • Wirkungsmonitoring von Interventionen

Damit Ihre Datensätze auffindbar und verständlich sind, benötigen sie eine strukturierte Beschreibung.

Pflichtfelder sind unter anderem:

  • Titel & Beschreibung
  • Themenkategorie (nach EU-Vokabular)
  • Herausgeber (Publisher)
  • Letzte Aktualisierung
  • Kontaktmöglichkeit (Name, Mail, ggf. Formular)
  • Lizenz (z. B. CC0, CC BY, CC BY-SA)

Empfohlene Zusatzangaben:

  • Schlagwörter
  • Veröffentlichungsdatum
  • Zeitliche und geografische Abdeckung
  • Sprache und Dateiformat
  • Geopolitischer Bezug (z. B. Kommune, Bundesland)

Der Datenatlas Zivilgesellschaft unterstützt offene, standardisierte Datenformate, die eine langfristige Verfügbarkeit und breite Nachnutzbarkeit ohne proprietäre Abhängigkeiten gewährleisten. Diese Formatauswahl entspricht den Open Data-Prinzipien und ermöglicht die Interoperabilität mit anderen Datenkatalogen gemäß DCAT-AP.de-Standard.

Strukturierte Datenformate

JSON

  • Offenes, textbasiertes Format
  • Weit verbreitet für APIs und Datenübertragung
  • Geeignet für hierarchische Organisationsstrukturen

XML

  • W3C-Standard, vollständig offen
  • Selbstbeschreibend durch Schema-Definition
  • Ideal für komplexe Metadatenstrukturen

YAML

  • Menschenlesbar und maschinenverarbeitbar
  • Keine proprietären Abhängigkeiten
  • Geeignet für Konfigurationsdaten

Geodatenformate

GeoJSON

  • Offener Standard für geografische Daten
  • Web-kompatibel und JSON-basiert
  • Ideal für Standorte zivilgesellschaftlicher Organisationen

KML

  • Open Geospatial Consortium (OGC) Standard
  • Für geografische Visualisierungen
  • Google Earth-kompatibel

Linked Data und Semantic Web

JSON-LD

  • Linked Data-Format basierend auf JSON
  • Unterstützt DCAT-AP.de-Metadatenstandard
  • Ermöglicht semantische Verknüpfungen

RDF/XML

  • W3C-Standard für Linked Data
  • Bereits in DCAT-AP.de-Spezifikation verwendet
  • Interoperabilität zwischen Datenkatalogen

Turtle (.ttl)

  • Kompakte RDF-Serialisierung
  • Menschenlesbar
  • Alternative zu RDF/XML

Textbasierte Formate

TSV (Tab-Separated Values)

  • Offene Alternative zu CSV
  • Reduziert Parsing-Probleme
  • Geeignet für tabellarische Daten

ODT (Open Document Text)

  • ISO-Standard (ISO/IEC 26300)
  • Für textuelle Dokumentation
  • Alternative zu proprietären Formaten

Unabhängig vom gewählten Format sollten bestimmte Grundprinzipien der Datenstrukturierung beachtet werden, um die Nutzbarkeit und Qualität der Daten zu gewährleisten. Diese Prinzipien haben sich in der Praxis bewährt und entsprechen internationalen Standards für Open Data.

Das Prinzip der Konsistenz besagt, dass gleiche Informationen immer auf die gleiche Weise codiert werden sollten. Dies betrifft nicht nur offensichtliche Aspekte wie Datumsformate, sondern auch subtilere Fragen wie die Schreibweise von Organisationsnamen oder die Kategorisierung von Aktivitäten. Inkonsistenzen erschweren die maschinelle Verarbeitung erheblich und können zu Fehlern in Analysen führen.

Die Verwendung kontrollierter Vokabulare und Standardkategorisierungen verbessert die Interoperabilität der Daten. Anstatt eigene Kategoriesysteme zu entwickeln, sollten Organisationen nach Möglichkeit etablierte Standards verwenden. Dies erleichtert die Verknüpfung mit anderen Datenquellen und macht die Daten für ein breiteres Publikum verständlich.

Die Granularität der Daten sollte so gewählt werden, dass sie verschiedene Aggregationsebenen ermöglicht, ohne unnötig komplex zu werden. Zu detaillierte Daten können Datenschutzprobleme verursachen und sind schwer zu verarbeiten, während zu aggregierte Daten die Analysemöglichkeiten einschränken. Die optimale Granularität hängt vom Verwendungszweck und der Sensibilität der Daten ab.

Die Behandlung fehlender Werte erfordert besondere Aufmerksamkeit, da verschiedene Analysewerkzeuge unterschiedlich damit umgehen. Die Unterscheidung zwischen "nicht erhoben", "nicht anwendbar" und "unbekannt" sollte explizit gemacht werden. Einfache Lösungen wie leere Felder oder Nullwerte können mehrdeutig sein und zu Fehlinterpretationen führen.

Nicht jede Organisation verfügt über eine eigene Plattform, um Datensätze öffentlich zugänglich zu machen. Das ist kein Hindernis – es gibt mehrere einfache und kostenfreie Wege, wie Sie Ihre Daten dennoch veröffentlichen und dauerhaft verfügbar machen können.

1. GitHub: Daten versionieren und offen bereitstellen

GitHub ist eine kostenlose Plattform zur Verwaltung und Veröffentlichung von Dateien – ursprünglich für Software, aber auch hervorragend geeignet für offene Daten.

So funktioniert es:

  • Erstellen Sie ein kostenloses Konto auf github.com.
  • Eröffnen Sie ein neues öffentliches „Repository“ (eine Art Datenordner).
  • Laden Sie Ihre Datendateien hoch (z. B. als CSV, GeoJSON, XLSX oder ZIP).
  • Schreiben Sie eine kurze README.md, die beschreibt, was der Datensatz enthält.
  • Geben Sie eine Lizenzdatei mit an (z. B. LICENSE.txt mit CC BY oder CC0).

Besonders geeignet für: Strukturierte Daten, kleinere Dateien, häufige Aktualisierungen und technische Nutzergruppen.

2. Zenodo: Datensätze mit DOI dauerhaft archivieren

Zenodo ist ein kostenloser wissenschaftlicher Datenrepositoriums-Dienst, betrieben von der Europäischen Kommission (CERN). Ideal für dauerhafte Archivierung und Zitation.

So funktioniert es:

  • Registrieren Sie sich unter zenodo.org.
  • Klicken Sie auf „Upload“.
  • Geben Sie Metadaten zum Datensatz an: Titel, Beschreibung, Autor*in, Schlagwörter.
  • Laden Sie Ihre Datei(en) hoch.
  • Wählen Sie eine Lizenz (z. B. CC0 für offene Daten).
  • Veröffentlichen Sie den Datensatz.

Besonderheit: Zenodo vergibt automatisch eine DOI (Digital Object Identifier) – eine dauerhafte, zitierfähige Adresse für Ihren Datensatz.

3. Eigene Website oder CMS nutzen

Falls Ihre Organisation ein eigenes Content Management System wie WordPress, Typo3, Drupal oder ähnliches verwendet, können Sie auch darüber Datensätze bereitstellen.

So geht’s:

  • Erstellen Sie eine neue Seite oder einen Beitrag im CMS.
  • Fügen Sie eine kurze Beschreibung des Datensatzes hinzu.
  • Laden Sie die Datei direkt hoch.
  • Wichtig: Ergänzen Sie Angaben zu Quelle, Aktualität, Lizenz und Format.

Hinweis: Stellen Sie sicher, dass die Datei öffentlich und ohne Anmeldung abrufbar ist – nur dann kann sie in den Datenatlas eingebunden werden.

4. FTP-Server

Wenn Ihre Organisation Zugriff auf einen eigenen Webserver oder Speicherplatz hat, können Sie Ihre Daten auch per FTP (File Transfer Protocol) bereitstellen.

So geht’s:

  • Laden Sie die Datendateien über ein FTP-Programm (z. B. FileZilla) auf Ihren Webspace.
  • Achten Sie darauf, dass die Dateien öffentlich zugänglich sind (z. B. unter  ihre-domain.de/daten/dataset.csv).
  • Dokumentieren Sie die Datei über eine begleitende HTML- oder TXT-Datei (Beschreibung, Format, Lizenz).
  • Der Link muss direkt zur Datei oder einer öffentlich zugänglichen Übersichtsseite führen.

Geeignet für: Größere Dateien, bestehende IT-Infrastruktur, einfache Veröffentlichung über die eigene Domain.