Quelle: https://dataedo.com/cartoon/data-vs-metadata-4
Bei Metadaten handelt sich um „strukturierte Informationen über andere Daten bzw. Ressourcen und deren Merkmale“ (siehe https://forschungsdaten.info/praxis-kompakt/glossar/).
Als Ressourcen sind hier v.a. Forschungsdaten gemeint, aber auch für Publikationen, Poster, Abstracts und weitere wissenschaftliche Veröffentlichungen spielen Metadaten eine bedeutende Rolle. Metadaten erleichtern das Auffinden in Suchmaschinen und Repositorien und das Instituts- und disziplinübergreifende Verständnis vorliegender Forschungsdaten und machen ihre Interpretation und eine spätere Nachnutzung durch andere Personen überhaupt erst möglich. Vor allem in großen mehrjährigen Forschungsprojekten mit verschiedenen Mitarbeitenden erleichtert das einheitliche Verwenden von Metadaten das Verständnis über die erstellten und gespeicherten Forschungsdaten enorm. Sie bieten Kontext und Zusatzinformationen zu vorhandenen Daten und sind damit im weitesten Sinne „Daten über Daten“.
Die Vergabe von Metadaten ist ein Baustein zur Umsetzung der FAIR-Prinzipien bei der Veröffentlichung von Forschungsdaten. Die FAIR-Prinzipien sollen die Auffindbarkeit, die Zugänglichkeit, die Interoperabilität und die Wiederverwendbarkeit von Forschungsdaten sicherstellen.
Metadaten sollen zumindest bei den folgenden Fragen (analog den 5W1H-Fragen) helfen, Antworten zu liefern:
Wer hat die Daten erstellt?
Was ist der Inhalt der Daten?
Wann wurden die Daten erstellt?
Wo wurden die Daten erstellt (Koordinaten)?
Wie wurden die Daten erstellt?
Warum wurden die Daten erstellt?
Es gibt verschiedene Arten von Metadaten. Dabei wird zwischen bibliographischen und administrativen für alle Formen von Forschungsdaten unterschieden, hinzukommen je nach Fachdisziplin noch Prozessmetadaten sowie inhaltsbeschreibende bzw. deskriptive Metadaten (vgl. siehe https://forschungsdaten.info/themen/beschreiben-und-dokumentieren/metadaten-und-metadatenstandards/)
Arten von Metadaten | Beispiele | Ziele |
---|---|---|
Bibliografisch | Titel, Autor_innen/Mitwirkende, Abstract, Keywords, Sprache, Identifier | Ermöglichen die Zitation der Daten, Dienen der Auffindbarkeit und thematischen Eingrenzung |
Administrativ | Datum/Zeitpunkt, Ort/Koordinaten, Nutzungsrechte/Lizenzen, Zugriffsrecht, Dateiformat, Dateigröße | Helfen bei der Verwaltung der Daten und deren langfristiger Erhaltung |
Prozessmetadaten | Projekt, Methodik, Arbeitsschritte, Hilfsmittel, Geräte/Instrumente, Anwendungsprogramme | Aufzeigen der verwendeten Methoden und Hilfsmittel bei der Entstehung und Verarbeitung der Daten |
Inhaltsbeschreibende bzw. deskriptive | Fachbegriffe, domänenspezifisches Wissen, Kontextinformationen | Disziplinspezifische Auskunft über zusätzliche Informationen zu Inhalt und Entstehung der Daten |
Tipp: Vergeben Sie Metadaten am besten direkt beim Entstehen der Forschungsdaten. Je größer das Forschungsvorhaben ist und je komplexer und variantenreicher die anfallenden Daten sind, desto schwieriger wird es, dies im Nachhinein zu rekonstruieren.
Es gibt verschiedene Möglichkeiten Metadaten zu erfassen und im Zusammenhang mit den Daten zu speichern:
Da die meisten der genannten Möglichkeiten nur begrenzte Informationen liefern können, ist ein sinnvolles Zusammenspiel zu empfehlen. Redundante Angaben können dabei nicht vermieden werden, dienen aber dem Abgleich und dürfen sich nicht widersprechen.
Werden Metadaten nicht nur menschen-, sondern auch maschinenlesbar erstellt, können diese Informationen mittels Schnittstellen über verschiedene Systeme hinweg verknüpft und ausgetauscht werden und erfahren dadurch eine größere Verbreitung. Dabei können Metadaten unabhängig oder zusammen mit den eigentlichen Forschungsdaten gespeichert werden. Zum Beispiel ist das Erstellen einer ReadMe-Datei sinnvoll.
Durch die Nutzung von Tools zur (automatischen) Vergabe von Metadaten kann die Arbeit erheblich erleichtert und die Qualität der Dateneinreichung verbessert werden. Für generische Metadaten eigenen sich folgende Services:
Dieses Videotutorium von FDM Bayern (2020) zeigt die Beschreibung von Forschungsdaten durch die Nutzung des DataCite-Metadatengenerators und des DataCite-Best-Practice-Guides: https://youtu.be/y7XulIpa6gk
Folgende Grundsätze sind beim Thema Metadaten zu empfehlen:
1. Vergeben Sie ausreichend Metadaten, v.a. Identifier.
2. Nutzen Sie vor allem einheitliche Metadaten aus einem Metadatenstandard.
3. Nutzen Sie automatische Tools zur Metadatenvergabe.
4. Nutzen Sie möglichst einen fachspezifischen Metadatenstandard.
5. Vergeben Sie so viele deutsche und englische Metadaten wie möglich, um eine gute Auffindbarkeit zu gewährleisten – auch über die notwendigen Angaben in Repositorien oder Elektronischen Laborbüchern hinaus.
6. Vergeben Sie Metadaten an allen zur Verfügung stehenden Orten (unter Umständen redundant, aber nicht widersprüchlich); z.B. in den Forschungsdaten selbst, in einer ReadMe-Datei oder auf der Landing Page der Datensätze.
7. Erstellen Sie maschinenlesbare Metadaten, z.B. durch eine ReadMe-Datei.
8. Achten Sie auf die verschiedenen Ebenen bei der Erfassung von Metadaten, also die zutreffenden Angaben für die einzelne Datei oder für einen größeren Datensatz bzw. Gruppe von Dateien oder für ein Forschungsprojekt im Ganzen.
9. Verwenden Sie möglichst auch kontrollierte Vokabulare und Normdaten zur Referenzierung Ihrer Forschungsdaten.
Siehe auch den Entscheidungsbaum zu Metadaten vom Projekt FDM-ndsHAW: „Schwere Entscheidung – Wie gehe ich mit Metadaten um?“ https://zenodo.org/records/15396322
Best-Practice-Beispiel aus dem Forschungsalltag zur Verwaltung von Daten und Metadaten: Interview mit Dipl.-Inf. Colin Fischer, Datenmanager im Graduiertenkolleg „Integrität und Kollaboration in dynamischen Sensornetzen“ (i.c.sens) im Rahmen der Reihe Data Champions an der Gottfried Wilhelm Leibniz Universität Hannover (LUH)