Dies ist eine alte Version des Dokuments!
Terminologien und Normdaten
Was sind Terminologien / Ontologien?
Metadatenschema geben eine Struktur für Metadaten vor. Sie legen fest, welche Angaben in welchem Format erfasst werden sollen. Terminologien standardisieren den Inhalt bestimmter Metadatenfelder, d.h. sie bilden Wortlisten, aus denen man wählen kann. So können zum Beispiel unterschiedliche (oder auch fehlerhafte) Schreibweisen vereinheitlicht werden. Sie eigenen sich gut, um innerhalb eines Forschungsprojektes die Verwendung von Begriffen festzulegen und damit einheitlich zu verwenden. Dabei kann die inhaltliche Breite und Tiefe solcher kontrollierten Vokabulare sehr unterschiedlich sein:
Ontologien sind v.a. relevant bei der maschinellen Verarbeitung großer Datenmengen mittels KI.
Einen Überblick über bestehende Terminologien gibt das Basic Register of Thesauri, Ontologies and Classifications BARTOC.
Weitere Beispiele für kontrollierte Vokabulare:
- Linked Open Vocabularies (LOV) vor allem für den ingenieurwissenschaftlichen Bereich
- Umweltklassifikation und der Umweltthesaurus vom Umweltbundesamt
- Thesaurus für die Sozialwissenschaften von GESIS: https://lod.gesis.org/thesoz/de/]
- Physics Subject Headings (PhySH): https://physh.aps.org/]
- Mathematics Subject Classification (MSC): https://mathscinet.ams.org/msc/msc2010.html]
- Art and Architecture Thesaurus (AAT): http://www.aat-deutsch.de/]
- Medical Subject Headings (MeSH): https://www.nlm.nih.gov/mesh/]
- Standard Thesaurus Wirtschaft (STW): https://zbw.eu/stw/version/latest/about.de.html]
Darüber hinaus ist auch die Verwendung von Normdaten zur Beschreibung von Forschungsdaten sinnvoll. Im Unterschied zu den oben genannten Vokabularen, haben Normdaten jeweils eigene IDs, die diese eindeutig referenzierbar machen. Vor allem in der maschinellen Verarbeitung und dem Austausch von Daten zwischen verschiedenen Systemen können Normdaten eindeutig interpretiert werden.
Beispiel für Normdaten:
- GND – Gemeinsame Normdatei der Deutschen Nationalbibliothek https://explore.gnd.network/
- Geonames für geographische Begriffe
- ORCID für Personendaten
- Open Funder Registry für Forschungsförderer und deren geförderte Projekte
Auch die NFDI [Link zum Wiki-Artikel] (Nationale Forschungsdateninfrastruktur für Deutschland) hat den Wert von Ontologien und Terminologien erkannt und viele Konsortien bieten eigene Lösungen an bzw. arbeiten derzeit an eigenen Lösungen:
NFDI4Biodiversity: Konsortium für Biodiversität und Umweltdaten: Terminologie-Service (teilweise noch Work in Progress) https://terminologies.gfbio.org/
NFDI4Cat: NFDI für Wissenschaften rund um Katalyse: Ontologie Sammlung https://www.nfdi4cat.org/services/ontologie-sammlung/ + (Mate-)Datenstandards basierend auf Use Cases in Planung
NFDI4Chem: Chemistry Consortium in the NFDI: Terminology Service https://terminology.nfdi4chem.de/ts/
NFDI4Culture: Konsortium für Forschungsdaten zu materiellem und immateriellem kulturellem Erbe: Antilope zur Terminologie-Suche https://service.tib.eu/annotation/
NFDI4DataScience: NFDI for Data Science and Artificial Intelligence: Nutzung von ORKG https://orkg.org/
NFDI4Energy: NFDI für die interdisziplinäre Energiesystemforschung: Metadatenregister für Digitale Objekte in Planung
NFDI4Ing: NFDI für Ingenieurwissenschaften: Ontologie-Sammlung https://terminology.nfdi4ing.de/ts/
NFDI4Mat: NFDI für Materialwissenschaft und Werkstoffkunde: Ontologie-Service in Planung
NFDI4Microbiota: Konsortium für Microbiota-Forschung: (Meta-)Datenstandards und Terminologie-Service in Planung
BERD@NFDI: NFDI für Betriebswirtschaftslehre, Volkswirtschaftslehre und verwandte Daten: Ontologie-Dienst für Daten deutscher Unternehmen (Work in Progress)
FAIRagro: FAIRe Dateninfrastruktur für die Agrosystemforschung: Terminologie-Service in Planung
Text+: Konsortium für text- und sprachbasierte Forschungsdaten: föderierte Metadaten- und Dateninfrastruktur in Planung
Quelle: NFDI-N(HAW)igator, Stand: 03/2025