FAIR-Prinzipien

Richtlinien für Forschungsdatenmanagement nach den Kriterien Findability - Accessibility - Interoperability - Reuse (FAIR) From Wikipedia, the free encyclopedia

Die internationalen FAIR-Prinzipien sind Leitlinien für die Beschreibung, Speicherung und Veröffentlichung wissenschaftlicher oder Verwaltungsdaten.

FAIR principles

FAIR ist ein Akronym für:

  • Findable – auffindbar
  • Accessible – zugänglich
  • Interoperable – interoperabel
  • Reusable – wiederverwendbar

Die internationalen FAIR-Prinzipien wurden 2014 bei einem Treffen in Leiden formuliert.[1] Zwei Jahre später, nach einer offenen Konsultation, wurden die FAIR-Prinzipien veröffentlicht.[2] Die Prinzipien dienen als Richtlinien, um Daten unter klar beschriebenen Bedingungen für die Wiederverwendung durch Menschen und Maschinen geeignet zu machen. Es handelt sich bewusst um Grundsätze und nicht um Normen. Der Grund dafür ist, dass sich Daten und die Art ihrer Verarbeitung von einem wissenschaftlichen Bereich zum anderen unterscheiden. Die verschiedenen Bereiche können ihre eigenen Standards auf der Grundlage der FAIR-Grundsätze entwickeln. Mehrere Organisationen und Disziplinen nutzen seitdem FAIR-Standards, um Tools und Schulungen zu entwickeln.[3] Seit der Veröffentlichung der FAIR-Prinzipien werden diese nun auch für Software, Arbeitsabläufe, wissenschaftliche Dienstleistungen und für die Verwaltungs- und Gesundheitsdigitalisierung als anwendbar angesehen. Sie sind ein wichtiger Baustein für die Nachnutzbarkeit von Forschungsdaten und damit für Open Science.

Abgrenzung und Zielsetzung

Die FAIR-Prinzipien sind nicht gleichbedeutend mit „Open Data“. FAIR beschreibt, wie digitale Forschungsobjekte (insbesondere Daten und ihre Metadaten) so gestaltet werden, dass sie unter klaren Bedingungen auffindbar, zugänglich, interoperabel und wiederverwendbar sind – auch dann, wenn der Zugriff auf die Daten aus rechtlichen, ethischen oder sicherheitsbezogenen Gründen eingeschränkt ist.[4] Ein zentrales Ziel ist dabei die Machine-actionability, also die Fähigkeit, dass Computersysteme Daten (und Metadaten) mit keiner oder nur minimaler menschlicher Intervention finden, abrufen, kombinieren und nachnutzen können.[5]

Die Prinzipien beziehen sich nicht nur auf „Daten“ im engen Sinne, sondern auch auf weitere digitale Forschungsobjekte wie Software, Workflows oder Werkzeuge, sofern diese als wiederverwendbare digitale Ressourcen veröffentlicht werden.[4]

Prinzipien

Die vier Abkürzungen wurden zu 15 Prinzipien weiterentwickelt:[2]

F – auffindbar

  • F1 (Meta-)Daten sind mit einem weltweit eindeutigen und dauerhaften persistent identifier (dauerhaften Kennung) versehen.
  • F2 Daten werden mit umfangreichen Metadaten beschrieben (siehe R1).
  • F3 Metadaten enthalten klar und eindeutig den Identifier der Daten, die sie beschreiben.
  • F4 (Meta-)Daten sind in einer durchsuchbaren Ressource registriert oder indiziert.[4]

A – zugänglich

  • A1 (Meta-)Daten können anhand ihrer Identifizierung über ein standardisiertes Kommunikationsprotokoll abgerufen werden.
    • A1.1 das Protokoll ist offen, frei und universell implementierbar.
    • A1.2 das Protokoll ermöglicht bei Bedarf ein Authentifizierungs- und Autorisierungsverfahren.
  • A2 – (Meta-)Daten sind zugänglich, auch wenn die Daten nicht mehr verfügbar sind.[4]

I – interoperabel

  • I1 (Meta-)Daten verwenden eine formale, zugängliche, gemeinsame und weithin anwendbare Sprache zur Wissensdarstellung.
  • I2 (Meta-)Daten verwenden Vokabulare, die den FAIR-Grundsätzen entsprechen.
  • I3 (Meta-)Daten enthalten qualifizierte Verweise auf andere (Meta-)Daten.[4]

R – wiederverwendbar

  • R1 (Meta-)Daten haben mehrere genaue und relevante Attribute.
    • R1.1 (Meta-)Daten werden mit einer klaren und zugänglichen Datennutzungslizenz freigegeben.
    • R1.2 (Meta-)Daten sind mit ihrer Herkunft verbunden.
    • R1.3 (Meta-)Daten entsprechen den für den Bereich relevanten Gemeinschaftsstandards.[4]

FAIR in Verbindung mit offenen Prinzipien

Die Verwendung von offenen Ansätzen in der Wissenschaft, Gesundheit und Verwaltung verbindet:

  • Offenlegung von Daten, um z. B. diese in anderen Kontexten wieder zu nutzen oder mit eigenen Analysen zu vergleichen. Ein Beispiel ist die Offenlegung sowie das Finden, Teilen und Referenzieren von Open Government Data-Verwaltungsdaten, z. B. mittels des international DCAT-Standards.[6]
  • Open-Source-Code wird z. B. verwendet, um eine Datenanalyse durchzuführen. Dieser Code wird durch die Offenlegung für andere Wissenschaftler reproduzierbar und man kann diesen analog auf weitere Daten anwenden. Ferner kann die syntaktische Struktur der Datenanalyse mit Open-Source-Code von einer Programmiersprache A in eine andere Programmiersprache B übertragen werden. Beim Übertragen kann man Tests durchführen, ob die Datenanalyse in Programmiersprache B die gleichen Resultate liefert.
  • Open Educational Resources können verwendet werden, um andere Wissenschaftler in die Lage zu versetzen, mit dem Open-Source-Code und den verfügbaren Daten eine strukturgleiche Analyse mit eigenen Daten umzusetzen. Diese Bildungsressourcen können. technischer Art oder methodischer Art sein oder über die mit den Metadaten kodierten Informationen hinausgehen.
  • Grenzen und Herausforderungen: Insbesondere die Umsetzung der FAIR-Prinzipien in der wissenschaftlichen Praxis gestaltet sich als herausfordernd. Rechtliche und ethische Anforderungen, wie der Schutz personenbezogener Daten, können die vollständige Offenheit von Forschungsdaten einschränken. Zudem können sich Datenformate, Standards und Praktiken zwischen verschiedenen wissenschaftlichen Disziplinen unterscheiden, was eine einheitliche Umsetzung erschwert. FAIR bedeutet daher nicht automatisch, dass Daten ohne Einschränkungen offen zugänglich sind. Vielmehr geht es darum, dass sie unter klar definierten Bedingungen nachnutzbar gemacht werden.[7]

Siehe auch

Einzelnachweise

Related Articles

Wikiwand AI