LIBREAS.Library Ideas

„Open Research Data – Open your data for research”. Notizen zur Netzwerkveranstaltung von Open-Access-Büro Berlin und digiS am 21.10.2019

Posted in Veranstaltungsberichte by maxiki on 31. Januar 2020

von Ben Kaden (@bkaden) & Maxi Kindling (@maxi_ki)

Die Netzwerkveranstaltung “Open Research Data – Open your data for research” wurde im Rahmen der International Open Access Week 2019 gemeinsam von Open-Access-Büro Berlin und digiS im Grimm-Zentrum der Humboldt-Universität zu Berlin veranstaltet. Sie war mit etwa 45 Teilnehmenden sehr gut besucht. Ziel der Veranstaltung war es, regionale und lokale Aktivitäten und Projekte in Berlin und Brandenburg mittels einer Posterpräsentation und durch Impuls-Beiträge sichtbar zu machen und die Akteure in einen Dialog zu bringen. Die Vernetzungsveranstaltung diente als Auftakt für eine Verstärkung der Aktivitäten des Berliner Open-Access-Büros im Themenfeld Forschungsdaten und damit einhergehend auch Kulturdaten. In der 2015 verabschiedeten Open-Access-Strategie für Berlin gehören Forschungsdaten und Kulturdaten neben wissenschaftlichen Textpublikationen zu den drei Schwerpunktthemen.

Forschungsdaten können prinzipiell alle Daten sein, die durch wissenschaftliche Tätigkeiten entstehen bzw. die für die wissenschaftliche Tätigkeit genutzt werden, so dass auch Kultur- und Verwaltungsdaten in den Call for Posters für die Veranstaltung eingeschlossen wurden:

“Es kann sich hierbei um Daten handeln, die im Forschungskontext entstanden sind, um Kulturdaten oder um Daten der öffentlichen Verwaltung, die für die Forschung von Interesse sein können. Die Datensammlungen sollten nach Möglichkeit alle Kriterien der Offenheit erfüllen: Finanziell, technisch und rechtlich uneingeschränkter Zugang sowie weitreichende Nutzungsmöglichkeiten.”

Eine erfreuliche thematische Breite von Aktivitäten und Projekten zu Forschungsdaten in Berlin und Brandenburg zeigte sich in der Sammlung von 15 Postern, die sowohl im Grimm-Zentrum präsentiert wurde als auch auf Zenodo veröffentlicht ist: Das Spektrum reicht vom “Berlin Open Data Portal” über offene Kulturdaten aus Brandenburger Museen bis hin zu Video- und Bilddaten aus wissenschaftlichen Projekten und Digitalisierungsmaßnahmen. Alle Poster der Sammlung „Open Research Data in Berlin und Brandenburg 2019“ können über Zenodo abgerufen werden.

Forschungsdaten sind traditionell nur begrenzt Teil des Publikationsoutputs in der Wissenschaft und als solche zudem in den Wissenschaftsdisziplinen und -feldern unterschiedlich weit verbreitet. Bereits die Datenveröffentlichung an sich ist oft eine Herausforderung für Forschende: Hier spielen datenschutzrechtliche oder ethische Bedenken ebenso eine Rolle wie fehlende Infrastrukturlösungen für eine adäquate Verbreitung oder die hohe technische Komplexität der Daten, die eine Beschreibung und Nachnutzung erschwert. Auch aus administrativer Sicht stellt die Frage “Wem gehören eigentlich die Daten?” Forschende vor Schwierigkeiten. Hinzu kommt, dass wir längst nicht mehr nur über die einfache Bereitstellung reden, sondern über verbindliche Qualitätsstandards sowie die Nachnutzbarkeit nach den Prinzipien der Offenheit und der FAIR-Prinzipien. Nicht zuletzt hängen Datenveröffentlichungen aber auch mit individuellen Motivationen und Bedenken sowie möglichen Anreizsystemen zusammen. Zugleich ist jedoch eine erhebliche Dynamik in diesem Bereich insbesondere auf der Nachfrageseite und damit auch eine Bedeutungsänderung für Forschungsdatenpublikationen in der Wahrnehmung wissenschaftlicher Tätigkeit festzustellen, wobei auch dies disziplinär sehr unterschiedlich ausgeprägt ist. “Anreize” (Incentives), die über die Vorgaben von Wissenschaftspolitik, Forschungsförderern und Institutionen zur Datenveröffentlichung hinausgehen, wurden im Rahmen der Netzwerkveranstaltung als zentrales Thema für Open Research Data adressiert. Neben einem Warm-Up, zu dem die Teilnehmenden sich untereinander über die Bedeutung von verschiedenen Anreizen für das Teilen von (Forschungs-)Daten austauschten, gab es vier Impuls-Beiträge.

 

Open Data LOM (Dr. Evgeny Bobrov, Open Data and Research Data Management Officer am QUEST Center des Berlin Institute of Health)

Evgeny Bobrov vom QUEST Center des Berlin Institute of Health präsentierte den neuen und wegweisenden Ansatz Open Data LOM für Forschende der Charité – Universitätsmedizin Berlin und des Max-Delbrück-Centrums für Molekulare Medizin (MDC). Dahinter steht das Setzen eines Anreizes für die offene Publikation von Originaldaten über die interne sogenannte “Leistungsorientierte Mittelvergabe” (LOM). Die Charité führt damit als erste medizinische Fakultät Open Data als Leistungsindikator ein. Offene Datenpublikationen, die in Zeitschriftenartikeln von AutorInnen der beiden Einrichtungen aus den Jahren 2017-2019 verknüpft sind, werden mit Zusatzmitteln belohnt. Ermittelt werden diese Publikationen mit Hilfe eines Text-Mining-Verfahrens, das zur Nachnutzung bereitgestellt wurde. Es setzt also die technische Auffindbarkeit der Daten voraus, d.h. die Textveröffentlichungen müssen um ein maschinenlesbares Supplement angereichert sein. Die Open Data LOM wird auch auf einem der Poster beschrieben. Die etwa 50 AutorInnen von knapp 100 aufgefundenen referenzierten Originaldatensätzen erhielten in dieser Phase des Vorhabens jeweils rund 1000 Euro. Neben den technischen Voraussetzungen ergeben sich für das Verfahren weitere Herausforderungen wie u. a. die Definition von Mindestkriterien, die eine Forschungsdatenbereitstellung erfüllen muss, damit entsprechend Zusatzmittel zuerkannt werden. Die Abwägung, wie frei, offen oder FAIR ein Datensatz für wen bereitgestellt werden sollte, fällt auch deshalb schwer, weil besonders im medizinischen Bereich bereits aus rechtlichen (vor allem datenschutzrechtlichen) Gründen Forschungsdaten nicht breit publiziert werden können. Daher wird als Ausgleich das Data Sharing unter Peers als Option berücksichtigt. Generell wünscht man sich aber, die Vorgaben der FAIR-Prinzipien so umfassend wie eben möglich einhalten zu können.

Policies als Anreize? (Boris Jacob, Zentrum für Informationstechnologie und Medienmanagement, Universität Potsdam)

Boris Jacob vom Zentrum für Informationstechnologie und Medienmanagement (ZIM) der Universität Potsdam betrachtete in seinem Impuls-Beitrag die Rolle von Datenpolicies. Er betonte, dass Policies allein als Anreize nicht ausreichen. Sie setzen eher einen allgemeinen Rahmen als wirkliche Anreize. Wichtiger für die Motivation zum verstärkten offenen Publizieren von Forschungsdaten wäre eine Veränderung des Publikationsverhaltens bzw. der institutionellen Publikationskultur, wofür konkrete Steuerungsschritte und eine wirksame Strategie der jeweiligen Einrichtungen vorliegen müssen. Die Universität Potsdam hat im Rahmen des Projekts FD-Mentor ein Referenzmodell für Strategieprozesse im institutionellen Forschungsdatenmanagement entwickelt. Die Forschungsdaten-Policy der Universität Potsdam wurde im September 2019 frisch verabschiedet.

Öffnung von Kulturdaten (Philippe Genêt, Projektleitung Coding da Vinci)

Philippe Genêt von der Geschäftsstelle von Coding Da Vinci betrachtete Daten aus der Perspektive des Zugangs zu Kulturdaten. Openness meint für ihn Zugang zu diesen, um damit auch außerhalb konkreter wissenschaftlicher Arbeit eine Aktivierung, Nutzung und Mehrwerte zu erzeugen. Wichtig ist dabei – ähnlich wie in der Wissenschaft, aber doch aufgrund der Reichweite und Zielstellung des Ansatzes anders gelagert – die Datenqualität. Damit ist vermutlich auch ein allgemeingültiger Aspekt benannt: Offene Daten, die nutzbar sein sollen, benötigen notwendig eine Standardisierung und damit in Zusammenhang stehend eine Qualitätssicherung. Die entsprechende Aufbereitung und Qualitätssicherung bringt den datenliefernden Akteuren allerdings zunächst vor allem eines: viel Arbeit. Zugleich befürchten sie – abnehmend, aber nach wie vor ausgeprägt – mit der Öffnung ihrer Datenbestände einen Kontroll- und möglicherweise auch Deutungsverlust. Die Zurückhaltung auf diesem Feld bei der Bereitstellung offener Daten erklärt sich demnach aus der Sorge, die eigene Rolle und vielleicht auch Legitimierung der institutionellen Existenz zu schwächen und zugleich zusätzlich erheblich Aufwand investieren zu müssen. Gemeingutdiskurse haben dafür eine Antwort: Die abstrakte Gefahr beispielsweise einer ungewünschten Nutzung eines Datensatzes wird durch die tatsächliche Möglichkeit einer Vielzahl von neuen, konstruktiven, kreativen, die Kultur bereichernden Nutzungen maßgeblich aufgefangen. Die Herausforderung besteht jedoch darin, diese An- und Einsicht in eine institutionell wirksame und rechtssichere Form zu übersetzen.

Datenpublikationen aus der Perspektive des Vorhabens NFDI4Culture (Prof. Dr. Dörte Schmidt, Professorin für Musikwissenschaft, Universität der Künste Berlin)

Möglicherweise relativieren sich solche Ängste durch eine stärkere Vernetzung und neue Formen der Kooperation, aus denen sich auch neue Rollenbilder und Aufgabenprofile ergeben. Die Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI) können eine solche Entwicklung darstellen und abbilden. Dörte Schmidt, Professorin für Musikwissenschaft der Universität der Künste, präsentierte in diesem Zusammenhang Überlegungen aus dem beantragten NFDI-Konsortium NFDI4Culture. Sie plädiert nachdrücklich für eine überinstitutionelle Adressierung der Herausforderungen, zu denen freilich eine traditionell eher selbstbezogene Herangehensweise der Kulturinstitutionen auch an ihre Bestände zu überwinden wäre. Wichtig ist heute und auch für das Gelingen von Ansätzen wie der NFDI eine stärkere Orientierung auf die Vermittlung, die über reine Digitalisierungsschritte und eine Leseansicht für Digitalisate hinausreicht.

Lessons learned

In Gesprächen und Diskussionen im Kontext der Veranstaltung wurde deutlich, dass die gemeinsame Betrachtung von Kultur- und Verwaltungsdaten unter dem Begriff Forschungsdaten nicht immer selbstverständlich ist. Begriffliche Auseinandersetzungen sind demzufolge weiterhin ein wichtiger Aspekt für zukünftige Aktivitäten – gerade wenn es um die Vernetzung von Akteuren aus unterschiedlichen Domänen geht. Aus Perspektive der Öffnung von Daten mag man für eine diskursive Abgrenzung der drei Kategorien

  • Daten, die im Zuge wissenschaftlicher Vorhaben entstehen (in der Regel als “Forschungsdaten” bezeichnet),
  • Kulturdaten und
  • Verwaltungsdaten

unterscheiden. Mit Blick auf die Datennutzung war eine wichtige Botschaft dieser Veranstaltung, dass es nicht sinnvoll ist, Daten domänenspezifisch einzuhegen. Forschungsdaten sind per se gewissermaßen so neutral, dass sie aus unterschiedlichen Perspektiven und auch in heute noch unbekannten Nutzungskontexten für die Forschung relevant werden können. Gleichwohl sind die Entstehungsprozesse und damit eng verbunden die Maßnahmen zu ihrer Kuratierung in den Domänen sehr unterschiedlich und haben entsprechend Auswirkungen auf die Möglichkeiten ihrer Veröffentlichung.

Eine vierte Kategorie wäre mit den Industrie- bzw. Wirtschaftsdaten zu ergänzen, dürfte aber auf absehbare Zeit für eine offene Bereitstellung kaum eine Rolle spielen. Zugleich können jedoch Akteure der Wirtschaft (Stichworte: App-Entwicklung, Start-Ups) von offenen Daten aus anderen Domänen profitieren. Das Ideal der Nutzbarkeit und Nutzung offener Daten aller Domänen durch Wissenschaft, Gesellschaft und Wirtschaft ist tief in der Vision von Open Science verankert.

Die entscheidende Hürde ist und bleibt auch perspektivisch über alle Domänen hinweg das juristische Management von Forschungsdaten und Forschungsdatenpublikationen. Ein Rechtemanagement kann zwangsläufig nur vor dem Hintergrund aktueller Rechtslagen gestaltet werden. Diese ändern sich jedoch in der Zeit. Für die Langzeitverfügbarhaltung von Forschungsdaten – ebenso vermutlich auch für andere digitale Publikationsinhalte – sind Workflows und Lösungen zu entwickeln, die die Vereinbarkeit der Publikationen mit den jeweils geltenden Rechtslagen absichern. Eine standardisierte Lösung kann es nur temporär geben, weshalb Dörte Schmidt nachdrücklich für ein “flexibles Rechtemanagement” warb, das auch im Konsortium NFDI4Culture so berücksichtigt werden soll.

Für die Weiterentwicklung der Berliner Open-Access-Aktivitäten in Richtung Open Science sind viele Faktoren von Bedeutung, die sich im Rahmen der Vernetzungsveranstaltung zeigten: Ein Kulturwandel im Bereich der Forschungsdatenpublikation kann nur dann gelingen, wenn sich möglichst viele Forschende, Kulturtreibende und OA-Aktivist*innen der Verwaltung und Infrastruktur angesprochen fühlen, indem sie den Nutzen für die Gemeinschaft und das eigene Arbeiten erkennen. Anreize können hier wichtige Impulse setzen – die Etablierung von Anreizen und Reputationsmechanismen steht hier aber erst am Anfang. Verschiedene Ansätze müssen erprobt und vor allem sichtbar gemacht werden, so dass ihre Übertragbarkeit geprüft werden kann. Darüber hinaus werden Unterstützung in rechtlichen Fragen und möglichst umfassende und in den Forschungsprozess integrierte infrastrukturelle Services zur Veröffentlichung nach dem viel zitierten Ansatz: “Soviel wie möglich, so eingeschränkt wie nötig” benötigt, die die Datenprovinienzen und die Datenkulturen der Domänen und Disziplinen berücksichtigen. Der Austausch und die Vernetzung über Domänen und Disziplinen hinweg kann hier wechselseitig wichtige Anstöße und Ideen liefern.

Quellen

Senat von Berlin (2015): Open-Access-Strategie für Berlin. DOI: http://dx.doi.org/10.17169/refubium-26319

„Open Research Data in Berlin und Brandenburg 2019“. Poster Collection. https://zenodo.org/communities/oa-berlin-brandenburg-2019/

Hartmann, Niklas; Jacob, Boris & Weiß, Nadin (2019): RISE-DE – Referenzmodell für Strategieprozesse im institutionellen Forschungsdatenmanagement (Version 0.9). Zenodo. http://doi.org/10.5281/zenodo.2549343

Kip, Miriam; Bobrov, Evgeny; Riedel, Nico; Scheithauer, Heike; Gazlig, Thomas; Dirnagl, Ulrich (2019): Einführung von Open Data als zusätzlicher Indikator für die Leistungsorientierte Mittelvergabe (LOM) Forschung an der Charité – Universitätsmedizin Berlin. https://doi.org/10.5281/zenodo.3511191

Universität Potsdam: Forschungsdaten-Policy der Universität Potsdam. 25.09.2019. URL: https://www.uni-potsdam.de/de/forschungsdaten/richtlinien/universitaet/policy.html

Wilkinson et al. (2016): The FAIR Guiding Principles for scientific data management and stewardship. In: Scientific Data 3 (2016). http://www.doi.org/10.1038/sdata.2016.18