LIBREAS.Library Ideas

Warum die Publikation von Forschungsdaten nach wie vor ein begrenztes Phänomen bleibt.

Posted in LIBREAS.Referate by Ben on 5. April 2017

Eine Notiz im Anschluss an

Jens Klump: Data as Social Capital and the Gift Culture in Research. In: Data Science Journal. 16, p.14. DOI: http://doi.org/10.5334/dsj-2017-014

von Ben Kaden (@bkaden)

Wer sich mit dem Thema der Forschungsdatenpublikation befasst, kann die Lücke zwischen allgemeinen in Forschungsdaten-Policies verkündeten Anspruch an einen offenen Zugang zu diesen Daten und der Wissenschaftspraxis nicht übersehen: Trotz aller wohlbegründeten Argumente ist die Zahl der publizierten Datensätze sehr überschaubar. Andererseits ist das Konzept der Forschungsdatenpublikation nur dann wirklich nachhaltig und sinnvoll, wenn solche Veröffentlichungen nicht insular und aus dem Enthusiasmus einzelner Forschender heraus geschehen, sondern dort, wo sie sinnvoll sind, ein Eckstein wissenschaftlichen Austauschs bilden. Wissenschaft lebt von Systematizität. Wenn Forschungsdatensätze eher zufällig auf einem Repositorium landen, ist es sicher besser als keine Verfügbarkeit. Aber es ist eben nicht wissenschaftlich und ähnelt im Fall einer Nachnutzung eher dem glücklichen Zufallsfund im Archiv, während der Normalfall bleibt, dass man keine Daten für seine Forschungsfrage findet. Auch wenn es eigentlich welche gäbe.

Gemeinhin werden drei Gründe für Forschungsdatenpublikationen benannt: Forschungstransparenz, Nachnutzung und der Erwerb wissenschaftlicher Reputation. Abgesehen von ethisch besonders motivierten Publizierenden dürfte vor allem der Aspekt einer die Anrechenbarkeit von Forschungsdatenpublikationen als wissenschaftliches Kapital der Schlüssel zu einer weiteren Verbreitung sein. Insofern ist es unter anderem wichtig, Datenpublikationen so zitier- und verfügbar zu halten, wie es auch Aufsatzpublikationen sind. Die übergeordnete Sachlage ist aber selbstverständlich komplexer.

In einem aktuellen Aufsatz für das Data Science Journal geht nun Jens Klump der Frage nach, weshalb Data-Sharing-Policies bisher nur begrenztes Echo in den Fachkulturen und ihren Kommunikationspraxen finden. Er nähert sich der Frage wissenschaftssoziologisch und argumentiert nachvollziehbar, dass es nicht ausreicht, Forschungsdateninfrastrukturen aufzubauen. Vielmehr, so lässt sich ergänzen, sind diese eine Basisanforderung, um Data-Sharing-Praxen zu stimulieren. Entscheidend ist jedoch eigentlich, die Verfassung des sozialen Systems der Wissenschaft als eine „Reputation Economy“ zu verstehen und aus diesem Verständnis heraus passende Ansatzpunkte für Anreize zu setzen. Der einschlägigen Infrastrukturforschung bescheinigt Jens Klump dahingehend Defizite. Wenn also in der Reputationsökonomie der Wissenschaft die eigenen wissenschaftlichen Handlungsmöglichkeiten (z.B. über Fördermittel und Anstellungen) mittels kommunikationsbasierten Erwerb von Reputation und wissenschaftlichem Status gesichert und ausgebaut werden, dann sollte das Phänomen der Forschungsdatenpublikation folgerichtig in dieses System grundlegend integriert werden.

Interessant ist nun die durch den Übergang von einer vorwiegenden Individualwissenschaft zu einer Kollaborationswissenschaft (oft, aber nicht nur, in Gestalt von Großforschung) auftretende Verschiebung der Anforderungen. Im zweiten Fall bedarf es für eine Karriere mehr als Reputation – es gilt die Balance zwischen Reputationsgewinnen und Kollaborationsgewinnen zu finden. Man muss also in der kollaborativen Forschung nicht nur als Individuum wissenschaftlich hochklassig arbeiten, sondern zugleich an den richtigen Punkten ein geschickter Teamspieler sein.

Zwangsläufig betonen und belohnen, wie auch Jens Klump herausstellt, kollaborativ orientierte Fachkulturen das Teilen von Forschungsressourcen und also auch Forschungsdaten stärker als Kulturen, in denen der Schwerpunkt hauptsächlich auf  dem Reputationsgewinn des einzelnen Forschers liegt. Zieht man dies heran, erklärt sich auch das Spannungsverhältnis zwischen den sehr auf Kollaboration gerichteten Digital Humanities und den traditioneller ausgerichteten Geisteswissenschaften, bei denen sich Forschende häufig selbst als primär Werkschöpfende mit allen Ansprüchen an eine so genannte „Werkherrschaft“ sehen. Die aktuellen deutschen Urheberrechtsdebatten (Stichwort Publikationsfreiheit.de) könnten also maßgeblich von der Sorge um Reputationseinbußen getrieben werden. Zugleich stehen sie deutlich erkennbar den Ansprüchen kollaborationsorientierter Wissenschaft entgegen. Während die traditionellen Individualwissenschaften Erkenntnis primär zentriert auf den individuellen Forscher als Erkennenden (und idealweiser Ersterkennenden) gelesen und interpretiert haben, fokussieren, so eine natürlich etwas verkürzte Deutung, Kollaborationskulturen viel stärker den Forschungsgegenstand und das Erkenntnisziel als Fixpunkte. Sie behandeln die Forschenden zwar nicht als beliebig austauschbar, aber doch als stärker hinter die Forschungsziele zurücktretend. Ist das eigentliche Ziel nun idealerweise der Erkenntnisfortschritt selbst, so scheint es auch deutlich plausibler und vermittelbarer, dass zum Beispiel die Bereitstellung von Forschungsdaten für die Community im Sinne dieses Fortschritts stärker zu gewichten ist, als der individuelle Anspruch als Erheber dieser Daten auch eine umfassende Datenherrschaft ausüben zu können.

Individualwissenschaftliche Praxen knüpfen dagegen stärker die Originalität einer Erkenntnis an die konkrete forschende und erkennende Person als Urheber. Zu viel Transparenz oder gar die Bereitstellung der eigenen Datengrundlage (zum Beispiel in Form von Annotationen) für ähnlich motivierte Forschende (=Konkurrenten) wird zwangsläufig als erhebliche Preisgabe wissenschaftlichen Kapitals gesehen, aus dem das soziale Kapital gewonnen wird, mit man seine Karriere macht.

Einen Sonderfall stellt die Auftragsforschung dar, wenn sie das Ziel des Intellectual Property mit Teamforschung verbindet und zum Beispiel Patentierbarkeit des Erkenntnisproduktes anstrebt. Dann greifen ähnliche Zurückhaltungsmechanismen und eine Preisgabe u.a. der Datengrundlage oder auch der Verfahrensbeschreibung ist vor Sicherung des Patents und damit des rechtlich stabilisierten Verwertungsanspruchs unbedingt zu vermeiden.

Mit der Zunahme von Public-Private-Partnership-Projekten verkompliziert sich die Frage nach den Anreizen zum Teilen von Forschungsdaten demnach zusätzlich. Wissenschaft ist somit keinesfalls als isoliertes soziales System zu betrachten, auch wenn diese Sicht zunächst einmal hilft, um über die Idee einer idealtypischen Reputationsökonomie nach den passenden Interventionspunkten zugunsten einer stärkeren Öffnung wissenschaftlicher Arbeit zu suchen. Die Kommodifizierung der Erkenntnisproduktion verlagert den als für das wissenschaftliche Verhalten bestimmend definierten Peer Pressure in stärker rechtlich regulierte Bedingungen. Für denkbare Anreize zum Teilen von Forschungsdaten und -verfahren muss dies nicht schlecht sein, weil man auf rechtlichem Wege stärker auch verbindliche Mandatierungen anstreben kann – so wie die Nicht-Veröffentlichung bereits jetzt bei der Auftragsforschung klar mandatiert wird.

Abgesehen davon ist es zweifellos nach wie vor sinnvoll, auch die impliziten Normen des sozialen Systems Wissenschaft zu adressieren. „[P]ublishing data must add to reputation“ (vgl. Klump, S. 5) ist eine Basisformel für das Schaffen von Anreizen für die Forschungsdatenpublikation, die jede/r in diesem Bereich Aktive berücksichtigen sollte. Denn ohne die Aussicht auf einen potentiellen Reputationsgewinn wird es schwer, den erheblichen Mehraufwand einer soliden Datenpublikation zu vermitteln. Wissenschaftsethische Argumente werden selbstverständlich gern gehört und Ideen einer Open Scholarship stoßen selten auf Widerspruch. Ebenso selten haben sie freilich eine Wirkung, die über ein „Ja, man müsste..“ hinausreicht. Der aktuell wirksamste Weg zur Anregung von Datenpublikationen scheint die zunehmende Einforderung von Begleitdaten durch (High-Impact-)Journals, die einen gewissen Zwang mit einem Reputationsversprechen verknüpft. (vgl. zu solchen Supplementary Materials auch diesen Artikel im eDissPlus-Blog)

Dass Datenzitation (und Zitationsindices) und damit einhergehend Reputationsgewinne jedoch vergleichbar mit dem Publizieren von formalen Wissenschaftspublikationen wie Aufsätzen und auch Monografien größeren Einfluss haben werden, scheint trotz allem aktuell wenig wahrscheinlich. Während eine wissenschaftliche Erkenntnis selbst publiziert werden muss, um gelten zu können, ist dies für die ihr zugrundeliegenden Forschungsschritte nicht erforderlich. Für den Weg zur Erkenntnis reicht meist eine kurze Schilderung als Beleg des wissenschaftlichen Vorgehens. Eine weitere Anreicherung um zusätzliche Materialien wie umfassende Forschungsdaten scheint dagegen nicht zuletzt angesichts der schon lange beklagten Publikationsflut (und damit Rezeptionskrise) kaum als Default-Modus gewünscht. Zudem ist auch so nicht jeder Datensatz zur Nachnutzung geeignet oder zur Feststellung des Werts der daraus gewonnen Erkenntnis notwendig. Schließlich stehen sehr häufig auch einfach persönlichkeits- und datenschutzrechtliche Aspekte als unverrückbare Hürden vor einer möglichen Datenpublikation.

(Offenes) Data-Sharing dürfte daher auch langfristig nur in bestimmten Forschungsbereichen relevant werden. In diesen jedoch ist eine umfassende Abdeckung fraglos erstrebenswert. Und auch bereits für diese keineswegs eindeutig bestimmten und überschaubaren Felder haben Infrastrukturforschung und Policy-Entwicklung noch viel Arbeit vor sich. Daher könnte es sogar förderlich sein, das Ideal einer vollumfänglichen Open-Data-Kultur zugunsten einer differenzierteren Sichtweise zu relativieren um anhand schärfer bestimmter Zielgruppen und -szenarien die passenden Anreize definieren zu können.

(Berlin, 05. April 2017)