LIBREAS.Library Ideas

Dienste für die dissertationsbegleitende Publikation von Forschungsdaten. Eine Vortragsnachlese.

Posted in LIBREAS.Dokumente by Ben on 7. Juni 2017

Eine Notiz von Ben Kaden (@bkaden)

In dervergangenen Woche fand bekanntlich in Frankfurt am Main der Bibliothekartag 2017 statt, eine seltsam buchfreie und ausgiebig betwitterte Veranstaltung, die wie immer ein ganz guten Rundumblick über den Diskursstand des deutschen Bibliothekswesens lieferte. Das Gesetz zur Angleichung des Urheberrechts an die aktuellen Erfordernisse der Wissensgesellschaft (UrhWissG) und die dagegen anlaufende Initiative der deutschen Presse waren naturgemäß ein Thema auch der Pausengespräche. Digitalisierung, die ja im Prinzip alles mögliche, u.a. Social Media, umfassen kann, ein anderes und begleitet die Veranstaltung nun schon fast zwei Jahrzehnte. Innovation wurde ein weiteres Mal verkündet und eingefordert. Informationsethik wurde kritisiert. Und es wurde, vielleicht am interessantesten, festgestellt, dass es im deutschen Bibliothekswesen oft offenbar schwer fällt,sowohl qualifizierte als auch motivierte Persönlichkeiten für Leitungsstellen zu finden.

Selbstverständlich bleibt Eindruck auch von der Themensetzung nur fragmentarisch, da LIBREAS-Vertreter_innen zwar hier und da durch das Kongresszentrum der Frankfurter Messe wanderten, in der Regel aber mit ihren hauptberuflichen Schwerpunkten und Aufgaben ausreichend beladen und entsprechend zielstrebig. Und mancher kam nur für einen Vortrag und also nur einen halben Tag nach Frankfurt, winkte hier und da jemandem zu, besuchte ein Panel zu Altmetrics, das zu großen Teil Richtung Firmenpräsentation driftete und die Einsicht aufdrängte, dass das Rad der Webanalyse mit Big-Data-Methoden gerade neu erfunden wird.

Nicht neu erfunden, mittlerweile sehr nachdrücklich behandelt wird dagegen das Themenfeld der Forschungsdaten. In dieses fügt sich nun auch der Vortrag ein, zu dessen Nachbereitung nachfolgend einige Kernpunkte fixiert werden. Gegenstand der kurzen Präsentation waren Erkenntnisse aus dem eDissPlus-Projekt. Da sich zudem direkt im Anschluss zur Präsentation, wenn auch zu einem anderen Aspekt des Projektes, in der Twittersphäre Missverständnisse offenbarten, die auch mit den Besonderheiten der Konferenzatmosphäre zusammenhängen können, ist das nur zusätzlich Anlass zur Wiederholung und Erläuterung des Präsentierten. Dies geschieht ausdrücklich mit dem Wunsch, eine Diskussionsvorlage zu bieten. Im vorliegenden Rahmen muss die Darstellung allerdings auf den Präsentationsteil der Humboldt-Universität beschränkt bleiben und dort auf die Befragungen mit Promovierenden und Post-Docs zu Einstellungs- und Erfahrungsmustern hinsichtlich einer denkbaren Publikation von Forschungsdaten.

(more…)

LIBREAS.Library Ideas LIBREAS.Dokumentation. Heute: Thesen des Rat für Informationsinfrastrukturen (RfII) zu den Voraussetzungen einer Nationalen Forschungsdateninfrastruktur (NFDI)

Posted in LIBREAS.Dokumente by Ben on 27. April 2017

von Ben Kaden (@bkaden)

Spricht man über die Möglichkeit und Notwendigkeit einer systematischen Organisation von digitalen Forschungsdaten (Forschungsdatenmanagement) sowie ihrem übergreifenden Nachweis und idealerweise auch ihre Verfügbarmachung per Publikation, sind vor allem drei Gruppen von Stakeholdern zu berücksichtigen. Die erste fasst in etwas die Forschungspolitik-, administration und -förderung. Die zweite besteht aus der Forschungsinfrastruktur, also Bibliotheken, Rechenzentren, Netzwerkanbietern etc. Beide Gruppen haben sich, verkürzt formuliert, weitgehend darauf verständigt, dass das Ziel einer offenen Wissenschaft (Open Science und Open Scholarship) erstrebenswert ist und man daraufhin arbeiten sollten, sie als Normalmodus zu etablieren. Und dazu zählt auch die möglichst weitreichende (=offene) Verfügbarkeit der Daten, die bei der Forschung entstehen. Die Hauptgründe dafür sind die Forschungstransparenz und die Nachnutzung.

Dass die Hauptakteure, nämlich die dritte Gruppe in Gestalt der Forschenden, die diese Daten produzieren, potentiell rezipieren, vielleicht bewerten und möglicherweise nachnutzen, noch nicht flächendeckend in diese Richtung streben, erweist sich bei diesem Streben als Herausforderung. Oder auch: Hürde. Theoretisch sind sie sogar oft mit im Boot. Praktisch jedoch scheuen sie jedoch einerseits den zusätzlichen Aufwand, wenn es an den tatsächlichen Schritt hin zu Forschungsdatenpublikationen geht. Oder sie finden, wie gleich noch einmal angedeutet wird sogar nachvollziehbar, Gründe, warum es in ihrem konkreten Fall jeweils nicht möglich ist, diesem Ziel zu folgen. (more…)

Warum die Publikation von Forschungsdaten nach wie vor ein begrenztes Phänomen bleibt.

Posted in LIBREAS.Referate by Ben on 5. April 2017

Eine Notiz im Anschluss an

Jens Klump: Data as Social Capital and the Gift Culture in Research. In: Data Science Journal. 16, p.14. DOI: http://doi.org/10.5334/dsj-2017-014

von Ben Kaden (@bkaden)

Wer sich mit dem Thema der Forschungsdatenpublikation befasst, kann die Lücke zwischen allgemeinen in Forschungsdaten-Policies verkündeten Anspruch an einen offenen Zugang zu diesen Daten und der Wissenschaftspraxis nicht übersehen: Trotz aller wohlbegründeten Argumente ist die Zahl der publizierten Datensätze sehr überschaubar. Andererseits ist das Konzept der Forschungsdatenpublikation nur dann wirklich nachhaltig und sinnvoll, wenn solche Veröffentlichungen nicht insular und aus dem Enthusiasmus einzelner Forschender heraus geschehen, sondern dort, wo sie sinnvoll sind, ein Eckstein wissenschaftlichen Austauschs bilden. Wissenschaft lebt von Systematizität. Wenn Forschungsdatensätze eher zufällig auf einem Repositorium landen, ist es sicher besser als keine Verfügbarkeit. Aber es ist eben nicht wissenschaftlich und ähnelt im Fall einer Nachnutzung eher dem glücklichen Zufallsfund im Archiv, während der Normalfall bleibt, dass man keine Daten für seine Forschungsfrage findet. Auch wenn es eigentlich welche gäbe.

Gemeinhin werden drei Gründe für Forschungsdatenpublikationen benannt: Forschungstransparenz, Nachnutzung und der Erwerb wissenschaftlicher Reputation. Abgesehen von ethisch besonders motivierten Publizierenden dürfte vor allem der Aspekt einer die Anrechenbarkeit von Forschungsdatenpublikationen als wissenschaftliches Kapital der Schlüssel zu einer weiteren Verbreitung sein. Insofern ist es unter anderem wichtig, Datenpublikationen so zitier- und verfügbar zu halten, wie es auch Aufsatzpublikationen sind. Die übergeordnete Sachlage ist aber selbstverständlich komplexer.

In einem aktuellen Aufsatz für das Data Science Journal geht nun Jens Klump der Frage nach, weshalb Data-Sharing-Policies bisher nur begrenztes Echo in den Fachkulturen und ihren Kommunikationspraxen finden. Er nähert sich der Frage wissenschaftssoziologisch und argumentiert nachvollziehbar, dass es nicht ausreicht, Forschungsdateninfrastrukturen aufzubauen. Vielmehr, so lässt sich ergänzen, sind diese eine Basisanforderung, um Data-Sharing-Praxen zu stimulieren. Entscheidend ist jedoch eigentlich, die Verfassung des sozialen Systems der Wissenschaft als eine „Reputation Economy“ zu verstehen und aus diesem Verständnis heraus passende Ansatzpunkte für Anreize zu setzen. Der einschlägigen Infrastrukturforschung bescheinigt Jens Klump dahingehend Defizite. Wenn also in der Reputationsökonomie der Wissenschaft die eigenen wissenschaftlichen Handlungsmöglichkeiten (z.B. über Fördermittel und Anstellungen) mittels kommunikationsbasierten Erwerb von Reputation und wissenschaftlichem Status gesichert und ausgebaut werden, dann sollte das Phänomen der Forschungsdatenpublikation folgerichtig in dieses System grundlegend integriert werden.

Interessant ist nun die durch den Übergang von einer vorwiegenden Individualwissenschaft zu einer Kollaborationswissenschaft (oft, aber nicht nur, in Gestalt von Großforschung) auftretende Verschiebung der Anforderungen. Im zweiten Fall bedarf es für eine Karriere mehr als Reputation – es gilt die Balance zwischen Reputationsgewinnen und Kollaborationsgewinnen zu finden. Man muss also in der kollaborativen Forschung nicht nur als Individuum wissenschaftlich hochklassig arbeiten, sondern zugleich an den richtigen Punkten ein geschickter Teamspieler sein.

Zwangsläufig betonen und belohnen, wie auch Jens Klump herausstellt, kollaborativ orientierte Fachkulturen das Teilen von Forschungsressourcen und also auch Forschungsdaten stärker als Kulturen, in denen der Schwerpunkt hauptsächlich auf  dem Reputationsgewinn des einzelnen Forschers liegt. Zieht man dies heran, erklärt sich auch das Spannungsverhältnis zwischen den sehr auf Kollaboration gerichteten Digital Humanities und den traditioneller ausgerichteten Geisteswissenschaften, bei denen sich Forschende häufig selbst als primär Werkschöpfende mit allen Ansprüchen an eine so genannte „Werkherrschaft“ sehen. Die aktuellen deutschen Urheberrechtsdebatten (Stichwort Publikationsfreiheit.de) könnten also maßgeblich von der Sorge um Reputationseinbußen getrieben werden. Zugleich stehen sie deutlich erkennbar den Ansprüchen kollaborationsorientierter Wissenschaft entgegen. Während die traditionellen Individualwissenschaften Erkenntnis primär zentriert auf den individuellen Forscher als Erkennenden (und idealweiser Ersterkennenden) gelesen und interpretiert haben, fokussieren, so eine natürlich etwas verkürzte Deutung, Kollaborationskulturen viel stärker den Forschungsgegenstand und das Erkenntnisziel als Fixpunkte. Sie behandeln die Forschenden zwar nicht als beliebig austauschbar, aber doch als stärker hinter die Forschungsziele zurücktretend. Ist das eigentliche Ziel nun idealerweise der Erkenntnisfortschritt selbst, so scheint es auch deutlich plausibler und vermittelbarer, dass zum Beispiel die Bereitstellung von Forschungsdaten für die Community im Sinne dieses Fortschritts stärker zu gewichten ist, als der individuelle Anspruch als Erheber dieser Daten auch eine umfassende Datenherrschaft ausüben zu können.

Individualwissenschaftliche Praxen knüpfen dagegen stärker die Originalität einer Erkenntnis an die konkrete forschende und erkennende Person als Urheber. Zu viel Transparenz oder gar die Bereitstellung der eigenen Datengrundlage (zum Beispiel in Form von Annotationen) für ähnlich motivierte Forschende (=Konkurrenten) wird zwangsläufig als erhebliche Preisgabe wissenschaftlichen Kapitals gesehen, aus dem das soziale Kapital gewonnen wird, mit man seine Karriere macht.

Einen Sonderfall stellt die Auftragsforschung dar, wenn sie das Ziel des Intellectual Property mit Teamforschung verbindet und zum Beispiel Patentierbarkeit des Erkenntnisproduktes anstrebt. Dann greifen ähnliche Zurückhaltungsmechanismen und eine Preisgabe u.a. der Datengrundlage oder auch der Verfahrensbeschreibung ist vor Sicherung des Patents und damit des rechtlich stabilisierten Verwertungsanspruchs unbedingt zu vermeiden.

Mit der Zunahme von Public-Private-Partnership-Projekten verkompliziert sich die Frage nach den Anreizen zum Teilen von Forschungsdaten demnach zusätzlich. Wissenschaft ist somit keinesfalls als isoliertes soziales System zu betrachten, auch wenn diese Sicht zunächst einmal hilft, um über die Idee einer idealtypischen Reputationsökonomie nach den passenden Interventionspunkten zugunsten einer stärkeren Öffnung wissenschaftlicher Arbeit zu suchen. Die Kommodifizierung der Erkenntnisproduktion verlagert den als für das wissenschaftliche Verhalten bestimmend definierten Peer Pressure in stärker rechtlich regulierte Bedingungen. Für denkbare Anreize zum Teilen von Forschungsdaten und -verfahren muss dies nicht schlecht sein, weil man auf rechtlichem Wege stärker auch verbindliche Mandatierungen anstreben kann – so wie die Nicht-Veröffentlichung bereits jetzt bei der Auftragsforschung klar mandatiert wird.

Abgesehen davon ist es zweifellos nach wie vor sinnvoll, auch die impliziten Normen des sozialen Systems Wissenschaft zu adressieren. „[P]ublishing data must add to reputation“ (vgl. Klump, S. 5) ist eine Basisformel für das Schaffen von Anreizen für die Forschungsdatenpublikation, die jede/r in diesem Bereich Aktive berücksichtigen sollte. Denn ohne die Aussicht auf einen potentiellen Reputationsgewinn wird es schwer, den erheblichen Mehraufwand einer soliden Datenpublikation zu vermitteln. Wissenschaftsethische Argumente werden selbstverständlich gern gehört und Ideen einer Open Scholarship stoßen selten auf Widerspruch. Ebenso selten haben sie freilich eine Wirkung, die über ein „Ja, man müsste..“ hinausreicht. Der aktuell wirksamste Weg zur Anregung von Datenpublikationen scheint die zunehmende Einforderung von Begleitdaten durch (High-Impact-)Journals, die einen gewissen Zwang mit einem Reputationsversprechen verknüpft. (vgl. zu solchen Supplementary Materials auch diesen Artikel im eDissPlus-Blog)

Dass Datenzitation (und Zitationsindices) und damit einhergehend Reputationsgewinne jedoch vergleichbar mit dem Publizieren von formalen Wissenschaftspublikationen wie Aufsätzen und auch Monografien größeren Einfluss haben werden, scheint trotz allem aktuell wenig wahrscheinlich. Während eine wissenschaftliche Erkenntnis selbst publiziert werden muss, um gelten zu können, ist dies für die ihr zugrundeliegenden Forschungsschritte nicht erforderlich. Für den Weg zur Erkenntnis reicht meist eine kurze Schilderung als Beleg des wissenschaftlichen Vorgehens. Eine weitere Anreicherung um zusätzliche Materialien wie umfassende Forschungsdaten scheint dagegen nicht zuletzt angesichts der schon lange beklagten Publikationsflut (und damit Rezeptionskrise) kaum als Default-Modus gewünscht. Zudem ist auch so nicht jeder Datensatz zur Nachnutzung geeignet oder zur Feststellung des Werts der daraus gewonnen Erkenntnis notwendig. Schließlich stehen sehr häufig auch einfach persönlichkeits- und datenschutzrechtliche Aspekte als unverrückbare Hürden vor einer möglichen Datenpublikation.

(Offenes) Data-Sharing dürfte daher auch langfristig nur in bestimmten Forschungsbereichen relevant werden. In diesen jedoch ist eine umfassende Abdeckung fraglos erstrebenswert. Und auch bereits für diese keineswegs eindeutig bestimmten und überschaubaren Felder haben Infrastrukturforschung und Policy-Entwicklung noch viel Arbeit vor sich. Daher könnte es sogar förderlich sein, das Ideal einer vollumfänglichen Open-Data-Kultur zugunsten einer differenzierteren Sichtweise zu relativieren um anhand schärfer bestimmter Zielgruppen und -szenarien die passenden Anreize definieren zu können.

(Berlin, 05. April 2017)