LIBREAS.Library Ideas

Mit kleinem Kreditrahmen? Überlegungen zur Reputationsabbildung im Nano-Publishing.

Posted in LIBREAS.Referate by Ben on 14. Dezember 2011

Anmerkungen und Anschlüsse zu:

Roberto Casati, Gloria Origgi, Judith Simon (2011): Micro-credits in scientific publishing. In: Journal of Documentation, Vol. 67 Iss: 6, pp.958 – 974. DOI: 10.1108/00220411111183546

von Ben Kaden

Zusammenfassung:

Nachfolgend werden die Grundideen eines Aufsatzes der Attribution von Micro-Credits zu Teilen von wissenschaftlichen Publikationen mit dem Ziel einer präziseren Reputationszuweisung und –messung in einem größeren Rahmen zur Entwicklung pragmatischer/semiotischer Netze diskutiert. Reputation gilt dabei (Abschnitt I) als ein entscheidender Faktor für die soziale Strukturierung einer Wissenschaftsgemeinschaft. Die AutorInnen des besprochenen Textes liefern einige Ansatzpunkte für die Einbettung von kreditierenden Nanoverfahren zunächst in (natur-)wissenschaftliche Aufsätze. (Abschnitt II) Damit verdeutlichen sie eine maßgebliche Entwicklungsrichtung für die Bibliotheks- und Informationswissenschaft, zeigen aber auch deutlich auf, wie viele offene Fragen sich bei der Erweiterung von Semantic Web-Konzepten hin zu Pragmatic-Web-Ideen ergeben und wie viel weitere konzeptionelle Arbeit die Elaboration tragfähiger Theorien auf diesem Gebiet erforderlich ist. (Abschnitt III)

I – Kontext

Die Wissenschaftskommunikation ist ein ökonomischer Handlungsraum. Dessen Gesetze und Währungen unterscheiden sich relativ stark von dem, was man gemeinhin mit Ökonomie verbindet. Denn ihr liegt eine Ökonomie des Diskurses zugrunde, also eine Ökonomie, die den medienvermittelten Umgang mit Aussagen bestimmter Akteure zum Gegenstand hat. (vgl. zum Konzept der Diskursökonomie Winkler, Hartmut (2004) Diskursökonomie: Versuch über die innere Ökonomie der Medien. Frankfurt/Main: Suhrkamp)

Die Tauschwerte sind Impact und Reputation, wobei beides eng miteinander verknüpft werden kann. Im Idealfall steigen die Reputation und damit der wirtschaftliche Status eines Wissenschaftlers in dieser Ökonomie dadurch, dass er in seiner Gemeinschaft als besonders relevant bewertete Aussagen trifft. In einer weiteren Schleife dürfte der Wert einer Aussage und damit der Status des Aussagenden dadurch zunehmen, wenn die Relevanz einer Aussage durch einen mit hohem Status versehenden Akteur oder durch Erscheinen an einer renommierten Stelle (z.B. in einem Journal mit einem hohen Impact Factor) deutlich wird. Daraus entwickelt sich eine Art Meritokratie, in der soziale Stellung über die nachgewiesene Kompetenz erworben wird, wobei jeder Teilnehmer der Diskursgemeinschaft, der sich an die Regeln des Diskurses hält, gleiche Entwicklungschancen besitzt. Soweit die Theorie.

In der Praxis wirkt das Problem schwieriger, denn häufig treten zur reinen Aussagengüte Aspekte wie das soziale Netzwerk, Charisma, Schreibstil und Serendipity (bzw. der Zufall) als Faktoren, aus denen sich die soziale Position in der Wissenschaftsgemeinschaft ergibt. Dabei ist schon die exakte Abgrenzung und Bewertung einer Aussage selbst schwer zu messen. Mit dem rohen Indikator der Zitationshäufigkeit lässt sie sich vielleicht hinsichtlich der Popularität bewerten. Aber selbst das gilt nur unter der Voraussetzung, dass ein zitiertes Paper als identisch mit der einen Aussage angesehen wird.

Diese etwas strenge Interpretation ändert sich dann, wenn man nicht abstrakt die Aussagen in ihrer Rolle als in die Kommunikationsgemeinschaft eingebrachte neue Erkenntnisse zu bewerten versucht, sondern davon ausgeht, dass die Form ihrer Abbildung sowie ihre kontextuelle Einbindung im Diskursgeschehen mindestens in gleichem Umfang über Rezeption oder Nicht-Rezeption entscheidet. Texte werden nicht nur auf der semantischen Ebene, sondern über den Inhalt hinaus in ihrer inneren und äußeren Form (vielleicht als syntaktische Ebene benennbar) sowie mit einer pragmatischen Rahmung (von wem, wann, wo und mit welchem möglichen Zweck publiziert) gelesen.

Insofern sind Erkenntnis und Originalität nur in einer solchen umfänglicheren Einbettung zugänglich und eigentlich bewertbar. In jede Bewertung fließen massiv Aspekte und Eigenschaften ein, die abseits der eigentlichen Aussage und damit der Relevanz der Erkenntnis liegen, obschon zwischengeschaltete Verfahren wie ein Doubleblind-Peer-Review für eine gewisse Durchlässigkeit jenseits der Strukturen beispielsweise des sozialen Kapitals sorgen sollen. Ob diese Methoden der Rückbindung an die eigentliche Erkenntnisqualität wirksam sind und inwieweit zusätzliche Faktoren der Publishability die Begutachtung verzerren könnten, kann an dieser Stelle aber nicht weiter ausgeführt werden.

Der Problemaufriss soll vielmehr auf die These hinführen, dass die soziale Organisation einer Wissenschaftsgemeinschaft über den Erwerb von Reputation desto mehr vom Ideal eines rein epistemologisch fundierten Reputationsaufbaus abweicht, je unschärfer ihre Beurteilungswerkzeuge die Essenz, also die Originalität der Erkenntnis in den Blick nehmen.

Die Mittelbarkeit des Impact Factors sagt vergleichsweise wenig über die reine inhaltliche Güte eines Papers aus. Und er erfasst zwar den für viele Disziplinen nach wie vor dominanten Teil der Wissenschaftskommunikation, lässt aber mit zunehmender Diversifizierung von Publikationsformen zunehmend Bereiche außerhalb des Fokus, die für die Entwicklung der Wissenschaft durchaus Relevanz besitzen. Bisher bleiben in den traditionellen Zitationsauswertungen semi-formalisierte, also ohne weitere redaktionelle Sichtung und Bearbeitung publizierte, Wissenschaftskommunikationen (beispielsweise in Weblogs) außen vor. Eine der Herausforderungen für Wissenschaftsforschung und Wissenschaftssoziologie ist es, dieses Kommunikationsgeschehen überhaupt erst einmal zu erfassen und im nächsten Schritt in Beziehung zum Phänomen der Reputationsmessung zu setzen.

Jüngst wies Manuela Schulz im medinfo-Weblog auf die Entwicklungslinie der Altmetrics hin (http://medinfo.netbib.de/archives/2011/12/02/3944), die soziale Netzwerkeffekte – z.B. vernetzte Literaturorganisationssysteme wie Mendeley oder Research Gate, aber auch Twitter – für die Messung eines Impacts nutzen wollen: Die präzise Vernetzbarkeit auch von Dokumententeilen mit konkreten Akteuren lassen feinkörnigere Messverfahren als die Zitationszählung auf Artikelebene zu. Im Altmetrics-Manifesto findet sich dies so angesprochen:

„Semantic publishing or “nanopublication,” where the citeable unit is an argument or passage rather than entire article.” (http://altmetrics.org/manifesto/)

Der Fokus rückt also von der, wenn man so will, dokumentarischen Bezugseinheit als kleinster bewertbarer Größe ab. Da im Digitalen jeder Bestandteil eines Dokumentes – theoretisch bis zum einzelnen Buchstaben – mit zusätzlichen Meta- und Relationsdaten angereichert werden kann, ist der Zoom auf die Nanoebene nur folgerichtig. Wobei die Konsequenzen beispielsweise hinter einer Nachnutzbarkeit bislang noch nicht allzu umfänglich reflektiert wurden.

II – Konzept

Ein in der aktuellen Ausgabe des Journal of Documentation publizierter Aufsatz versucht nun die Problemlage ein Stück weit weiter in ein Konzept zu bringen. Inwieweit dieses auch operationalisierbar ist, bleibt auch in ihm offen. In jedem Fall öffnen die Autoren Roberto Casati, Gloria Origgi und Judith Simon mit ihrem Ansatz die starre Form des wissenschaftlichen Aufsatzes als Bezugsgröße ein wenig und merken zudem an, dass ihr Beitrag nicht zuletzt als kritisches Schlaglicht auf etablierte Evaluationsverfahren gelesen werden kann. Damit fügt er sich nahtlos in einen allgemeinen Trend.

Wo ich von Dokument spreche, schreiben sie – dies zur Terminologie – von Scientific Knowledge Objects (SKOs). Gemeint ist im Prinzip dasselbe: Alles, was wissenschaftliches Material sein kann (peer-reviewed scientific journals, reviews, books, PhD disserations, datasets, pictures, diagrams, peer reviews, blog entries u.v.a.m.) lässt sich als SKO betrachten. Für die Ausführung im Beitrag wird die Vielfalt auf einen Regelfall begrenzt. Die Aussage:

„The exact borders of the class of SKOs may be fuzzy, but there is a consensus about the core, paradigmatic cases.”

mutet daher im Kontext des Aufsatzes etwas widersprüchlich an: Formal ist die Bandbreite enorm vielfältig und auch medientypologisch strukturell deutlich differenziert. Für die Auseinandersetzung folgen Casati et al. jedoch mit ihrem „paradigmatic case“ dem Aufbau einer traditionellen (natur)wissenschaftlichen Publikation:

  • Titel (Themenmarker / thematic label)
  • Autorenangaben / Urheberschaftserklärung
  • Zusammenfassung des Inhalts (Abstract)
  • Wissensstand zum Thema (State of the Art)
  • Neues Wissen, dass über den Stand hinausreicht (These)
  • Explikation von Methoden und Ergebnissen, die die These stützen und anhand derer Leser den Schritt nachvollziehen/validieren können
  • Ausblick auf weitere Forschungsziele
  • Einbettung in den Fluss des Diskurses („flow of existing knowledge“) mit Bibliographie
  • Danksagungen an bei der Produktion Beteiligte

Ihr Verfahren läuft folgerichtig auf die differenzierte Reputationszuweisung in von mehreren Autoren erstellten SKOs hinaus. Sie wollen damit der prinzipiellen Zweidimensionalität der (intendierten) Wirkung wissenschaftlicher Publikationen Rechnung tragen. Die erste Dimension fragt: Welchen Beitrag leistet ein SKO zum Gesamtbestand des wissenschaftlichen Wissens? Die zweite Dimension fragt: Welchen Beitrag leistet ein SKO zur Reputation der Autoren und anderen Instanzen?

Beide stehen, so die Autoren, in Wechselwirkung. Oder anders herum: Beide Seiten der Medaille lassen den Glanz der jeweils anderen durchschimmern. Was für den einzelnen konkreten Wissenschaftler überwiegt, wäre dann Gegenstand einer wissenschaftssoziologischen Motivationsforschung. Für die Analyse wird man sich jeweils für einen Ausgangspunkt entscheiden müssen: fokussiert man das Objekt oder den Akteur? Daraus ergibt sich die Richtung der Untersuchung.

Beide Dimensionen werden natürlich auch dann sichtbar, wenn ein Objekt zitiert wird. Nur sind sie nicht immer erkennbar. Allerdings unterscheiden sie die Autoren auch wieder zwei, und zwar ziemlich klare, Fälle: Die Zitation in anderen SKOs, also wissenschaftlichen Publikationen, die überwiegend die erste Dimension anspricht. Und die Auflistung in Leistungsberichten der Akteure, in individuellen Bibliografien u.ä., die direkt als reputationsgenerierende Nachweise zu denken sind. In der Tat scheint besonders der zweite Fall für Analysen im Kontext eines möglichen Pragmatic Web sehr interessant, lässt sich aus ihm doch eine wahrscheinliche Aussage ableiten, welche Publikationen bzw. Erkenntnisleistungen einzelne Wissenschaftler in einem bestimmten Begutachtungszusammenhang als für die eigene Rolle in der Wissenschaftsgemeinschaft als besonders bedeutsam erachten. Im weiteren Text versuchen die Autoren nun, die Dimensionen am Beispiel eines digitalen, nachstrukturierten Dokuments zusammenzuführen.

Die Idee ist so naheliegend wie zukunftsträchtig, setzt jedoch eine formale Standardisierung des Aufbaus einer Publikation beispielsweise nach den oben gelisteten Elementen voraus. Ist diese Struktur dann entsprechend ausgezeichnet, kann man zum Beispiel Autorenschaften oder Zuarbeiten zu einzelnen Elementen des Objektes attributieren. Die Autoren sprechen bei diesen Elementen von einer subatomic structure, was mehr oder weniger auf der Prämisse aufsetzt, dass das aus diesen Teile bestehende Gesamtobjekt (bzw. Dokument) die kleinste (=atomische) epistemologische Bezugseinheit darstellen kann. Sammelbände oder Zeitschriftenhefte werden dementsprechend als molekulare SKOs bezeichnet. (Wie sinnvoll diese Metaphorisierung ist, kann vielleicht einmal an anderer Stelle diskutiert werden.)

Will man nun bestimmte (sub-atomische) Teile eines (atomischen) Objekts sinnvoll mit Akteuren koppeln, um eine passgenaue Reputationszuweisung bzw. Kreditierung abzubilden, ist es notwendig, für die involvierten Personen bestimmte Rollen zu definieren. Die Autoren unterscheiden vergleichsweise übersichtlich:

  • volle Autorenschaft
  • Unterstützungsleistung (denkbar sind konkrete Zuarbeiten, Kritik, Korrekturlesen, Literaturhinweise o.ä.)
  • Materialversorgung
  • Andere Teilaufgaben während der Produktion des SKOs

Es ist offensichtlich, dass weitere Differenzierungsschritte nicht nur denkbar sind, sondern eine differenzierende Präzisierung der Rollen, je nach Ziel und Zweck des Auswertungssystems, geboten ist. Zum Beispiel wird es rechtlich dann sehr aufregend, wenn man konsequent die Relationierung von Urheberschaften und vielleicht auch Haftungsrechten integriert.

In gleicher Weise sind weitere Differenzierungen der subatomischen Bezugsbausteine („Modules“) eines Dokumentes denkbar. Casati et al. führen zunächst folgende Elemente auf:

  • Titel
  • Abstract
  • Keywords
  • Schlagwörter / Tags
  • Einleitung
  • Beschreibung des State of the Art
  • Hauptthese (Central Claim)
  • Textkörper
  • Ergebnisse
  • Methoden
  • Datensätze
  • Diskussion / Fazit
  • Bibliographie
  • Danksagung
  • Verwandte Materialien (möglicherweise auch: Forschungsdaten)
  • Kommentare
  • Reviews

Autoren- und Titelangaben sowie die Keywords und die Danksagung sind laut Casati et al. nicht als selbstständige SKOs anzusehen. Alle anderen Elemente lassen sich dagegen bereits selbst als eigenständige SKOs auffassen und verarbeiten. Dieses Verständnis beinhaltet nicht nur, dass die entsprechenden Elemente jeweils einen eigenen Identifier (DOI) zugewiesen bekommen können, sondern, dass man sie auch mit entsprechend differenzierten Lizenzen für unterschiedliche Formen der Nachnutzung versehen kann. Für die Herstellung derart nano-strukturierter Dokumente formulieren die Autoren folgenden Ablauf:

„An author starts a new paper, inserts the title, and invites co-authors to share some or all the modules above. Author A may give co-author B the permission to modify the bibliography module only, say. In this case, B will be author of the bibliography of A’s paper, her name will appear in the “production box” associated to each paper and also as the author of the bibliography module. According to the various policies of different journals or institutions, authors can appoint co-authors alone or may need to ask permission to the editors or the heads of their institution. We can imagine an “export” function that compiles the different parts into a readable atomic SKO. Credits for each module can be weighted differently according to specific policies of institutions. Copyright permissions can also be assigned according to specific policies.“

Sie bereiten also aktiv die Remixability von wissenschaftlichen Dokumenten vor. Umso stärker wird daher in diesem Zusammenhang für Bibliotheken die Frage zu stellen sein, was in einem derartigen dynamischen Publikationsumfeld, in dem der Schritt von der vergleichsweise statischen Publikationen zu dynamischen Kommunikationen im Netz, in den Aufzeichnungen mehr der Spur als dem Werk entsprechen, überhaupt noch als Dokument verstanden werden kann.

III – Perspektive

Der Beitrag von Casati et al. scheint insofern bemerkenswert, weil er wissenschaftssoziologische Komponenten (Crediting) mit Konzeptideen aus dem Semantic Web zusammenführt. Die AutorInnen stoßen demnach tatsächlich in eine konzeptionelle Lücke vor, beziehen sich doch die meisten Ansätze zu semantischen Netzen bisher vorwiegend auf die Inhalte und Konzepte und weniger auf die Akteure. Auch wenn die Autoren dies nicht so verorten, zeigt sich deutlich, dass der Aufsatz Vorarbeit für etwas ist, was man als pragmatic web bezeichnen kann.

Ich würde, dies als Nachskizze, für diesen Schritt die Granulierung noch etwas verschieben: Neben dem Central Claim sollten als sub-atomische – sofern man sich an diese Wortwahl gewöhnen mag – Elemente auch einzelne Aussagen im Textkörper ausgezeichnet werden. So wie explizite Zitatstellen bereits traditionell kreditierend ausgezeichnet sind, könnte man zunächst selbigen ein Schema von pragmatischen Eigenschaften im Sinne eines Zitatzwecks (bestätigt, widerlegt, falsifiziert, ergänzt, etc.) zur Seite stellen. (hier ergibt sich ein Ausschluss an ein hier beschriebenes Untersuchungsfeld). Eine Aussage im Text ließe sich im Anschluss analog zu den Zitaten mit einer konkreten Autorenschaft und einer pragmatischen Eigenschaft versehen.

Micro-Crediting und Nanopublishing sollten und werden sicher nicht die bisherigen, lang elaborierten Publikationspraxen in der Wissenschaft über Nacht umstürzen. Dazu sind die Details und die Grenzen  bislang viel zu unscharf bestimmt. Parallel gilt, dass eine derart feinkörnige strukturelle Standardisierung zwar aus der Sicht der Maschinenlesbarkeit hoch willkommen ist, andererseits aber die Darstellungsformen an technische Vorgaben anpasst, die eventuell für die freie epistemologische Entwicklung der Wissenschaft zu determinierend wirkt. Auch diese These wäre weiterführend zu prüfen. Verfahren zur pragmatischen Erschließung von Dokumenten sind sicherlich disziplinär ganz unterschiedlich zu entwickeln und implementierbar. Casati et al. vermerken es für ihren Betrachtungsbereich ähnlich:

„Much conceptual work is yet to be done before generalizing any existing procedure for measuring the contribution of any piece of research to the reputation capital of the individuals who carry on that research.”

Zu beachten ist auch, dass solch ein Micro-Crediting-Verfahren idealerweise während der Erstellung eines Objekts zu erfolgen hat. Rückwirkend dürften konkrete Rollen erfahrungsgemäß nicht in jedem Fall eindeutig rekonstruierbar sein. Dies erhöht jedoch den Erstellungsaufwand solcher Dokumente und es ist unklar, ob die Wissenschaftler sich darauf einzulassen bereit sind.

An anderer Stelle wird derzeit die Frage nach der wissenschaftsethischen Dimension der Bibliotheks- und Informationswissenschaft aufgeworfen. Die Entwicklung von Werkzeugen wie den hier beschriebenen fällt selbstverständlich in diesen Bereich. Wenn das Fach aktiv zur Entwicklung von semantischen, pragmatischen oder semiotischen Netzwerkstrukturen beiträgt, sollte es sich daher immer fragen für wen, für welchen Zweck und in welchem Umfang sowie mit welcher Entwicklungsperspektive eine umfängliche Dynamisierung der Wissenschaftskommunikation über das Setzen maschinenlesbarer Standards auf der sub-atomischen Ebene geschieht/geschehen sollte.

Berlin, 13.12.2011

2 Antworten

Subscribe to comments with RSS.

  1. […] wir schon einmal das Thema alternativer Metriken in der Wissenschaftsforschung in den Blick nehmen, dann liegt es nahe, den Bogen zu den Tweetmetrics (Teilgebiet der Social metrics) mitzunehmen und […]

  2. W. Umstaetter said, on 18. Dezember 2011 at 18:50

    Die hier als SKOs (Scientific Knowledge Objects) bezeichneten Elemente, muss man meines Erachtens als Wissenselemente ( http://www.wissenschaftsforschung.de/JB00_179-200.pdf ) bezeichnen, die entsprechend der Definition: Wissen ist begründete Information, immer aus einer Information und ihrer Begründung bestehen müssen. Die Gleichsetzung der SKOs mit wissenschaftlichen Dokumenten ist damit insofern richtig, als es seit langem Praxis ist, in der Wissenschaft Thesen aufzustellen und diese dann möglichst wasserdicht abzusichern. Der typische Aufbau, z.B. eines naturwissenschaftlichen Aufsatzes, mit Einleitung, Material und Methode, Ergebnisse, Diskussion, Schluss (der weniger ein Abschluss des Aufsatzes und eher der Schluss, das Fazit, aus den Begründungsversuchen heraus ist), macht deutlich, dass die wissenschaftliche Begründung einer Information, meist recht aufwendig ist. Insofern ist die Vorstellung, das SKOs bzw. Wissenselemente, sehr kleine blips sein könnten, eher selten. Trotzdem ist es in einer Wissensbank oder einem Computermodell durchaus denkbar, dass ein einziger zuverlässig gemessener Wert das ganze Modell mit einem Schlag absichert bzw. falsifiziert, und man dem „Autor“, der diese Information (mit dem Hinweis, wie der Wert gemessen wurde) ein entscheidendes Urheberrecht daran zuordnen müsste.

    Man sieht also, dass der Gedanke von R. Casati, G. Origgi und J. Simon gar nicht so neu ist, sich aber mit der zunehmenden Fließbandproduktion von Wissen langsam Bahn bricht. Genau genommen geht es dabei allerdings weniger um das Micro-crediting als vielmehr um die Urheberrechte in komplexen Modellen oder Versuchen, wenn man beispielsweise daran denkt, dass es bei CERN Experimente mit Hunderten von beteiligten Spezialisten gibt, die bisher mehr oder minder als gleichberechtigte Autoren einer Publikation genannt werden. In XML-Dokumenten, wäre es dagegen kein grundsätzliches Problem, auch einem einzelnen Messwert in einer solchen Publikation in den Metadaten die jeweiligen Verantwortlichen bzw. Urheber exakt zuzuordnen.

    Walther Umstätter


Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

%d Bloggern gefällt das: