LIBREAS.Library Ideas

Call for Papers: Forschungsdaten, Metadaten, noch mehr Daten. Forschungsdatenmanagement

Posted in LIBREAS Call for Papers by libreas on 12. Dezember 2012

Call for Papers für die LIBREAS-Ausgabe #23
Thema:
Forschungs- und andere Daten sowie ihre Organisation und Rolle in Bibliothek und Wissenschaft
Einreichungsfrist: bis 31.05.2013 14.07.2013 19.08.2013
gewünscht sind: Beiträge, die Wechselwirkungen zwischen Wissenschaft, Daten und Bibliotheken reflektieren, annotieren, dekonstruieren und/oder analysieren
disziplinäre Einschränkungen: keine
Rückfragen: redaktion@libreas.eu

„Eine Forschung, die zunehmend durch die kooperative Tätigkeit weltweit vernetzter Communities und durch den Einsatz Computerbasierter Verfahren bestimmt ist, erfordert nun einmal die kontinuierliche und vor allem langfristige Verfügbarkeit von Publikationen und Forschungsdaten über das Internet. Nicht nur die Notwendigkeit, Forschungsergebnisse durch den Rückgriff auf die diesen Ergebnissen zugrunde liegenden Daten verifizieren zu können, sondern auch die produktive Nachnutzung von Forschungsdaten in anderen Kontexten setzt voraus, dass digital kodierte Information über Jahrzehnte hinweg authentisch verfügbar bleibt.“ (Matthias Kleiner. Vorwort. In: Heike Neuroth et al. (2012), S. 9)

„Die Basis einer gesunden Ordnung ist ein großer Papierkorb.“ (Kurt Tucholsky. In: Neue Leipziger Zeitung, 19.08.1930)

 

Wissenschaft produziert heute neben Erkenntnis vor allem immense Datenmengen. Die enorme Steigerung beruht in erster Linie auf der Entwicklung und Verfügbarkeit von Technologien zur Datenproduktion und -verarbeitung. leistungsstärkere Rechner und Messgeräte produzieren und vernetzen immer mehr Daten. Wo viele Daten sind, kommen fast naturgesetzlich immer noch mehr hinzu. Die Datenmengen, eines  Large Hadron Collider (LHC) in Genf sind derart umfangreich, dass sie nicht einmal mehr an einer zentralen Stelle gespeichert werden können, sondern auf das LHC Computing Grid verteilt werden müssen. Aber auch im Alltag entstehen immer mehr Daten „nebenher“, beim Surfen im Netz, beim Chatten, beim Taggen von Dateien usw. Nahezu jeder Klick erzeugt auch neue Daten.

Die Entwicklung führt zu umfassenden Änderungen der Wissenschaft, ihrer Methoden und besonders den Anforderungen an ihre Werkzeuge sowie an die Wissenschaftsinfrastrukturen. Datenintensive Forschung braucht angemessene Hilfsmittel. Physikerinnen und Physiker, die mit Daten aus LHC-Experimenten arbeiten wollen, müssen lernen, Daten aus dem Grid zusammensammeln und auszugeben. Sozialwissenschaftlerinnen und -wissenschaftler, die theoretische Modelle zum Zusammenhang von Hochschulsystem und Städteplanung über mehrere Staaten hinweg testen wollen, können dafür auf eine umfassende Datenlage zurückgreifen. Sie müssen aber diese kennen, finden und weiterverarbeiten können.

Angesichts dieser empirischen Wende könnte das Testen theoretischer Modelle bald der Vergangenheit angehören. Jim Gray formulierte die These, dass wir in die Zeit des vierten Forschungsparadigmas eintreten würden. (Hey, Tansley & Tolle, 2009) Die Forschungsdatenbestände würden zu groß werden, um überhaupt noch anders als mit explorativer Statistik, also einer Art Datenhermeneutik, auswertbar zu sein. Ob dies für alle Wissenschaften zutrifft, ist offen.

Folgerichtig wird die Bedeutung von langfristig und offen verfügbaren Forschungsdaten für den Forschungsprozess immer stärker betont. Man entwirft Systeme, die die Reputation einer Forscherin, eines Forschers an die erstellten Daten binden sollen. Diese Diskussion überdeckt eine andere Wahrheit: Immer noch sitzen die Theologinnen und Theologen an ihren Schreibtischen und produzieren nicht viel mehr Daten als in den Jahrhunderten zuvor. Sie benutzen aber möglicherweise zunehmend digital vorliegende Quellen. So geht es vielen Disziplinen: Einige, wie die Physik oder die Klimaforschung, erzeugen permanent riesige Datenmengen. Bei anderen ist vielleicht nicht das Wachstum der eigens produzierten Datenmengen überwältigend. Wohl aber die Zahl der durch die Digitalisierung direkt abrufbaren Datenbestände. Um diese ordentlich zu nutzen, sind adäquate Erschließungs- und Vermittlungsverfahren sowie Werkzeuge notwendig.

Wie soll Forschungsdatenmanagement funktionieren? (more…)

Advertisements

Die Pragmatischen Netze und ihre Gesellschaft. Zur Debatte um die Rolle des Diskurses in der Bibliotheks- und Informationswissenschaft.

Posted in LIBREAS aktuell, LIBREAS.Debatte, LIBREAS.Feuilleton by Ben on 2. April 2012

von Ben Kaden

Dieser Beitrag ist Teil einer Debatte, die bisher veröffentlicht geführt wurde in:

Karsten Schuldt: Wer vom Diskurs redet, redet immer auch von der Gesellschaft. Eine Erwiderung. In: LIBREAS Weblog, 31.03.2012

Ben Kaden: Einladung zur Behauptung: Das Metadatum ist auch Diskurs. Eine Replik auf Karsten Schuldt. In: LIBREAS Weblog, 29.03.2012.

Karsten Schuldt: Der Diskurs ist kein Metadatum. Eine Replik zu Ben Kaden. In: LIBREAS Weblog, 29.03.2012.

Ben Kaden: Zur Diskursänderung. Eine Position zur Diskussion um die Zukunft der Informationswissenschaft. In: LIBREAS Weblog, 21.03.2012.


Es wird argumentiert, dass die Diskussion nach wie vor missverständlich verläuft. Dabei wird das Ziel der Verständigung als Kernbaustein des Diskurses unterstrichen. Um diese herbeizuführen, werden einige Gesichtspunkte der Position für die Einbeziehung diskursanalytischer Blickwinkel in das Methodenspektrum der Bibliotheks- und Informationswissenschaft konkretisiert. Weiterhin steht der Vorschlag, die methodologische Diskussion und die Debatte um die Grundausrichtung des Faches in zwei verschiedene Diskursstränge aufzugliedern.

Erst ein Impuls, dann eine Replik, dann eine Replik zur Replik, auf die eine Erwiderung und jetzt gibt es noch einmal eine Entgegnung – so sieht ein lebendiger Diskurs aus.

Ob der Kreisel eines solchen Zweiparteiengesprächs allerdings ab einer bestimmten Stufe noch fruchtbar zu nennen ist, muss ich in diesem Fall leider bezweifeln.

Insofern stellt sich Karsten Schuldts Einleitung als tatsächliche und leider auch hauptsächliche Gemeinsamkeit dar:

 Ich spreche wohl für uns beide, wenn ich dazu auffordere, dass sich auch andere an der Debatte beteiligen. Dies ist kein Privatstreit, sondern ein Versuch, sich dem (möglichen) Inhalt und der (möglichen) Arbeitsweise der Bibliothek- und Informationswissenschaft anzunähern.“

Abgesehen davon lässt mich seine Erwiderung so unzufrieden zurück, wie das meistens der Fall ist, wenn sich ein chronisches Missverstehen zu etablieren scheint.

„Mir scheint allerdings in dieser Replik, dass ein wichtiger Hauptpunkt meines Beitrages nicht klar geworden ist, den ich deshalb hier noch einmal ausführen möchte […]“

schreibt mein Kontrahent und ich kann ihn in gleicher Formulierung als Einstieg verwenden. Denn der Kernpunkt meiner Argumentation, der semiotische Horizont in dem sich Form, Bedeutung und Handeln bündeln, bleibt weiterhin zugunsten einer sozialwissenschaftlichen Forcierung, gegen die ich wenig habe, ausgeblendet. Auf das Wenige komme ich gleich zurück.

I – Nichts Neues. Oder: Wie sich verständigen?

Zuvor muss ich zu meiner Verteidigung ein wenig Diskurskritik üben. Denn nicht so sehr der Inhalt, sondern die Form von Karsten Schuldts Argumentation widerstrebt mir doch sehr.

Zunächst enttäuscht mich Karsten Schuldt mit dem Vorwurf mangelnder Neuheit:

„Kaden schlägt nun explizit vor, Dokumente und deren Metadaten explizit als Teil von Diskursanalysen zu verstehen und zu benutzen. Das ist vollkommen berechtigt. Es ist nur wenig neu.“

Einerseits, weil ich nicht sehe, dass die Diskursanalyse in der Geschichte der deutschen Bibliotheks- und Informationswissenschaft bisher eine relevante Rolle spielte.

Wenn Karsten Schuldt sich während seines Studiums am Berliner Institut durch entsprechende Methodenvorlesungen durcharbeiten durfte, dann beneide ich ihn außerordentlich. Ich habe aber bisher die führenden Bibliotheks- und Informationswissenschaftlerinnen der Bundesrepublik Deutschland zwar auf eine ganze Reihe von Akteuren – von Claude Shannon über Clifford Geertz bis Robert Musil und Niklas Luhmann – anspielen hören. Das einzige Mal, dass mir Michel Foucault aber als Referenz begegnete, war in einer Veranstaltung zum Bibliotheksrecht und ich ärgere mich heute noch mehr als damals, dass ich mir nicht merkte, weshalb auf einmal der Lektüretipp Surveiller et punir in den Seminarraum drang. Um die diskursanalytische Auswertung entsprechender kommunikativer Repräsentationen (Dokumente, Metadaten, Metadatenstrukturen) ging es dabei jedoch nicht.

Insofern mag in Karsten Schuldts akademischen Umfeld die Diskursanalyse anhand solcher Datenstrukturen ein alter Hut sein. In meiner Erfahrung mit der Bibliotheks- und Informationswissenschaft erscheint sie noch nicht mal als Häubchen vorhanden.

Andererseits ist der Abqualifizierung eines Argumentes mit dem Gegenargument, es sei wenig originell, Teil einer beliebten und leicht durchschaubaren rhetorischen Strategie, die Novität über Reflexion postiert um die eigene Position mittels Abwertung der des Gegenübers zu stärken. Generelle Neuigkeit ist natürlich genau einer dieser idealtypischen Ansprüche der Wissenschaftskommunikation die im Prinzip und gerade in argumentativen Fächern unhaltbar sind und die Karsten Schuldt mit der Möglichkeit von Diskursregeln eigentlich verwirft.

Nun fordert er mich im Gegenzug in seiner Diskurspraxis an diversen Stellen berechtigt und unberechtigt auf, gerade diesen Regeln Folge zu leisten, da mein Argument sonst nicht zählen kann. Wie er dabei den Geltungsanspruch seiner Argumentation schmälert, scheint ihm nicht bewusst zu sein.

Ich freue mich ja, dass Karsten Schuldt mir klare Aufgaben zuweist:

„ sollte er (a) nicht vom Diskurs reden und (b) begründen, was daran neu und / oder anders wäre“

mir also den „Raum des Sagbaren“ eingrenzt und mir die Richtung meiner Aussagen vorschreibt. Für die Schlüssigkeit seiner Ausführung ist diese Lücke zwischen Anspruch und Wirklichkeit aber nicht unbedingt hilfreich.

Karsten Schuldt manövriert sich meiner Lesart nach pikanterweise in das Fahrwasser des von ihm etwas verzerrten Verständnisses der Diskursethik.

Der geht es im Kern vor allem um eine Frage: Wie miteinander sprechen? Wie können wir uns verständigen? Wenn der eine Diskurspartner das Geschehen aber als Kampfsport begreift und der andere mehr als harmonisierenden Abgleich der Positionen haben wir schon ein fast unüberbrückbare Regeldiskrepanz. Zu den Regeln des seines Vollzugs bewussten Diskurses, wozu für mich der Diskurs in der Wissenschaft zählen sollte, gehört für mich auch die Pflicht des Verstehen-Wollens, also ein gewisses Maß an Affirmation. Aber es ist selbstverständlich Ansichts- und manchmal auch Mentalitätssache, ob man Aussagen mehr hinsichtlich des Trennenden und also der Abweichungen vom Eigenen hin interpretiert oder umgekehrt auf das Verbindende bzw. die Übereinstimmung.   (more…)

Der Diskurs ist kein Metadatum. Eine Replik zu Ben Kaden

Posted in LIBREAS.Feuilleton by Karsten Schuldt on 29. März 2012

Von Karsten Schuldt

Ben Kaden hat vor kurzem an dieser Stelle seine Überlegungen zur Erweiterung der Bibliotheks- und Informationswissenschaft dargelegt. Ich möchte diesen in wichtigen Punkten widersprechen. Der Widerspruch erfolgt aus zwei Gründen: Erstens scheint mir ein gewichtiges Missverständnis bei der Verwendung des Diskursbegriffes vorzuliegen, welcher in einer inhaltlich problematischen Engführung enden könnte, die zudem den kritischen Gehalt des Begriffes verleugnet. Zweitens soll diese Replik als Einladung verstanden werden, sich an der Diskussion über den Inhalt der Bibliotheks- und Informationswissenschaft zu beteiligen. Meine Position ist nicht annähernd so weit ausgebaut, wie die von Ben Kaden, (bin ich ehrlich, habe ich mir bislang nie Gedanken über die Gesamtheit der Informationswissenschaft gemacht, auch weil es bislang interessanterweise nicht notwendig zu sein scheint, um sie oder doch zumindest den Teilbereich Bibliothekswissenschaft zu betreiben) dennoch äussere ich mich in der Hoffnung, dass auch andere sich äussern werden – und sei es mit einer Widerlegung. (more…)

User Generated Metadata als Werbeeffekt?

Posted in LIBREAS.Referate, Sonstiges by Karsten Schuldt on 6. Januar 2012

Von Karsten Schuldt

[Zu: (Preprint) Hercher, Johannes; Ruhl, Marcel & Sack, Harald (2012) / Quo vadis nutzergenerierte Metadaten?. – In: Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung der DGI, Düsseldorf, 22.-23. März 2012, Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt, (2012, forthcoming). – http://www.hpi.uni-potsdam.de/fileadmin/hpi/FG_ITS/Semantic-Technologies/paper/Hercher2012.pdf]

Dies ist keine Rezension, sondern eher die Darstellung einer massiven Irritation.

Auf den Text von Hercher, Ruhl und Sack über ihre Umfrage zum Einsatz von Nutzerinnen- und Nutzergenerierten Metadaten wurde in den letzten Tagen relativ oft hingewiesen. Über diesen sollten wir vielleicht aber einmal reden und ihn nicht nur verbreiten. So grundsätzlich positiv, wie die Ergebnisse des Textes dargestellt werden, sind sie meines Erachtens nicht.

Hercher, Ruhl und Sack führten eine Online-Umfrage bei Bibliotheken, Archiven und Museen durch, bei der sie den Umgang dieser Einrichtungen mit user generated metadata erfragten. Der Text sollte über diese Umfrage berichten. 51 Einrichtungen aus Deutschland, Österreich und der Schweiz nahmen an der Umfrage vollständig teil. Da es keine Ausgabe dazu gibt, wie viele Einrichtungen überhaupt von Nutzerinnen und Nutzern generierte Daten benutzen, ist nicht klar, wie repräsentativ diese Teilnahme war. Allerdings geben die Autoren selber an, dass die Umfrage 1.341-mal aufgerufen wurde. Dies bedeutet eine erstaunlich hohe Zahl (96,2%) von Abbrüchen, welche weit über Werten anderer Umfragen liegt und die von den Autoren nur mit relativ zweifelhaften Argumenten abgetan werden. Sicherlich kann, wie die Autoren argumentieren, ein Teil der Interessierten die Umfrage abgebrochen haben, weil die Software nicht funktionierte oder weil sie in ihrer Institution nicht in der Position waren, die Fragen zu beantworten. Aber das erklärt eine solche Abbruchrate nicht. Vielmehr hätten sich Hercher, Ruhl und Sack die Frage stellen müssen, was diese rabiate Selbstselektion der Teilnehmenden über das Thema der Umfrage oder die Umfrage selber aussagt. Eventuell wurde die Umfrage von Interessierten nicht als sinnvoll erachtet, eventuell gab es auch massive Probleme mit den konkreten Fragestellungen.1

So oder so muss man bei den gesammelten Daten davon ausgehen, dass diese das Ergebnis einer extremen Selbstselektion darstellen. Hier haben mit sehr hoher Wahrscheinlichkeit nur noch die Individuen oder Einrichtungen geantwortet, die selber ein äußerst starkes Interesse am Thema haben. Es sagt etwas über die Wertigkeit des Themas aus, wenn gerade einmal 51 Einrichtungen aus drei Staaten etwas zu ihm zu sagen haben. Es scheint – im Gegensatz zu den Aussagen der Autoren –, dass sich nur wenige Bibliotheken, Archive und Museen überhaupt für user generated metadata interessieren. Dem steht eine relative breite Thematisierung in der Bibliotheks- und Informationswissenschaft gegenüber. Für diesen Diskurs könnte die Umfrage ein Realitätscheck sein, denn selbstverständlich ist es von Interesse, wenn die Einrichtungen, über die Diskurse geführt werden, diese Diskurse mehrheitlich ignorieren oder von ihnen nicht erreichen werden.

Stattdessen nutzen die Autoren ihre Daten, als wäre sie repräsentativ, was sie nicht sind. Weitere Kritik ist anzubringen. Die Autoren ignorieren die wichtige Frage, wie stark die von Ihnen gesammelten Antworten sozial erwünscht sind. Dies ist allerdings bei Ihren Daten keine unwichtige Frage, kann man diese doch grob wie folgt zusammenfassen: Alle sind irgendwie dafür, die von Nutzerinnen- und Nutzern generierten Daten zu benutzen, aber vor allem wird ihnen einen Bedeutung bei der Bindung von Nutzerinnen und Nutzern zugeschrieben. Sozial erwünscht ist letztere Antwort gewiss nicht, zumindest nicht, wenn man sie etwas weiter denkt und „Bindung“ als Werbung und Werbemassnahme übersetzt. Erwünscht hingegen sind Antworten, die Kommentaren, Hinweisen von Nutzerinnen und Nutzern und weiterem eine Bedeutung zumessen – wir leben nun mal in Zeiten, in welchen das Engagement von Bürgerinnen und Bürgern erwünscht ist (das sind fraglos nicht die schlechtesten Zeiten und Ziele). Bedenkt man dies alles, wertet die Abgabe sozial erwünschter Antworten als nicht so wichtig, die Abgabe sozial unerwünschter Antworten hingegen als wichtiger, dann sind die Ergebnisse von Hercher, Ruhl und Sack noch erstaunlicher. Offenbar wird von den wenigen Einrichtungen, die sich für das Thema user generated metadata interessieren, in ihnen vor allem ein Werbeeffekt gesehen. Ist das statthaft? Was sagt das aus?

Vielleicht ist das eine negative Wertung der Ergebnisse, aber sie erscheint nicht weiter hergeholt, als die von den Autoren vorgelegte. Diese weisen selber darauf hin, dass die antwortenden Einrichtungen – trotz aller Selbstselektion – eher enttäuscht von den Daten, die von den Nutzerinnen und Nutzern geliefert wurden, seien. Hier wäre ein Ansatz für weitere Forschungen, nämlich darüber nachzudenken, was genau die Bibliotheken, Archive und Museen eigentlich erwarten und welche Daten Nutzerinnen und Nutzer eigentlich erstellen sollten. Auch hier hätten die Daten der Umfrage eher dazu genutzt werden können, darüber nachzudenken, wie weit der Diskurs über die Daten und ihre Nutzungsmöglichkeiten von der tatsächlichen Nutzung in den Einrichtungen entfernt ist und warum.

Im letzten Teil ihrer Arbeit versuchen die Autoren dann aufgrund einer Literaturrecherche Barrieren bei der Verwendung von user generated metadata zu identifizieren. Das allerdings ist inhaltlich eher ein zweiter Artikel und es ist nicht so richtig klar, warum die Autoren diesen Teil mit den Daten zusammen publizierten. Aber auch so ist der Abschnitt erstaunlich: Die Autoren gehen explizit davon aus, „dass sich Nutzer unaufgefordert beteiligen, sofern die Barrieren dazu nicht zu hoch sind.“ (Hercher, Ruhl & Sack, 2011, S. 11) Dies wird zwar konsequent durchgeführt, aber es ist doch ein absonderliches Menschenbild: Die Nutzerinnen und Nutzer würden quasi darauf warten, sich an der Arbeit von Bibliotheken, Archiven und Museen zu beteiligen, nur würden sie zur Zeit davon abgehalten werden. Diese Vorstellung widerspricht nicht nur den Forschungen zum menschlichen Verhalten in so unterschiedlichen Feldern wie der Politik- und Sozialwissenschaft – insbesondere der Engagementforschung –, der Psychologie oder auch der Werbeindustrie; sondern selbstverständlich auch allen Alltagserfahrungen. Menschen engagieren sich, wenn sie sich engagieren wollen und dazu angehalten werden. Sicherlich gibt es Barrieren, die sie dann auch noch davon abhalten können, dass zu tun. Wenn, dann wäre es sinnvoll gewesen, nach einer Förderung des Engagements zu fragen. Die Möglichkeit zum Engagement – beziehungsweise der Lieferung von Daten – zu schaffen ist zwar eine Voraussetzung, aber das alleine wird keine neuen Daten hervorbringen.

Der Text ließt sich, als hätten die Autoren unter dem Druck gestanden, ihre Daten publizieren zu müssen, egal was die Ergebnisse sind. Dieses Problem ist bekannt und ein Ergebnis von bestimmten Strukturen der Forschungsförderung, von Deadlines und der bekannten Arbeitsüberlastung. Insoweit sollte das den Autoren nicht vorgeworfen werden. Dennoch wirkt es sich bei diesem Text eher negativ aus. Die von ihnen durchgeführte Umfrage hat Daten hervorgebracht, die weiter tiefer und anders hätten diskutiert werden müssten, als sie es tun. Dazu hätten sie ihre – ehedem nicht hergeleitete – These aufgeben und andere Fragen stellen müssen. Aber vielleicht kann dies im Nachhinein geschehen.

Diese Fragen wären meines Erachtens:

  • Gibt es (aktuell) überhaupt ein tatsächliches Interesse in Bibliotheken, Archiven und Museen zur Nutzung von Daten und Metadaten, die von Nutzerinnen und Nutzern erstellt wurden? Immerhin gibt es einen gewissen Diskurs über diese Möglichkeit. Oder gibt es nur eine sehr kleine Anzahl von Einrichtungen, die sich dafür interessieren? Wenn ja, warum?
  • Welche Vorstellungen und Wünsche haben die Einrichtungen, die sich auf diese Daten einlassen, überhaupt, wenn sie von den gelieferten Daten eher enttäuscht sind?
  • Haben die Einrichtungen überhaupt einen Workflow, um mit user generated metadata umzugehen? In der Umfrage wurde abgefragt, ob sie die Daten wichtig finden, aber nicht, ob sie sich auf diese überhaupt einlassen.
  • Haben die Einrichtungen überhaupt Vorstellungen davon, wie sie die Daten außer zu Werbezwecken einsetzen wollen? „Benötigen“ sie überhaupt Daten?
  • Was sagt der Riss zwischen den Diskurs über die Möglichkeiten dieser Daten und das eher geringe tatsächliche Interesse aus?

Ich weiß, eigentlich sollten Texte positiver besprochen werden. Aber dieser ließ mich eher erstaunt zurück und ich wollte dieses Erstaunen teilen. Vielleicht bin ich aber auch nur wieder der mit den zu großen Ansprüchen.

1Zu hinterfragen ist zumindest die Methodik, die Beantwortung der Fragen durch Individuen zuzulassen, aber diese für eine Einrichtung sprechen zu lassen.