LIBREAS.Library Ideas

Querverweise zwischen Zeitschriftenaufsätzen und Forschungsdaten: rebi, ein R-Paket für Europe PMC

Posted in LIBREAS.Projektberichte, LIBREAS.Visualisierung by libreas on 11. April 2013

Seit wenigen Tagen steht eine erste Version des R-Pakets rebi als Teil von rOpenSci zur Verfügung. rebi ermöglicht die Aggregation und Exploration der in Europe PubMed Central (Europe PMC) indexierten Veröffentlichungen und Forschungsdaten.

Zu diesem Zwecke fragt rebi den kürzlich veröffentlichten Europe PMC RESTful Web Service ab. Die API ergänzt das bereits seit längerem bestehende SOAP-Interface, das beispielsweise im Projekt OpenAIREplus die Basis für einen disziplinären Demonstrator bildete.

Ein Ergebnis des Demonstrators – die Erschließung und Sichtbarmachung von Querverweisen zwischen Publikationen und Forschungsdaten am European Bioinformatics Institute (EBI) – nutzt das Repository PUB – Publikationen an der Universität Bielefeld nach. Bis dato konnten rund 70.000 Querverweise zwischen EBI-Datenbanken wie dem European Nucleotide Archive (ENA) oder UniProt und 600 biowissenschaftlichen Veröffentlichungen automatisch identifiziert und auf Artikelebene eingebunden werden.

rebi war zunächst für die statistische Begleitung der EBI-Anreicherung in institutionelle Forschungsservices gedacht. Jedoch erlaubt das R-Paket weitere Dimensionen der Datenexploration, wie z.B die der Querweise auf Ebene eines Journals.

rebi

Die obige Abbildung zeigt die Verteilung der in Europe PMC indexierten Artikel der Zeitschrift PLOS Genetics nach Publikationsjahr. EBI-Services verweisen zu 2.226 Veröffentlichungen (Variable „Y“) von insgesamt 3.499 indexierten Beiträgen (63,61 %). Die Diskrepanz der Verteilung für das Jahr 2013 lässt sich mit dem Zeitfenster erklären, das die Datenspezialisten am EBI für ihre häufig auch intellektuelle Erschließung der Verweise nach der Journal-Veröffentlichung benötigen. Daher sollten entsprechenden Auswertungen und auch die Aggregation für eigene Bibliotheksanwendungen regelmäßig wiederholt werden.

Mit rebi lässt sich das obige Säulendiagramm mit fünf einfachen Funktionsaufrufen erstellen.

require(rebi)
#get metadata for PLOS Genomics by ISSN
plos.genetics <- searcheuropmc(query="ISSN:1553-7404")

#format year published to date object
plos.genetics$pubYear <-format(plos.genetics$pubYear, format="%Y")

#relevel according to frequency of occurrence Cross-Links to EBI databases
plos.genetics$hasDbCrossReferences <- factor (plos.genetics$hasDbCrossReferences, 
levels = c(rownames(data.frame(rev(sort(table(plos.genetics$hasDbCrossReferences)))))))

#plot
require(ggplot2)

p <- ggplot(plos.genetics, aes(pubYear, ..count.., fill = hasDbCrossReferences)) + 
geom_bar() + theme_bw() +
scale_fill_brewer("EBI\nCross-References",palette="Accent") + 
xlab("Year") + ylab("PLOS Genetics Articles") + 
opts(legend.key=theme_rect(fill="white",colour="white"))

#save plot
ggsave(plot = p, "rebi.png", h = 3.08, w = 7.2)

rebi soll kontinuierlich erweitert werden und enthält derzeit neben der allgemeinen Suchfunktion Aufrufe für die Gewinnung der bibliographischen Metadaten der referenzierten Veröffentlichungen und Zitationen sowie die Berechnung der Anzahl der EBI-Querverweise je Artikel. Weitere rebi-Funktionen können die Gewinnung der Nukleinsäuresequenzen etwa im FASTA-Format ebenso ermöglichen wie die Aggregation der vom EBI automatisch extrahierten Schlagwörter und Taxonomien.

Literatur

McEntyre J.R., Ananiadou S., Andrews S., Black W.J., Boulderstone R., Buttery P., Chaplin D., Chevuru S., Cobley N., Coleman L.-A., et al. UKPMC: a full text article resource for the life sciences. Nucleic Acids Res. 2011;39:D58–D65.PMC3013671

(Najko Jahn)

Advertisements

Library Life. Ein Interview zu einem interdisziplinären Forschungsprojekt.

Posted in LIBREAS aktuell, LIBREAS.Interview by libreas on 11. April 2013

von Lars Müller

In der Bibliotheks- und Informationswissenschaft spricht man häufig und gerne über die Erforschung vom Leben in und um Bibliotheken . Bibliotheks- und informationswissenschaftliche Studien dazu sind aber erstaunlicherweise im deutschsprachigen Raum Raritäten. Ebenso überraschend greifen in wachsender Zahl andere Disziplinen dieses Themenfeld auf. Eines dieser Projekte ist die Research Area 8, Cultures of Knowledge, Research, and Education im International Graduate Centre for the Study of Culture an der Universität Giessen. Dort ist Friedolin Krentel einer der Ansprechpartner für das Forschungsprojekt „Library Life“. Ich war daher neugierig auf das Giessener Projekt und habe für das LIBREAS-Blog per E-Mail nachgefragt.
Lars Müller (LM): Aus welchen Disziplinen stammen die beteiligten Forscher/innen Eurer Arbeitsgruppe, sind Bibliotheks- und Informationswissenschaftler/innen beteiligt?

Friedolin Krentel (FK): Unsere Arbeitsgruppe zu „Library Life“ ist aus disziplinärer Hinsicht sicherlich ein bunt zusammengewürfelter Haufen. Sie setzt sich heute aus etwa 8 bis 10 Wissenschaftler*innen zusammen, die aus ganz unterschiedlichen Fachrichtungen wie Ethnologie, Germanistik, Geschichte, Informatik, Literaturwissenschaften, Medienwissenschaften und den Sozialwissenschaften kommen. Ausgewiesene Bibliotheks- und/oder Informationswissenschaftler*innen sind leider nicht dabei. Ich könnte mir aber durchaus vorstellen, dass sich die Vielfalt unserer disziplinären Hintergründe zusammengenommen im Zusammenspiel mit unserem Forschungsinteresse sicherlich in mancherlei Hinsicht mit informationswissenschaftlichen Ansätzen und Perspektiven assoziieren lässt.

LM: Worauf richtet sich Euer Erkenntnisinteresse: Alltag der Forscher/innen, Entstehung von Wissen oder Information, Bibliothek als Raum…?

FK: Unser Projekt entwickelte sich innerhalb der Research Area 8 über einen Zeitraum von beinahe zwei Jahren aus einer intensiven Beschäftigung mit Texten der Akteur-Netzwerk-Theorie (ANT) um Bruno Latour und Michel Callon. Das kann man zum Beispiel auch am Titel „Library Life“ sehen, der bewusst auf die von Bruno Latours und Steven Woolgars 1979 publizierte Untersuchung namens „Laboratory Life“ (Bruno Latour, Steve Woolgar (1986): Laboratory life. The construction of scientific facts. Beverly Hills : Sage Publ, 1979. Wikipedia-Seite zur Publikation) anspielt. Die Studie beschäftigt sich mit Praktiken der Wissensproduktion in naturwissenschaftlichen Laboren und liefert wichtige Impulse für die fortlaufende Entwicklung der ANT.

In „Library Life“ wollen wir nun in gewisser Weise mit der ANT experimentieren, um zu überprüfen, inwiefern deren analytisches Instrumentarium sich auch für sozial- und geisteswissenschaftliche Wege der Wissensproduktion nutzen lässt bzw. welche neuen Erkenntnisse und Beschreibungen sich aus dieser Perspektive ergeben. Unser Fokus liegt auf der Rekonstruktion der individuellen Praktiken der Wissensorganisation und Textproduktion von Sozial- und Geisteswissenschaftler*innen. Dabei wollen wir sowohl ideelle, praktische als auch materielle Einflussfaktoren des wissenschaftlichen Arbeitsalltags aufzeigen, um damit den Prozess der Wissensgenerierung “sichtbarer” und „(be-)greifbarer“ beschreiben zu können.

Gerade angesichts einer immens fortschreitenden Umstellung der Arbeitsumgebungen im Zuge von „Computerisierung“ und Vernetzung der verwendeten Werkzeuge und Hilfsmittel sowie der möglicherweise parallelen Verwendung von „analogen“ (Zettelkasten, Karteikarten, handschriftliches Exzerpieren) und „digitalen“ (Literaturverwaltungsprogramme, vernetzte Suchalgorithmen, relationale Datenbanken, kollaborativ-vernetztes Arbeiten) Methoden, kann hier von einer Vielfalt unterschiedlichster Vorgehensweisen und Strategien zur Erzeugung wissenschaftlicher Erkenntnisse ausgegangen werden.

LM: Wie lautet Eure forschungsleitende These?

FK: Analog zu den laboratory studies nehmen wir als heuristische Arbeitshypothese an, dass die Arbeitszimmer, Bibliotheken und Büros die Labore, respektive Werkstätten sozial- und geisteswissenschaftlicher Wissensproduktion sind. Als Arbeitsorte oder Arbeitsumwelten mit einer spezifisch gestalteten Logik, materiellen Ausstattung sowie bestimmten Eigenschaften und Eigenarten sind sie unmittelbar in die Praktiken des wissenschaftlichen Erkenntnisprozess involviert und werden zugleich durch diese Praktiken als (sozial- und/oder geistes-)wissenschaftliche Handlungsorte hervorgebracht. Der wissenschaftliche Erkenntnisprozess findet damit nicht „nur“ auf einer rein geistigen Ebene statt, sondern beinhaltet immer auch einen praktischen (und zumeist wenig reflektierten) Umgang mit in gewisser Weise auch widerspenstigen Elementen der Arbeitsumwelt. Dabei kann es sich auf der einen Seite um ganz offensichtliche Dinge wie Computer, spezielle Programme, Bücher, Notizen usw. handeln. Aber ebenso könnten auch Dinge wie Lieblingsstifte, Bilder, Skulpturen, der Blick aus dem Fenster, die Kaffeemaschine im Büro, Pflanzen usw. eine Rolle spielen. Die Liste ließe sich sicherlich nahezu unendlich fortsetzen, man muss sich nur mal überlegen was am eigenen Schreibtisch so alles herumsteht oder liegt.

Mit dem von der ANT postulierten „symmetrischen Blick“ auf Wissen schaffende Praxen, gehen wir also davon aus, dass diese materiellen Ensemble im Zusammenspiel der im Umgang mit ihnen durchgeführten Praktiken direkt in die inhaltliche und formale Gestalt wissenschaftlicher Texte einfließen. Entsprechend sieht unsere empirische Datenerhebung ausdrücklich vor, das jeweilige Arbeitsumfeld und dessen Ausstattung und Dinge einzubeziehen.

LM: Welche Methoden benutzt ihr?

FK: Die Auswahl geeigneter Methoden für unser Unterfangen war innerhalb der interdisziplinären Forschungsgruppe ein längerer Prozess. Im Kern ging es darum, die methodologischen Anforderungen des Forschungsinteresses mit dem dazu notwendigen individuellen Aufwand für die parallel an ihren jeweiligen Dissertationen arbeitenden Doktorand*innen der Arbeitsgruppe abzuwägen.
Da es uns unmöglich erschien neben der Dissertation eine ethnografische Beobachtung der häufig mehrere Monate oder gar Jahre andauernden Arbeit an wissenschaftlichen Texten in Aktion im Sinne der ANT durchzuführen, versuchen wir mittels narrativer Interviews einen Reflexionsprozess bei den Interviewpartner*innen über ihr eigenes Tun anzustoßen. Sie sollen damit sozusagen zu Ethnograf*innen ihrer Selbst werden und uns – orientiert an einem von ihnen publizierten Artikel – dessen Entstehungsgeschichte rekonstruierend erzählen. Um die dinglichen, körperlichen und praxeologischen Dimensionen der Wissenserzeugung nicht aus dem Blick zu verlieren, entschieden wir uns dazu, die Interviews an dem von den Interviewpartner*innen als ihrem textspezifisch-persönlichen Hauptarbeitsort – sei es nun in der Bibliothek, dem Büro oder auch ein privates Zimmer – benannten Ort durchzuführen. Die Interviews werden jeweils zu zweit durchgeführt, so dass immer eine Person sich auf die Beobachtung des räumlich-materiellen Ensembles sowie dessen gestische Einbeziehung in die Erläuterung konzentrieren kann. Die Beobachtungen sowie unser im Vorfeld für die materiell-praxeologischen Dimensionen sensibilisierte Blick dienen dann im späteren Verlauf des Interviews dazu, möglichst offene Fragen zu konkreten Umgangsweisen und Bedeutungen einzelner erwähnter, gezeigter oder auch unerwähnter Elemente zu stellen.

Als Vorbereitung für die Interviews identifizierten wir aus unseren eigenen Arbeitsweisen potentiell relevante Aspekte und entwickelten daraus eine Art Leitfaden, der aber bestenfalls erst dann zum Einsatz kommen soll, wenn sich aus dem Interview selbst oder den Beobachtungen keine weiteren Fragen mehr ergeben. Die freie Erzählung unserer Interviewpartner*innen soll im Vordergrund stehen! Da es innerhalb unserer Forschungsgruppe unterschiedlich ausgeprägte Erfahrungen mit Interviews (und speziell narrativen Interviews) gibt, soll der Leitfaden auch als eine Hilfestellung für die unerfahreneren Kolleg*innen dienen.
Mit Einverständnis der Interviewpartner*innen würden wir im Anschluss an das Interview auch noch versuchen einzelne wichtige Elemente und/oder den gesamten Arbeitsraum mittels Videokamera und Fotoapparat zu dokumentieren, um diese dann für die Analyse in der Gruppe nutzen zu können und den individuellen Erinnerungsprozess beim Schreiben und Auswerten der Beobachtungsprotokolle zu unterstützen.

LM: Wie ist die Gruppe der Untersuchten zusammengesetzt?

FK: Als Sample für unsere Interviewanfragen haben wir in erster Linie persönlich bekannte Wissenschaftler*innen aus unterschiedlichen geistes- und sozialwissenschaftlichen Disziplinen und in verschiedenen Karrierestadien – von Doktorand*in bis Professor*in – ins Auge gefasst. Aufgrund der teilweise in privaten Bereichen stattfindenden Interviews, erscheint uns ein gewisses bereits im Vorfeld bestehendes Vertrauensverhältnis wichtig für den Zugang und die individuelle Bereitschaft für ein Interview. Insgesamt werden wir – zumeist zu zweit und in unterschiedlichen Konstellationen – jeweils zwei Interviews führen, wodurch sich unsere Untersuchungsgruppe auf insgesamt etwa 10 Personen begrenzen lässt. Zusätzlich überlege ich derzeit, ob es nicht auch interessant wäre, unsere eigenen wissenschaftlichen Arbeitsweisen innerhalb von „Library Life“ zu beobachten. Als Ausgangspunkt könnte beispielsweise unsere Klausurtagung zur gemeinsamen Sichtung und Analyse des Datenmaterials dokumentiert werden und für eine Art Metaanalyse dienen.

LM: In welcher Phase befindet sich das Projekt „Library Life“ zur Zeit?

FK: Die Phase der Datenerhebung per Interviews läuft. Sie wird sich noch bis Ende Mai hinziehen. Soweit ich weiß, wurden bereits erste Interviews geführt und einige Zusagen sind ebenfalls eingegangen, die dann im April/Mai in Angriff genommen werden. Für Anfang Juni haben wir uns mit der bereits erwähnter Klausurtagung eine klare Deadline gesetzt, zu der die Interviews definitiv abgeschlossen sein sollten. In dieser Klausurtagung wollen wir uns dann gemeinsam über mehrere Tage den Daten und ihrer Analyse widmen, um wichtige Aspekte herauszuarbeiten, die anschließend in kleineren Gruppen vertiefend behandelt werden können. Außerdem steht auf der Klausurtagung noch an, dass wir uns angesichts der vorläufigen Ergebnisse über mögliche Publikationsformate einigen, womit wir dann ja auch gleich bei der nächsten Frage angekommen sind.

LM: Ich bin gespannt auf Eure Ergebnisse. Wann und wo werdet ihr sie publizieren?

FK: Wie gesagt, steht das wo und wie noch nicht fest. Wir haben in diversen Arbeitstreffen zwar bereits mehrere Male das Thema Publikationsformen angesprochen, konnten und wollten uns da aber noch nicht endgültig festlegen. Die Tendenz geht aber – aus meiner Sicht – dahin, dass wir uns den November diesen Jahres als Deadline setzen, zu der wir uns gegenseitig und daran anschließend sicherlich auch noch auf unterschiedlichen Tagungen die Teilergebnisse der einzelnen Arbeitsgruppen vorstellen werden. Wie diese dann abschließend fixiert werden, sei es nun als gemeinsamer Sammelband, einzelne Artikel oder auch in Form einer Ausstellung oder online-Präsenz (oder auch mehrere Formate parallel) kann ich jetzt noch nicht sagen. Ich denke aber, dass wir dann im Juni weiter sind. Wer sich also dafür interessiert, kann sich bereits jetzt oder dann im Juni hoffentlich ausführlicher auf der Homepage der Research Area 8 informieren.

Zum Abschluss möchte ich mich für die spannenden Fragen bedanken, die mir einerseits die Möglichkeit eingeräumt haben, „Library Life“ vorzustellen, die mich aber darüber hinaus auch dazu angeregt haben, unser Projekt nochmal neu zu reflektieren und zu formulieren. Vielen Dank!

LM: Ich danke Dir!

(April 2013)