LIBREAS.Library Ideas

Neu erschienen: LIBREAS #23: Forschungsdaten, Metadaten, noch mehr Daten. Forschungsdatenmanagement.

Posted in LIBREAS aktuell by libreas on 10. Oktober 2013

Kurz: Die neue Ausgabe der LIBREAS (www.libreas.eu) ist erschienen und wir sind einigermassen stolz auf sie und ihr neues Gesicht. Wir entlassen sie jetzt in die Welt.


Aber lieber länger: Man muss jetzt nicht wieder von lange währenden und endlich guten Dingen philosophieren, wenn man das Planungsdatum und das Ausgabedatum der aktuellen LIBREAS-Ausgabe vergleicht. Denn eigentlich ergeht es uns ja immer so. In diesem Fall jedoch macht es uns noch weniger aus als sonst. Denn einerseits trägt uns das Gefühl, dass wir eine Ausgabe zusammengetragen haben, die uns in ihrer Qualität sehr zufriedenstellt. Und andererseits haben wir sie und zugleich das Archiv das gesamte LIBREAS-Ausgabenarchiv in eine technologische Struktur umgebettet, die aus unserer Sicht sehr auf der Höhe der Zeit ist. Ein Beitrag dazu wird demnächst folgen. In jedem Fall sollten Anmutung, Navigation und (Nach-)Nutzung der Inhalte von LIBREAS so einfach sein, wie nie zuvor.

Wir werden in den nächsten Wochen sicher noch an der einen oder anderen Stelle nachjustieren. Rückmeldungen und Anmerkungen zur neuen Fassung des mittlerweile schon fast klassischen Modells LIBREAS sind sehr willkommen. Zugleich evaluieren wir natürlich den Sprung der Zeitschrift mit den üblichen altmetrischen Argusaugen und sind sehr zuversätzlich.

Es ist vermutlich generell nicht übertrieben, wenn man schreibt, dass die Redaktion mit dieser Ausgabe das Gefühl hat, als ginge es nun mit LIBREAS erst wirklich los.

In jedem Fall haben wir sehr viel Lust auf Zukunft. Wobei sich das Stichwort zum Verweis auf den aktuellen Call for Papers und die nächste Ausgabe wie von selbst eingestellt hat: Zukünfte. Wobei weniger die Zukünfte von LIBREAS im Zentrum stehen, als die der Bibliotheken und allem, was thematisch so darum herum schwirrt.

Nachstehend nun das Inhaltsverzeichnis. Wir wünschen viel Freude und / oder Anregung mit LIBREAS #23.

(red. / @libreas / 10.10.2013)

Coverbild LIBREAS #23

Redaktion LIBREAS Editorial #23: Forschungsdaten, Metadaten, noch mehr Daten. Forschungsdatenmanagement


Schwerpunkt: Daten. Metadaten. Noch mehr Daten. Forschungsdatenmanagement

Allgemein

Jakob Voß Was sind eigentlich Daten?
Christiane Laura Martin Wissenschaftliche Bibliotheken als Akteure im Forschungsdatenmanagement
René Schneider, Jasmin Hügi Motivationen für die Nutzung einer digitalen Forschungsinfrastruktur

Beispiele

Sven Vlaeminck, Gert G. Wagner, Joachim Wagner, Dietmar Harhoff, Olaf Siegert Replizierbare Forschung in den Wirtschaftswissenschaften erhöhen – eine Herausforderung für wissenschaftliche Infrastrukturdienstleister
Maxi Kindling, Elena Simukovic, Peter Schirmbacher Forschungsdatenmanagement an Hochschulen: Das Beispiel Humboldt-Universität zu Berlin
Tim Hasler, Wolfgang Peters-Kottig Vorschrift oder Thunfisch? – Zur Langzeitverfügbarkeit von Forschungsdaten
Patrick Sahle, Simone Kronenwett Jenseits der Daten: Überlegungen zu Datenzentren für die Geisteswissenschaften am Beispiel des Kölner „Data Center for the Humanities“
Jenny Delasalle Research Data Management at the University of Warwick: recent steps towards a joined-up approach at a UK university
Claudia Engelhardt Forschungsdatenmanagement in DFG-SFBs: Teilprojekte Informationsinfrastruktur (INF-Projekte)


Beiträge

Armin Talke Verwaiste und vergriffene Werke: Kommt das 20. Jahrhundert endlich in die Digitale Bibliothek?


Rezensionen

[Rezension:] Karsten Schuldt Leerstellen der Diskussion: eine kritische Besprechung der Abschlussberichte des RADIESCHEN-Projekts
[Rezension:] Petra Hauke Rezension zu: Catalogue 2.0. The future of the library catalogue.
[Rezension:] Ben Kaden Rezension zu: All This Can Happen (2012) und Living Archive (2013)


Freier Teil

Ben Kaden Ein neuer Gedenkort in Berlin: Dubček an der Staatsbibliothek

Querverweise zwischen Zeitschriftenaufsätzen und Forschungsdaten: rebi, ein R-Paket für Europe PMC

Posted in LIBREAS.Projektberichte, LIBREAS.Visualisierung by libreas on 11. April 2013

Seit wenigen Tagen steht eine erste Version des R-Pakets rebi als Teil von rOpenSci zur Verfügung. rebi ermöglicht die Aggregation und Exploration der in Europe PubMed Central (Europe PMC) indexierten Veröffentlichungen und Forschungsdaten.

Zu diesem Zwecke fragt rebi den kürzlich veröffentlichten Europe PMC RESTful Web Service ab. Die API ergänzt das bereits seit längerem bestehende SOAP-Interface, das beispielsweise im Projekt OpenAIREplus die Basis für einen disziplinären Demonstrator bildete.

Ein Ergebnis des Demonstrators – die Erschließung und Sichtbarmachung von Querverweisen zwischen Publikationen und Forschungsdaten am European Bioinformatics Institute (EBI) – nutzt das Repository PUB – Publikationen an der Universität Bielefeld nach. Bis dato konnten rund 70.000 Querverweise zwischen EBI-Datenbanken wie dem European Nucleotide Archive (ENA) oder UniProt und 600 biowissenschaftlichen Veröffentlichungen automatisch identifiziert und auf Artikelebene eingebunden werden.

rebi war zunächst für die statistische Begleitung der EBI-Anreicherung in institutionelle Forschungsservices gedacht. Jedoch erlaubt das R-Paket weitere Dimensionen der Datenexploration, wie z.B die der Querweise auf Ebene eines Journals.

rebi

Die obige Abbildung zeigt die Verteilung der in Europe PMC indexierten Artikel der Zeitschrift PLOS Genetics nach Publikationsjahr. EBI-Services verweisen zu 2.226 Veröffentlichungen (Variable „Y“) von insgesamt 3.499 indexierten Beiträgen (63,61 %). Die Diskrepanz der Verteilung für das Jahr 2013 lässt sich mit dem Zeitfenster erklären, das die Datenspezialisten am EBI für ihre häufig auch intellektuelle Erschließung der Verweise nach der Journal-Veröffentlichung benötigen. Daher sollten entsprechenden Auswertungen und auch die Aggregation für eigene Bibliotheksanwendungen regelmäßig wiederholt werden.

Mit rebi lässt sich das obige Säulendiagramm mit fünf einfachen Funktionsaufrufen erstellen.

require(rebi)
#get metadata for PLOS Genomics by ISSN
plos.genetics <- searcheuropmc(query="ISSN:1553-7404")

#format year published to date object
plos.genetics$pubYear <-format(plos.genetics$pubYear, format="%Y")

#relevel according to frequency of occurrence Cross-Links to EBI databases
plos.genetics$hasDbCrossReferences <- factor (plos.genetics$hasDbCrossReferences, 
levels = c(rownames(data.frame(rev(sort(table(plos.genetics$hasDbCrossReferences)))))))

#plot
require(ggplot2)

p <- ggplot(plos.genetics, aes(pubYear, ..count.., fill = hasDbCrossReferences)) + 
geom_bar() + theme_bw() +
scale_fill_brewer("EBI\nCross-References",palette="Accent") + 
xlab("Year") + ylab("PLOS Genetics Articles") + 
opts(legend.key=theme_rect(fill="white",colour="white"))

#save plot
ggsave(plot = p, "rebi.png", h = 3.08, w = 7.2)

rebi soll kontinuierlich erweitert werden und enthält derzeit neben der allgemeinen Suchfunktion Aufrufe für die Gewinnung der bibliographischen Metadaten der referenzierten Veröffentlichungen und Zitationen sowie die Berechnung der Anzahl der EBI-Querverweise je Artikel. Weitere rebi-Funktionen können die Gewinnung der Nukleinsäuresequenzen etwa im FASTA-Format ebenso ermöglichen wie die Aggregation der vom EBI automatisch extrahierten Schlagwörter und Taxonomien.

Literatur

McEntyre J.R., Ananiadou S., Andrews S., Black W.J., Boulderstone R., Buttery P., Chaplin D., Chevuru S., Cobley N., Coleman L.-A., et al. UKPMC: a full text article resource for the life sciences. Nucleic Acids Res. 2011;39:D58–D65.PMC3013671

(Najko Jahn)

Call for Papers: Forschungsdaten, Metadaten, noch mehr Daten. Forschungsdatenmanagement

Posted in LIBREAS Call for Papers by libreas on 12. Dezember 2012

Call for Papers für die LIBREAS-Ausgabe #23
Thema:
Forschungs- und andere Daten sowie ihre Organisation und Rolle in Bibliothek und Wissenschaft
Einreichungsfrist: bis 31.05.2013 14.07.2013 19.08.2013
gewünscht sind: Beiträge, die Wechselwirkungen zwischen Wissenschaft, Daten und Bibliotheken reflektieren, annotieren, dekonstruieren und/oder analysieren
disziplinäre Einschränkungen: keine
Rückfragen: redaktion@libreas.eu

„Eine Forschung, die zunehmend durch die kooperative Tätigkeit weltweit vernetzter Communities und durch den Einsatz Computerbasierter Verfahren bestimmt ist, erfordert nun einmal die kontinuierliche und vor allem langfristige Verfügbarkeit von Publikationen und Forschungsdaten über das Internet. Nicht nur die Notwendigkeit, Forschungsergebnisse durch den Rückgriff auf die diesen Ergebnissen zugrunde liegenden Daten verifizieren zu können, sondern auch die produktive Nachnutzung von Forschungsdaten in anderen Kontexten setzt voraus, dass digital kodierte Information über Jahrzehnte hinweg authentisch verfügbar bleibt.“ (Matthias Kleiner. Vorwort. In: Heike Neuroth et al. (2012), S. 9)

„Die Basis einer gesunden Ordnung ist ein großer Papierkorb.“ (Kurt Tucholsky. In: Neue Leipziger Zeitung, 19.08.1930)

 

Wissenschaft produziert heute neben Erkenntnis vor allem immense Datenmengen. Die enorme Steigerung beruht in erster Linie auf der Entwicklung und Verfügbarkeit von Technologien zur Datenproduktion und -verarbeitung. leistungsstärkere Rechner und Messgeräte produzieren und vernetzen immer mehr Daten. Wo viele Daten sind, kommen fast naturgesetzlich immer noch mehr hinzu. Die Datenmengen, eines  Large Hadron Collider (LHC) in Genf sind derart umfangreich, dass sie nicht einmal mehr an einer zentralen Stelle gespeichert werden können, sondern auf das LHC Computing Grid verteilt werden müssen. Aber auch im Alltag entstehen immer mehr Daten „nebenher“, beim Surfen im Netz, beim Chatten, beim Taggen von Dateien usw. Nahezu jeder Klick erzeugt auch neue Daten.

Die Entwicklung führt zu umfassenden Änderungen der Wissenschaft, ihrer Methoden und besonders den Anforderungen an ihre Werkzeuge sowie an die Wissenschaftsinfrastrukturen. Datenintensive Forschung braucht angemessene Hilfsmittel. Physikerinnen und Physiker, die mit Daten aus LHC-Experimenten arbeiten wollen, müssen lernen, Daten aus dem Grid zusammensammeln und auszugeben. Sozialwissenschaftlerinnen und -wissenschaftler, die theoretische Modelle zum Zusammenhang von Hochschulsystem und Städteplanung über mehrere Staaten hinweg testen wollen, können dafür auf eine umfassende Datenlage zurückgreifen. Sie müssen aber diese kennen, finden und weiterverarbeiten können.

Angesichts dieser empirischen Wende könnte das Testen theoretischer Modelle bald der Vergangenheit angehören. Jim Gray formulierte die These, dass wir in die Zeit des vierten Forschungsparadigmas eintreten würden. (Hey, Tansley & Tolle, 2009) Die Forschungsdatenbestände würden zu groß werden, um überhaupt noch anders als mit explorativer Statistik, also einer Art Datenhermeneutik, auswertbar zu sein. Ob dies für alle Wissenschaften zutrifft, ist offen.

Folgerichtig wird die Bedeutung von langfristig und offen verfügbaren Forschungsdaten für den Forschungsprozess immer stärker betont. Man entwirft Systeme, die die Reputation einer Forscherin, eines Forschers an die erstellten Daten binden sollen. Diese Diskussion überdeckt eine andere Wahrheit: Immer noch sitzen die Theologinnen und Theologen an ihren Schreibtischen und produzieren nicht viel mehr Daten als in den Jahrhunderten zuvor. Sie benutzen aber möglicherweise zunehmend digital vorliegende Quellen. So geht es vielen Disziplinen: Einige, wie die Physik oder die Klimaforschung, erzeugen permanent riesige Datenmengen. Bei anderen ist vielleicht nicht das Wachstum der eigens produzierten Datenmengen überwältigend. Wohl aber die Zahl der durch die Digitalisierung direkt abrufbaren Datenbestände. Um diese ordentlich zu nutzen, sind adäquate Erschließungs- und Vermittlungsverfahren sowie Werkzeuge notwendig.

Wie soll Forschungsdatenmanagement funktionieren? (more…)