LIBREAS.Library Ideas

Querverweise zwischen Zeitschriftenaufsätzen und Forschungsdaten: rebi, ein R-Paket für Europe PMC

Posted in LIBREAS.Projektberichte, LIBREAS.Visualisierung by libreas on 11. April 2013

Seit wenigen Tagen steht eine erste Version des R-Pakets rebi als Teil von rOpenSci zur Verfügung. rebi ermöglicht die Aggregation und Exploration der in Europe PubMed Central (Europe PMC) indexierten Veröffentlichungen und Forschungsdaten.

Zu diesem Zwecke fragt rebi den kürzlich veröffentlichten Europe PMC RESTful Web Service ab. Die API ergänzt das bereits seit längerem bestehende SOAP-Interface, das beispielsweise im Projekt OpenAIREplus die Basis für einen disziplinären Demonstrator bildete.

Ein Ergebnis des Demonstrators – die Erschließung und Sichtbarmachung von Querverweisen zwischen Publikationen und Forschungsdaten am European Bioinformatics Institute (EBI) – nutzt das Repository PUB – Publikationen an der Universität Bielefeld nach. Bis dato konnten rund 70.000 Querverweise zwischen EBI-Datenbanken wie dem European Nucleotide Archive (ENA) oder UniProt und 600 biowissenschaftlichen Veröffentlichungen automatisch identifiziert und auf Artikelebene eingebunden werden.

rebi war zunächst für die statistische Begleitung der EBI-Anreicherung in institutionelle Forschungsservices gedacht. Jedoch erlaubt das R-Paket weitere Dimensionen der Datenexploration, wie z.B die der Querweise auf Ebene eines Journals.

rebi

Die obige Abbildung zeigt die Verteilung der in Europe PMC indexierten Artikel der Zeitschrift PLOS Genetics nach Publikationsjahr. EBI-Services verweisen zu 2.226 Veröffentlichungen (Variable “Y”) von insgesamt 3.499 indexierten Beiträgen (63,61 %). Die Diskrepanz der Verteilung für das Jahr 2013 lässt sich mit dem Zeitfenster erklären, das die Datenspezialisten am EBI für ihre häufig auch intellektuelle Erschließung der Verweise nach der Journal-Veröffentlichung benötigen. Daher sollten entsprechenden Auswertungen und auch die Aggregation für eigene Bibliotheksanwendungen regelmäßig wiederholt werden.

Mit rebi lässt sich das obige Säulendiagramm mit fünf einfachen Funktionsaufrufen erstellen.

require(rebi)
#get metadata for PLOS Genomics by ISSN
plos.genetics <- searcheuropmc(query="ISSN:1553-7404")

#format year published to date object
plos.genetics$pubYear <-format(plos.genetics$pubYear, format="%Y")

#relevel according to frequency of occurrence Cross-Links to EBI databases
plos.genetics$hasDbCrossReferences <- factor (plos.genetics$hasDbCrossReferences, 
levels = c(rownames(data.frame(rev(sort(table(plos.genetics$hasDbCrossReferences)))))))

#plot
require(ggplot2)

p <- ggplot(plos.genetics, aes(pubYear, ..count.., fill = hasDbCrossReferences)) + 
geom_bar() + theme_bw() +
scale_fill_brewer("EBI\nCross-References",palette="Accent") + 
xlab("Year") + ylab("PLOS Genetics Articles") + 
opts(legend.key=theme_rect(fill="white",colour="white"))

#save plot
ggsave(plot = p, "rebi.png", h = 3.08, w = 7.2)

rebi soll kontinuierlich erweitert werden und enthält derzeit neben der allgemeinen Suchfunktion Aufrufe für die Gewinnung der bibliographischen Metadaten der referenzierten Veröffentlichungen und Zitationen sowie die Berechnung der Anzahl der EBI-Querverweise je Artikel. Weitere rebi-Funktionen können die Gewinnung der Nukleinsäuresequenzen etwa im FASTA-Format ebenso ermöglichen wie die Aggregation der vom EBI automatisch extrahierten Schlagwörter und Taxonomien.

Literatur

McEntyre J.R., Ananiadou S., Andrews S., Black W.J., Boulderstone R., Buttery P., Chaplin D., Chevuru S., Cobley N., Coleman L.-A., et al. UKPMC: a full text article resource for the life sciences. Nucleic Acids Res. 2011;39:D58–D65.PMC3013671

(Najko Jahn)

It’s the frei<tag> 2013 Countdown (4): Rien ne va plus!

Posted in LIBREAS.Visualisierung by libreas on 18. März 2013

IMG_3307

Seit Inetbib’s Bet on Open Access and Open Science während des Sektempfangs bei der 12. InetBib-Tagung in Berlin sind nun schon zwei Wochen ins Land gegangen. Viele weitere Wochen werden folgen, bis wir in frühestens einem Jahr wissen, wer durch Wissen, Intuition oder Glück auf den richtigen Wettausgang gesetzt hat. Die präsentierte Auswertung zur Verteilung der Jetons auf die Felder des Wetttisches visualisiert das Wett-, bzw. “Setz”-Verhalten der teilnehmenden Expertinnen und Experten.

Heatmap of Open Access Bet

Folgende Ergebnisse stechen heraus:

- Die meisten Jetons wurden darauf gesetzt, dass es binnen der nächsten 18 Monate mindestens 50 Open-Access-Repositorien und -Publikationsdienste gibt, die DINI-zertifiziert sind. Dieses Vertrauen in DINI und die Verbreitung des Zertifikats ist beachtlich.

- Viel Vertrauen wird auch der GND entgegengebracht, denn die zweitmeisten Jetons wurden darauf gesetzt, dass Wikidata erst nach 18 Monaten oder später (also evtl. nie) die GND ablösen wird.

- Die aktuelle Frage, wann ein Zweitveröffentlichungsrecht vom Bundestag verabschiedet wird, zeigt wie weit die Meinungen darüber auseinander gehen. Es wurde doppelt so häufig darauf gesetzt, dass dieses lang ersehnte Gesetz von unseren Volksvertretern erst irgendwann nach 18 Monaten verabschiedet wird, als dass es binnen der nächsten 12 Monate kommt. Oder wie es Thomas Hartmann (MPDL) in seinem Vortrag auf der Inetbib-Tagung auf den Punkt brachte: Entweder dieses Gesetz ist bis zur parlamentarischen Sommerpause bis Anfang Juli 2013 umgesetzt oder weitere Jahre werden vergehen, bis ein Zweitveröffentlichungsrecht Realität wird.

Egal, wie die Wetten ausgehen, das Spiel hat durch die Einsätze und die sich daraus ergebenden Expertenprognosen eine interessante Diskussionsbasis für die zukünftige Entwicklung von Open Access und Open Science geliefert. Wir dürfen gespannt sein, welche Prognosen und Hoffnungen sich (nicht) erfüllen werden.

It’s the frei<tag> 2013 Countdown (6): 027.7 – Belebung oder Ende der NewLIS-Debatte?

Posted in LIBREAS aktuell, LIBREAS Veranstaltungen by libreas on 16. März 2013

von Matti Stöhr

Willkommen! Mit der ersten Ausgabe und dem Themenschwerpunkt “Bibliothek 2.0 am Ende?! ist mit 027.7 Zeitschrift für Bibliothekskultur  frisch ein neues Fachblatt aus der Taufe gehoben worden, welches elektronisch nach Prinzipien des Open Access erscheint. Der Zeitschriftentitel – die DDC-Systemstelle für wissenschaftliche Hochschulbibliotheken (college and university libraries) – ist programmatisch. Aus dem Konzept:

027.7 ist eine Open Access-Zeitschrift für Bibliothekskultur mit offenem Peer-Review-Verfahren. Mit dem Begriff „Bibliothekskultur“ möchten wir das Feld weit öffnen für die Präsentation von Forschungsergebnissen, Praxisberichten und weitere Arten von Fachbeiträgen. Der thematische Fokus liegt auf dem wissenschaftlichen Bibliothekswesen des deutschsprachigen Raums. Dabei fliessen auch internationale Fragestellungen mit ein. 027.7 möchte informieren, anregen und diskutieren, manchmal auch streiten. Wenn sich 027.7 als Plattform für offene Auseinandersetzungen über die Inhalte der Artikel etablieren kann, haben wir unser Ziel erreicht.

027.7 wird von Andreas Ledl, David Tréfás und Bernhard Lukas Herrlich – alle (promovierte) Mitarbeiter der Universitätsbibliothek Basel – herausgegeben und redaktionell betreut. Dem Editorial ist zu entnehmen, dass das Gründungsvorhaben unabhängig von der Diskussion zur Eingliederung des Bibliotheksdiensts in das Portfolio vom Verlag de Gruyter angegangen wurde, jedoch nicht unbeeindruckt blieb von der nachfolgenden NewLIS-Debatte; dem viel diskutierten aber bis dato nicht umgesetzten Vorhabens der Gründung einer neuen bibliothekarischen OA-Zeitschrift unter dem Arbeitstitel NewLIS.  Seit dem “Diskussions- und Planungshoch” von Juni bis September 2012, welches u.a. nach einer kleineren Diskussion auf der vergangenen frei>tag>-Unkonferenz  in einer Session auf dem Infocamp in Chur gipfelte, ist es vergleichsweise  ruhig um das Projekt geworden, aber wohl (noch?) nicht begraben. Hier verwundert etwas, das (damals) direkt Beteiligte über den Stand spekulieren. Die nahende frei<tag> 2013 böte den nächsten Anlass, um über die aktuellen Entwicklungen inkl. der Bedeutung der jüngsten Neugründung nach Perspektive Bibliothek im bibliothekarischen bzw. im bibliotheks- und informationswissenschaftliche (OA-)Zeitschriftenwesen zu diskutieren. Anknüpfungspunkte böte etwa hier Ben Kaden, der im Blogpost “Warum LIS-Zeitschriften. Und warum nicht.” vor kurzem (erneut) Position bezogen hat.

Collage LIS-OA-Journale

Wo geht es hin mit den  – etablierten, neuen und geplanten – deutsschprachigen Open Access-Journalen im Bibliotheks- und Informationswesen?

It’s the frei<tag> 2013 Countdown (17): Wie wollen wir arbeiten?

Posted in LIBREAS aktuell, LIBREAS on tour, LIBREAS.Debatte, LIBREAS.Feuilleton by Karsten Schuldt on 5. März 2013

von Karsten Schuldt

I have never found a companion that was so companionable as solitude. We are for the most part more lonely when we go abroad among men than when we stay in our cambers. A man thinking or working is always alone, let him be where he will. (Henry David Thoreau)

The nice thing about teamwork is that you always have others by your side. (Margaret Carty)

Im allerersten Countdown zur allerersten frei<tag> – das war gerade mal vor zwei Jahren, aber es fühlt sich an wie zehn oder zumindest achteinhalb – gab es einen Beitrag zu den Arbeitsplätzen der damals die Unkonferenz Organisierenden. Die These hinter diesem Beitrag war, dass die Arbeitsplätze und wie wir sie präsentieren, mehr über uns aussagen würden als zum Beispiel unsere Porträtphotos, Lieblingsmusik oder Hobbys. Ergebnis dieser Photos war unter anderem, dass die Computer, nicht die gedruckten Medien, im Mittelpunkt unserer Arbeitsplätze standen (genauer: auf den meisten Bilder gab es überhaupt keine gedruckten Medien und wenn, bezogen die sich kaum auf Bibliotheken). Ausserdem fiel auf, dass kaum jemand von uns direkt in Bibliotheken, viele hingegen in Wissenschaftseinrichtungen tätig war.

Was allerdings überhaupt nicht geklärt wurde, durch diese Bilder, war, wie wir eigentlich arbeiten wollten. Sicher: Wir konnten unsere Arbeitsplätze selber gestalten und ja, im Grossen und Ganzen sagten Sie uns auch zu. (Ich konnte zum Beispiel aus meinem Fenster täglich die Sonne über der grossen Synagoge in der Oranienburger Strasse untergehen sehen, während sich ihre Strahlen in deren goldenem Dach und der Spree brachen, gleichzeitig hörte ich die Touristinnen und Touristen, Studierende und Dozierenden unter meinem Fenster entlanggehen. What’s there not to like?) Aber: Wir konnten uns die eigene Arbeit und Arbeitseinteilung nicht aussuchen. Wieder mit einer gewichtigen Einschränkung: Diejenigen von uns an den Hochschulen haben selbstverständlich trotz allem mehr Freiheiten dabei die eigenen Arbeitsinhalte und -bedingungen zu bestimmen als andere. Freiheit der Wissenschaft und so.

Inetbib-Tagung 2013, Humboldt-Universität zu Berlin, Session zum Themenfeld Open Access, 04.03.2013. Versteckt auf dem Bild finden Sie (a) eine LIBREAS-Redakteurin/einen LIBREAS-Redakteur, (b) eine/einen aktuelle/n LIBREAS-Autor/in, (c) zwei intensive LIBREAS-Lesende. Finden Sie alle vier! (Tipp: Alle auf dem Podium. Open Access im Bibliotheksbereich und LIBREAS... Sie wissen schon. Gleich drei Redkteurinnen/e der Zeitschrift treten auf der Tagung auf, womit die Redaktion mit dem Institut für Bibliotheks- und Informationswissenschaft der HU und dem Schweizerischen Institut für Informationswissenschaft, HWT Chur gleichzieht. Sacrebleu.)

Inetbib-Tagung 2013, Humboldt-Universität zu Berlin, Session zum Themenfeld Open Access, 04.03.2013. Versteckt auf dem Bild finden Sie (a) eine LIBREAS-Redakteurin/einen LIBREAS-Redakteur, (b) eine/einen aktuelle/n LIBREAS-Autor/in, (c) zwei intensive LIBREAS-Lesende. Finden Sie alle vier! (Tipp: Alle auf dem Podium. Open Access im Bibliotheksbereich und LIBREAS… Sie wissen schon. Gleich drei Redakteurinnen/Redakteure der Zeitschrift treten auf der Tagung auf, womit die Redaktion mit dem Institut für Bibliotheks- und Informationswissenschaft der HU und dem Schweizerischen Institut für Informationswissenschaft, HWT Chur gleichzieht. Sacrebleu.)

Dennoch: Es wäre interessant zu wissen, wie wir eigentlich in Zukunft arbeiten wollen. Wenn wir über die Zukunft der Informationswissenschaft, der Bibliotheken und angrenzender Einrichtungen debattieren, debattieren wir auch über die dortigen Arbeitsbedingungen, wenn auch indirekt.

  • Sagen wir zum Beispiel: Bibliotheken müssen 24 Stunden am Tag offen haben, sagen wir zumeist auch: Bibliotheken müssen 24 Stunden am Tag Personal haben. Dass heisst: Irgend jemand muss da um zwei Uhr an einem Donnerstag sein und irgendwer anders um Montag Morgen um fünf. Wollen wir das? (Oder lassen sich Bibliotheken so gestalten, dass sie zu bestimmten Zeiten staffless sind?)
  • Oder: Wenn wir sagen, die Bibliothekswissenschaft sollte mehr ethnologische Methoden anwenden, heisst das auch, dass da Wissenschaftlerinnen und Wissenschaftler sich in langwierigen, systematischen Beobachtungsmethoden üben müssen. Wollen wir das?
  • Oder: Wenn wir sagen, der Reference Service am Infodesk ist nicht mehr notwendig, wir brauchen Bibliothekarinnen und Bibliothekare, die auf die Nutzerinnen und Nutzer zugehen, die hinter der Theke hervorkommen, die gar keine Theke mehr haben, heisst das auch, dass wir Bibliothekarinnen und Bibliothekare dazu nötigen, so zu arbeiten. Wollen wir das? Muss jede und jeder in der Bibliothek „etwas mit Menschen machen“?
  • Wenn wir im Zuge der Debatten um RDA davon ausgehen, dass das Katalogisieren immer mehr eine kooperative Tägigkeit von Spezialistinnen und Spezialisten wird, heisst das auch, dass die Arbeit der Katalogabteilungen sich ändern wird. Sie werden weniger werden, mehr mit anderen Katalogabteilungen direkt kommunizieren etc. Auch hier: Wollen wir das?
  • Wenn wir davon ausgehen, dass die Bibliotheks- und Informationswissenschaft immer mehr zu einer Wissenschaft werden sollte, in der verteilt über Forschungseinrichtungen an Daten geforscht wird, dann wird sich die Arbeitsweise der Forschenden verändern: Weniger an einen Ort gebunden, wenig an die Bibliothek gebunden, viel unterwegs. Wollen wir das? (Geht das eigentlich: Eine Bibliothekswissenschaft, die den Ort Bibliothek nicht aufsucht?) Wir gehen zum Beispiel davon aus, dass alle Forschung immer mehr Daten produziert und dass wir diese Daten verwalten sollten. Aber wollen wir das eigentlich auch für unsere Arbeit?

Man wird vielleicht nicht unbedingt Bibliothekarin oder Bibliothekar, Forschende oder Forscher weil man die Arbeitsbedinungen dieser Tätigkeiten schätzt; aber man wächst in sie hinein und findet sich mit der Zeit oft in ihnen zu Recht (oder wechselt fort, erstaunlich oft von der Forschung in die Bibliothek). Aber, wie uns die gewerkschaftlichen Auseinandersetzungen der letzten 150 Jahre oder so gelehrt haben, sind die Arbeitsplätze und -bedingungen kein unabänderliches Schicksal. Wie wir arbeiten wollen bestimmt in einer langen Perspektive auch, wie wir am Ende arbeiten. Manchmal setzt man Bedinungen direkt durch, manchmal durch „Einschleifen“, machmal schafft man es nicht.

Aber:

  • Wieviel wollen wir eigentlich in unser Arbeit mit anderen Menschen, mit Daten, mit welchen Medien, mit welchen anderen Einrichtungen zu tun haben?
  • Wie lange wollen wir arbeiten, zu welchem Lohn, mit welchen Freiheiten?
  • Wollen wir dem Kult der Alleinarbeit, der Teamarbeit oder keinem von beiden fröhnen?
  • Wollen wir sichere Arbeitsverhältnisse oder spannende, wechselnde Aufgaben? Wollen wir an einem Ort bleiben oder viel unterwegs sein?
  • Wollen wir Serviceorientiert sein oder mehr Erkenntnisorientiert?
  • Wollen wir Jobs und nebenher Freizeit oder wollen wir Aufgaben, die uns ganz ausfüllen?
  • Ist uns egal, wie die anderen in unseren Einrichtungen arbeiten, z.B. die Wachfrau früh um zwei, oder nicht?
  • Wie werden wir nennen was wir machen? (Hier: Desletztens nannte jemand, was ich mache, „Privatgelehrtentum“ und nicht Wissenschaft, ganz explizit getrennt. Das ist schon interessant. Sind das unterschiedliche Dinge? Macht z.B. die Kollegin Kindling mit ihren Forschungen zu Repositorien und Open Access Wissenschaft und ich nicht? Hat das Auswirkungen auf unsere Arbeit?)

Sehr oft wird die Zukunft von Einrichtungen und Forschungseinrichtungen diskutiert ohne über die damit einhergehenden Veränderungen der Arbeitsbedingungen zu diskutieren. Das Ergebniss ist dann oft, dass die Veränderungen auch deshalb nicht eintreten, weil die Beschäftigten sich ihre Arbeitsleben anders vorstellen und z.B. nicht auf die Informationstheke verzichten wollen. Deshalb sollten wir nicht vergessen, uns auch darüber zu unterhalten.

Potsdam, März 2013

Warum LIS-Zeitschriften. Und warum nicht.

Posted in LIBREAS aktuell by Ben on 5. Februar 2013

Eine Position von Ben Kaden

In Anlehnung an Friedrich Kuhnens Beitrag Der neue Bibliotheksdienst – Hausblatt von De Gruyter? in der Inetbib-Liste erinnert Klaus Graf bei Archivalia ziemlich berechtigt an den großen Sturm im Fachdiskurs des zurückliegenden Jahres:

“2012 wurde aus Anlass der Ankündigung, dass der BD [Bibliotheksdienst] zu de Gruyter geht und sich das OA-Embargo verlängert, zunächst heftig und intensiv über eine Open-Access-Zeitschrift des Bibliothekswesens diskutiert: Arbeitstitel Newlis. [...] Rainer Kuhlen hatte im Herbst 2012 parallel ein Treffen zur Gründung eines hochrangigen englischsprachigen Fachjournals veranstaltet.

Was ist aus alldem geworden?”

Nun offensichtlich nicht viel Greifbares. Dennoch war die Debatte nicht vergebens. Denn sie zeigte, dass es durchaus gelingen kann, einen regen Fachdiskurs anzustoßen, wenn das Thema genügend zündet. Sie zeigt zudem in der längeren Perspektive, dass es derzeit offensichtlich weder im deutschen Bibliothekswesen noch in der deutschen Bibliotheks- und Informationswissenschaft möglich ist, Bedarf, Kompetenz und Ressourcen, die zum Betrieb einer Open-Access-Publikation, wie wir sie uns mutmaßlich alle wünschen, notwendig sind, zu bündeln. Eventuell sollte man sich vorerst mit diesem Gedanken anfreunden. Möglicherweise passt aber auch einfach das Konzept der Zeitschrift nicht mehr so recht in die Zeit.

Johan Schloemann schrieb gestern in der Süddeutschen Zeitung im Nachgang zur Münchner RKB-Tagung:

“Die Art und Weise des Zugriffs kann das Denken verändern […] Inhalte und Assoziationen gehen andere Verbindungen ein, die Gliederung von Online-Ressourcen greift in die Ordnung des Wissens ein, Archiv und Bibliothek wandeln sich in ihrem Wesen.”

In der Tat. Ich lese beispielsweise keine Zeitschriften (direkt), sondern hauptsächlich per RSS-vermittelte Beiträge. Diese beziehe ich auf Themen und Interessen orientiert, wobei die Quelle selbst erst im zweiten Schritt (der kritischen und kontextualisierenden Lektüre) einen Stellenwert erhält. Es gibt nicht DEN einen Titel, der für meine auch fachliche Interessenlage einschlägig ist. Vom Believer über den Bibliotheksdienst bis zu BILD-online kommt alles als Quelle in Frage, wenn mich interessiert wie Bibliotheken, Medienentwicklung und Gesellschaft miteinander in Wechselwirkung stehen.

Meine Rezeption setzt also auf einen sehr heterogenen Quellenverbund aus Blogs, Streams, Zeitungen und auch Zeitschriften. Aus dieser Vielfalt synthetisiert sich dann mittels kritischer Einordnung mein Orientierungswissen in den für mich interessanten Themenfeldern (also in gewisser Weise mein spezifischer Worldstream). Ab und an schreibe ich das dann wieder in Blogs, Zeitschriften oder Sammelbänden nieder. Mit meinem Wissenschaftsverständnis, bei dem es vor allem um Beobachtung, Synopse und Kritik geht und bei dem Statistiken und andere Evidenzmessungen Stützmaterial aber eben nicht Zweck der Erkenntnisfindung sind, harmoniert diese Praxis ganz gut.

Betreibt man in unserem Fach nun selbst eine Zeitschrift, kennt man das massive Problem, dass Produktionsaufwand und Wirkung selten in einem sinnvollen Verhältnis stehen. Es gibt durchaus Gründe, weshalb die Inetbib-Liste und ein paar Weblogs die Fachdiskurse weitaus lebendiger abbilden, als der Bibliotheksdienst, die IWP und sicher ebenfalls die Zeitschrift LIBREAS. Beispielsweise die niedrigen Schwellen und der geringe Aufwand der Teilhabe.

Dies führt dazu, dass bestimmte synoptische Beiträge in Weblogs weitaus häufiger und mit deutlich größerer Wirkung zur Kenntnis genommen werden, als eventuelle Zeitschriftenaufsätze, auf die darin Bezug genommen wird – mit allen Vor- und Nachteilen dieser Praxis. Daher ist der von Walther Umstätter regelmäßig forcierte Bezug zu den Referateblättern, “die einst die deutsche Wissenschaft stark machten” (vgl. hier) außerordentlich zeitgemäß, selbst wenn mittlerweile das erhabene Ziel einer starken deutschen Wissenschaft vielleicht als Anspruch hinter dem grundsätzlichen Bedürfnis, sich generell aktiv und patent in der eigenen fachlichen Umwelt bewegen zu können, zurücktritt.

Das Post Peer Reviewing ist dabei nichts anderes als die kritische und fortschreibende Auseinandersetzung mit den Gedanken anderer zum eigenen Gegenstand. Also eigentlich: Diskurs. Ich denke, dass dies dem Charakter dieses eigenartigen Hybriden aus wissenschaftlichem Anspruch und außerordentlich ausgeprägter praktischer Bewährungspflicht, aus dem sich die Bibliotheks- und Informationswissenschaft und damit auch die Fachblätter konstruieren, weitaus gerechter ist, als eine bemühten Szientifizierung.

Die Bibliotheks- und Informationswissenschaft ist keine harte Wissenschaft und benötigt daher nicht zwingend PLOS-artige Publikationsformate. Und dort, wo Konstruktion und mühselige Etablierungsversuche solch hochgesteckter Angebote die intelligentesten Köpfe der Community in organisatorischen Aufwand binden, sind sie sogar unbedingt verzichtbar. Die Zahl derer, die in unserem Fach tatsächlich unter wissenschaftlichen Bedingungen arbeiten und publizieren ist in Deutschland sehr überschaubar. Für alle anderen wäre eine strenge, Peer-Review-basierte wissenschaftliche Open-Access-Zeitschrift eine Hürde, die sie weder nehmen könnten noch wollten. Was also bestenfalls entstünde, wäre ein kleiner bibliotheks- und informationswissenschaftlicher Binnendiskurs einer kleinen Gemeinschaft, die sich zudem, wie eine aktuelle Untersuchung nahelegt, selbst regelmäßig verfehlt. Dafür ist das Fach schon jetzt mit einer genügenden Menge an Plattformen versorgt.

Zweckmäßiger als eine neue Open-Access-Zeitschrift einzufordern wäre aus meiner Sicht tatsächlich die Fokussierung auf alternative, niedrigschwellige Kommunikationskanäle und die Frage, wie sich ein Qualität sicherndes Post Peer Reviewing darin umsetzen läßt. Sicher lassen sich diverse Erfahrungen mit der Medienform Zeitschrift fruchtbar einbinden. Sicher ist es auch sinnvoll, das Konzept der Zeitschrift dort, wo es passt, weiter zu verfolgen. Ich glaube jedoch, dass es in unserer besonders durchmischten Fachwelt immer weniger funktioniert.

Wenn man das Konzept der Zeitschrift bislang nach wie vor so beharrlich weiterverfolgt, dann vermutlich aus zwei Gründen: a) der Gewöhnung (nach wie vor) und b) weil sich damit, auch beim Open Access-Ansatz, Wissenschaftskommunikation sehr gut in vermarktbare Produkte fassen lässt. Das bedeutet jedoch keinesfalls, dass der Diskurs nicht in anderer Form ebenso gut und vielleicht sogar ein Stück lebhafter und für die Kommunikationsform passender möglich wäre. Gerade dafür ist die newlis-Debatte kein schlechtes Beispiel.

(05.02.2013)

Predicting the growth of PLoS ONE

Posted in LIBREAS.Projektberichte, LIBREAS.Visualisierung by libreas on 25. Juli 2012

Najko Jahn

Abstract: This first attempt calculates the annual growth of PLoS ONE and applies a seasonal trend analysis on these numbers. Between 2007-2011, 28,898 contributions were published in PLoS ONE, resulting in an annual growth rate of 62.17% for this period. Holt-Winters filtering for seasonal trend analysis predicts 18,284 published PLoS ONE contributions for 2012, and 31,978 for 2013 (compared to 13,797 in 2011). The findings raise the question about the duration of exponential growth of PLoS One publication volume, the transition of scholarly publication models, and, furthermore, the future of institutional Open Access publication funds.

Introduction

In recent posts [1], Martin Fenner presents approaches to visualise the performance of contributions published in Public Library of Science (PLoS) journals. Two APIs provided by PLoS were taken as the data source for these exploratory visualisations; one searches the PLoS domain for particular contributions, the other obtains Article Level Metrics (ALM) for each PLoS contribution. The latter is feeding into the ongoing work on Altmetrics (see eg Priem et al arXiv:1203.4745).

Collected in the work-in-progress plosOpenR GitHub repository, a joint collaboration of members from PLoS Article Level Metrics project, Bielefeld University Library and OpenAIRE was initiated.Our incentives for this work is to further enhance the existing R package rplos provided by rOpenSci. It shall allow crosswalks based on common funding information between data coming from the PLoS Journal server, including its collected metrics, and data on documents stored in institutional repositories. In a first step, this will be worked out as part of the FP7 funded OpenAIRE project which sets out to build an Open Access Infrastructure for European research.

In this post, I propose how to a) detect the annual growth rate of PLoS ONE contributions  and b) try to forecast the further growth by applying Holt-Winters smoothing which is a time series analysis method to detect seasonal trends originating from economics [2].

Applying time series analysis on PLoS One is particularly interesting for at least two reasons: Firstly, PLoS ONE publishes each contribution right after acceptance. This forms a publishing model that differs mostly from print journals where accepted submissions are commonly published in issues. Secondly, its multi-disciplinary coverage distinguishes PLoS ONE from most other academic journals.

Methods

To act in accordance with the PLoS Search API Terms of Conditions, thereby avoiding API overload, I downloaded the latest dump of  47,430 PLoS contributions from April (available here). After table cleaning in Open Office, the resulting csv file is loaded into the R working space. In the following, I summarized the data by Journal name and publication date.

require(plyr)

my.plos <- read.csv("plosalm.csv",header=T,sep=",")

tt <- ddply(my.plos,.(Publication.Date,Journal), nrow)
# format may differ according to pre-processing routines in OO
date <- strptime(tt$Publication.Date,format="%d.%m.%Y")
year <- date$year + 1900

my.data <- cbind(tt,date, year)

After this step, a summary of publications frequencies by each year and by PLoS journal can be obtained and exported as html table (see results, Table 1).

#table
my.tab <- as.data.frame(tapply(my.data$V1, my.data[,c("Journal","year")],sum))

sum.journal <- rowSums(my.tab, na.rm=T)
my.tab <- cbind(my.tab,sum.journal)

sum.year <- colSums(my.tab, na.rm=T)
my.tab <- rbind(my.tab,sum.year)

#export as html table
require("xtable")
my.tab.x <- xtable(my.tab)
digits(my.tab.x) <- 0
print(my.tab.x, type="html", file="summaryPLoS.html")

With regard to the so gathered annual number of contributions, the Compound Annual Growth rate (CAGR) can be obtained. CAGR is used in economics to measure a year-over-year growth of an investment. In our case, we calculate CAGR for the 5 years period from 2007-2011 to describe the growth of PLoS ONE contributions.

In order to predict the future growth of PLoS ONE contributions, the Holt-Winters was applied on the obtained data as this method is sensitive to seasonal trends (see results, Figure 1). In another blog post it is described how to apply Holt-Winters in R. In a first step, the subset the table for PLoS ONE was built. Afterwards, I calculate the number of monthly contributions. The zoo package provides the tools for achieving this task.

require(zoo)
#plos one
my.plos <- subset(my.data, Journal == "PLoS ONE")

#as zoo object to monthly summary
z <- zoo(my.plos$V1, my.plos$date)

t.z <- aggregate(z, as.yearmon, sum)
#time series object
ts.q <- ts (t.z, start=c(2006,12), frequency = 12)

A time series object is created for the period beginning Dec 2006, where the first PLoS ONE contributions were published, until the end of March 2012. This forms the basis for calculating both the Holt-Winters distribution and the forecast of PLoS ONE growth until end of Dec 2013 with a confidence level of 0.95.

#Holt-Winter Distribution
ts.holt <- HoltWinters(ts.q)

forecast <- predict(ts.holt, n.ahead = 21, prediction.interval = T, level = 0.95)

plot(ts.holt,forecast, frame.plot=F, xlim=c(2007,2014), ylim=c(0,4500),
     main="Holt-Winters filtering PLoS ONE contributions")

Results

The PLoS contributions by journal and year show a moderate growth in most journals but a strong growth in PLoS One (see Table 1).

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012(Mar30)
PLoS Biology 98 456 431 423 321 327 264 304 276 65 2965
PLoS Clinical Trials 40 28 68
PLoS Computational Biology 72 168 251 287 376 414 418 121 2107
PLoS Genetics 77 208 230 352 473 471 565 184 2560
PLoS Medicine 68 434 487 346 250 199 193 206 45 2228
PLoS Neglected Tropical Diseases 42 179 224 350 445 126 1366
PLoS ONE 137 1230 2716 4405 6750 13797 4747 33782
PLoS Pathogens 41 123 198 286 459 534 556 157 2354
98 524 1055 1586 2646 4397 6400 9016 16263 5445 47430
Table 1: PLoS contributions by journal and year

On the basis of these data, a Compound Annual Growth Rate for PLoS ONE can be calculated for the 5 years period from 2007 to 2011. As a result, PLoS ONE’s annual growth rate is calculated as being 62.17 %.

Applying the Holt-Winters method, a plot can be generated, which gives first insights into the distribution (see Figure 1). The black lines highlight the observed contributions per month until the end of March 2012. The red line presents the fitted Holt-Winters values, starting in Dec 2007 until end of 2013. The blue lines highlight the upper and lower confidence intervals. The vertical line borders show observed and predicted values.

The exponential smoothing predicts the monthly observations well. However, note the sharp decline between December 2011 and January 2012. Predicting values for 2012 and 2013, following this approach, PLoS ONE will publish 18,284 contributions in 2012 (confidence interval between 15420 – 21149) and 31,978 (confidence interval between 22679 – 41279) contributions are predicted for 2013.

Discussion

If my attempt is sound, and I really do appreciate any critical comments, then the obtained growth rates will have consequences on the publishing landscape. No where else, such extreme growth rates of the general scientific literature were never reported before [3]. It also raises the question about the share of articles that do not receive any single citation. Known as the scientometric phenomena of “uncitedness”, this may be tackled by future analysis of PLoS ALM data. On a side note, the analysis reveals the seasonal decline between December 2011 and January 2012. This might, prima facie, resemble biases in the submission and selection processes in other journals [4]. This would also require further examination.

In conclusion, if these growths rates can exclusively be reported for PLoS ONE, the implications for the publishing landscape could be strong. Swift, cross-disciplinary publishing platforms could pressure the market leadership of the high impact subject-specific journals. Since PLoS ONE requires author publication fees for most of its contributions, institutional services and likewise funders covering these fees may have to consider whether this growth affects their funding activities to cover author publication fees. At least as part of our local Open Access Publication Funds of Bielefeld University activities we’ve been experiencing the growing importance in the last years, too.

The intial R source code can be found at plosOpenR GitHub repository: https://github.com/articlemetrics/plosOpenR.

I wish to acknowledge helpful comments and suggestions by Wolfram Horstmann.

Notes

[1]Example Visualizations using the PLoS Search and ALM APIs; What users do with PLoS ONE papers

[2] C. C. Holt (1957) Forecasting trends and seasonals by exponentially weighted moving averages, ONR Research Memorandum, Carnegie Institute of Technology 52. P. R. Winters (1960) Forecasting sales by exponentially weighted moving averages, Management Science 6, 324–342. Useful Introduction: P. Goodwin (2010) The Holt-Winters Approach to Exponential Smoothing: 50 Years Old and Going Strong. Forecast Spring 2010.

[3] P. Weingart (2003) Wissenschaftssoziologie, Bielefeld: transcript, pp. 35 -39.

[4] L. Bormann & H.D. Daniel (2010) Seasonal bias in editorial decisions? A study using data from chemistry, Learned Publishing, 24, 325-328.

#newlis – Zwischen #innovation, #Anspruch und #icamp12

Posted in LIBREAS.Visualisierung by libreas on 17. Juni 2012

Auf dem Weg zu einer neuen OA-Zeitschrift für die deutschsprachige Bibliotheks- und Informationswissenschaft? Das Twitter-Kommunikationsnetzwerk #newlis.

Tweets stecken trotz ihrer 140 Zeichen voller Entitäten, die potentiell für unterschiedliche bibliotheks- und informationswissenschaftliche Fragestellungen interessant sind. So lassen sich Links auf Publikationen, die in Tweets erwähnt werden, für die Messung ihrer unmittelbaren Rezeption oder Hashtags und user-mentions für die Explorationen eines Kommunikationsnetzwerkes heranziehen (siehe ua LIBREAS Tag Twitter). Bis vor kurzem war die Extraktion dieser Eintitäten über die Twitter Search API allerdings nicht explizit in den Metadaten ausgezeichnet, was im Schluss zu ungenauen, und häufig auch unansehnlichen Experimenten mit Linkresolvern und Regulären Ausdrücken führte.

Seit Dezember 2011 exponiert Twitter nun auch die sogenannten Tweet-Entitäten (Tweet Entities), womit sich Medienarten, URLs, Benutzer und Hashtags zielgenau aggregrieren lassen.  Auf GitHub stehen nun vier an Hilfsfunktionen in R zur Verfügung, die auf die Erweiterung der Twitter Search API aufsetzen und über die Suche nach einen Hashtag die netzwerkanalytische Exploration unterstützen.

https://github.com/njahn82/twitter

Kommunikationsnetzwerk #newlis

Als Antwort auf die Ankündigung, dass die von der Zentral- und Landesbibliothek Berlin herausgegebene Zeitschrift BIBLIOTHEKSDIENST ab 2013 bei De Gruyter erscheint, wird unter #newlis die Neugründung einer reinen Open Access Zeitschrift für die deutschsprachige Bibliotheks- und Informationswissenschaft diskutiert und Strategien in einem Etherpad gesammelt.

Mit der Hilfsfunktion hash.search.rt lassen sich Tweets über einen Hashtag aggregieren. Diese ordnet dabei tabellarisch einem Ersteller eines Tweets den von ihm in diesem Tweet erwähnten weiteren Nutzern zu.

Damit lässt sich eine Kantenliste, die die Grundlage  für die obige Visualisierung bildet. Am Beispiel von igraph

#functions under https://github.com/njahn82/twitter/tree/master/Twitter
require(R.utils)
require(igraph)

sourceDirectory("")

# search with hashtag
hash.search.rt <- ("newlis")

#prepare network data
my.graph <- graph.data.frame(my.data[,c(2,3)])

#prepare plot
V(my.graph)$label = V(my.graph)$name
V(my.graph)$label.cex = sqrt(degree(my.graph))*0.4 
V(my.graph)$size = sqrt(degree(my.graph))*2
V(my.graph)$frame.color = NA
V(my.graph)$color = "#E41A1C"

#plot + save
png("testgraph.png")
plot(my.graph,layout=layout.fruchterman.reingold,edge.arrow.size=0.2,vertex.label.color = "gray20")
dev.off()

(nj)

“In retrospect it would have been better to follow the research assistant’s advice” – Über die Langzeitarchivierung von Open Access Journalen

Posted in LIBREAS.Referate by libreas on 30. Januar 2012

Rezension zu: Michael Seadle (2011) Archiving in the networked world – open access journals. Library Hi Tech 29 (2): 394-404. DOI: 10.1108/07378831111138251 , Grundlage des Referats – URN: urn:nbn:de:kobv:11-100197292

Najko Jahn

Das Directory of Open Access Journals (DOAJ) stellt wohl die bedeutendste Quelle für den Nachweis  von Open-Access Journalen dar. Es verzeichnet nicht nur Zeitschriftentitel, sondern weist auch Volltextdokumente nach. Michael Seadle, Herausgeber von Library Hi Tech, erkennt in seiner Kolumne “Archiving in the networked world – open access journals” den Wert einer solchen Quelle für die Beantwortung von bibliotheks- und informationswissenschaftlichen Fragestellungen, wenn er zur Disposition stellt, inwieweit die Langzeitarchivierung der in DOAJ verzeichneten Titel gewährleistet sei und wann Initiativen in diesem Bereich, und zwar LOCKSS/CLOCKSS, Portico und e-Depot, die Aufgabe der Langzeitarchivierung der Open Access Zeitschriftenaufsätze erfüllen könnten.

Motiviert der Autor zunächst relevante Fragestellungen, so sind Methodendarstellung, Datengewinnung und die darauf aufbauende Ergebnisdarstellung und -diskussion in seiner Kolumne weniger überzeugend.

(more…)

Das Jahr 2011 in der internationalen Bibliotheks- und Informationswissenschaft.

Posted in LIBREAS aktuell by Ben on 31. Dezember 2011

Eine Rundschau von Ben Kaden

Zum Jahresende blickt man nicht selten auf Stapel von Publikationen, die durchzusehen man sich anschickte, es aber aus dem einen anderen Grund nicht mit dem gewünschten Erfolg umzusetzen verstand. Schichtarbeiter, zu denen ich zähle, neigen vielmehr sogar dazu, die Stapel mit den Jahren wachsen zu lassen. Dass man sie bei digitalen Publikationen nicht direkt materiell als Bürde des Unterlassens vor sich sieht, ist nur ein schwacher Trost.

Bevor ich nun mit der Aufschichtungstradition zu breche und 2012 mit einem leeren Tisch in einem frisch gelüfteten Raum beginne, möchte ich wenigstens stichprobenartig ein bisschen durch den virtuellen Haufen des bibliotheks- und informationswissenschaftlichen Outputs tauchen und ein paar Nadeln herausheben, um sie als Pins in meine persönliche kognitive Karte des Fachs einzustecken. Die Auswahl ist notwendig voreingenommen und hoch selektiv.

Mir steht dabei die klassische Kennzahl – hoffentlich richtig – vor Augen, dass ein Wissenschaftler im Jahr ca. 1000 Aufsätze sichtet und etwa 100 liest. Und einen schreibt. An anderer Stelle wurde mir einmal vorgerechnet, dass man etwa 70.000 Seiten im Jahr lesen muss, um halbwegs auf dem aktuellen Stand der Wissenschaftsentwicklung zu bleiben. Im Terror dieser Werte gefangen arbeite ich mich wie die meisten meiner Peers durch einen nicht zu bewältigenden Berg an Publikationen und lege ab und an selbst noch ein drauf. Für die nachfolgende Rundschau habe ich in etwa das Jahrespensum eines Wissenschaftlers zusammengedampft. Mehr geht derzeit nicht. Für eine vollständige Durchsicht des Publikationsgeschehens eines Jahres müssten die Zeit zwischen den Jahren bzw. vielleicht sogar die Jahre bedeutend länger sein. Immerhin lässt sich für das nächste Jahr vornehmen, die Materialstapel gleich zeitnah vielleicht einmal im Monat zu bearbeiten und auf diesem Weg einen systematischeren Blick auf die bibliotheks- und informationswissenschaftlichen Entwicklungen zu entwickeln. Dies würde auch dazu beiträgen, dem Referateansatz dieses Weblogs eine verlässlichere Form zu geben.

Selbstverständlich wäre es etwas unsinnig, den Zeitraum eines einzigen Jahres als repräsentative Eingrenzung für das Geschehen in einer Wissenschaft heranzuziehen. Zumal auf der Basis von Zeitschriftenpublikationen. Denn solche Beiträge stecken schon mal gern länger im Review- und Drucklegungsverfahren und stammen genau genommen oft bereits aus dem Vorjahr.

Wenn wir versuchen anhand der Zeitschriftenpublikationen des Jahres 2011 Trends für Bibliotheks- und Informationswissenschaft zu ermitteln, ermitteln wir eigentlich, womit sich die Forschung 2010 beschäftigte. Andererseits sind die meisten der Beiträge tatsächlich erst irgendwann im Laufe des Jahres 2011 in unserer Aufmerksamkeit gelangt und haben unsere Forschungsperspektive daher in diesem Zeitpunkt auch erst beeinflussen können.

Die Wissenschaftskommunikation ist demzufolge ein stabil zeitversetzter Prozess, der, wenn man sich zum Beispiel die Entwicklung der Sozialen Netzwerke und ihrer gesellschaftlichen Rolle ansieht, immer einen Tick hinter einem allgemeinen Zeitgeist zu verorten scheint. Dafür ist die Perspektive weiter, denn der Leser sieht, wohin sein Tablet ihn tatsächlich trägt und liest drauf, was man im Sommer zuvor über eine mögliche Tragweite dachte. Wenn man Glück hat, gelingt aus dieser Lücke auf Seiten des Beobachters eine stimmige Extrapolation in die Zukunft.

Nachfolgend werden nun bar jedes Anspruchs auf Vollständigkeit stichpunktartig Kernaussagen, Trends, Erkenntnisse und Fakten zusammengestellt, die einige der Leitthemen und Haupttrends der internationalen Bibliotheks- und Informationswissenschaft des Jahres 2011 umreißen.

Lässt man die Lektüren des Jahres 2011 nun binnen einiger Nachmittagsstunden an Jahresendfeiertagen ihre Revue passieren, dann fällt für die Bibliotheks- und Informationswissenschaft im Rückblick auf, dass es nicht unbedingt eine Disziplin der großen Durchbrüche, Erkenntnisexplosionen und Quantensätze handelt, sondern um ein Fach mit einerseits sehr heterogenen Themenstellungen und andererseits mit eher behäbigen Verschiebungen im Diskurs. Für die Wissenschaft dürfte das einem Normalzustand entsprechen: Die Paradigmenwechsel – sofern man an Kuhn glaubt – vollziehen sich natürlich dennoch und einige Tendenzen werden ich nachfolgend herausstellen. Aber wenigstens im Zeitschriftenbereich finden sich im gesichteten Korpus (besonders Journal of Documentation, Journal of Information Science, Journal of the American Society for Information Science and Technology, Knowledge Organization, Scientometrics) keine Leuchtturmpublikationen deren Strahlkraft geeignet ist, völlig neue Sichtweisen zu eröffnen oder wenigstens in eine deftige Wissenschaftskontroverse zu führen. Die Diskussionen zwischen Birger Hjørland (2011b, http://dx.doi.org/10.1177/0165551511423169) und Marcia Bates (http://dx.doi.org/10.1002/asi.21594) deuten immerhin an, dass etwas in dieser Art denkbar ist und wie es aussehen könnte. Und auch der Text von John Palfrey und Johnathan Zittrain (http://dx.doi.org/10.1126/science.1210737) als einer von wenigen interdisziplinären Ausreißern der Rundschau zu Science und Nature bestätigt eigentlich nur, dass unsere Disziplin notgedrungen ein Fach des Digitalen ist.

Um diese Aussage gleich wieder einzuschränken muss nochmals unbedingt auf die Subjektivität von Auswahl, Deutung und Schwerpunktsetzung verwiesen werden. Die Zusammenfassung schließt vorwiegend solche Quellen ein, die ich persönlich benutze, um mich ein wenig auf dem Stand des Forschungs- und Erkenntnisverlaufs in der Bibliotheks- und Informationswissenschaft zu halten. Eigene Lektüreinteressen spielen bei der konkreten Titel- und Artikelauswahl keine geringe Rolle. Es kann also durchaus sein, dass ich den das Paradigma umstoßenden Beitrag schlicht nicht gesehen und/oder nicht als solchen erkannt habe. Berücksichtigt wurde zudem in diesem Fall ausschließlich Zeitschriftenliteratur (mit einer persönlichen Ausnahme, die eigentlich in der LIBREAS-Ausgabe 19 als Aufsatz erscheinen sollte…). Nach einen kurzen Zusammenfassung der Haupttrends werden einzelne, in meinen Augen notierenswerte Erkenntnisse, Einsichten, Positionen und Fakten in Form von Stichpunkten zwar grob geclustert, im Übrigen jedoch soweit als möglich neutral und unkommentiert abgebildet. (more…)

Wieviel Open Access steckt in bibliografischen Datenbanken? Referat zu den Ergebnissen einer Studie.

Posted in LIBREAS.Referate by Ben on 9. September 2011

Referat zu:

William H. Walters, Anne C. Linvill (2011) Bibliographic Index Coverage of Open-Access Journals in Six Subject Areas. In: Journal of the American Society for Information Science and Technology. 8 (62) S. 1614–1628

Man kann als Bibliotheks- und Informationswissenschaftler kaum besser in sein Wochenende tauchen, als mit der Lektüre eines Beitrags zur Indexierung von Open-Access-Inhalten durch große bibliografische Datenbanken. Zum Glück findet sich in der aktuellen Ausgabe des Journal of the American Society for Information Science and Technology eine entsprechende Studie, die William H. Walters und Anne C. Linvill von der Bowman Library des Menlo College vorgenommen haben.

Die Autoren untersuchten, wie Open Access-Zeitschriften – und zwar nur solche “that provide free, immediate access to all content”, also keine hybriden Titel oder solche mit delayed access – in bibliografischen Datenbanken erfasst werden. Dahinter steht die naheliegende Überlegung, dass Open Access-Publikationen erst dann wirklich umfassend genutzt werden können, wenn sie auch in gängige Verfahren des wissenschaftlichen Rechercheprozesses eingebunden und über diesen auffindbar sind: (more…)

Follow

Erhalte jeden neuen Beitrag in deinen Posteingang.

Schließe dich 67 Followern an