LIBREAS.Library Ideas

Das DOAJ und seine Qualitätssicherung.

Posted in LIBREAS.Feuilleton by Ben on 14. August 2014

Anmerkungen von Ben Kaden (@bkaden)

Die Qualitätssicherung des Directory of Open Access Journals (DOAJ) ist derzeit das Sommerthema der Wissenschaftskommunikation. Da LIBREAS dort gelistet ist (und die Redaktion den in der Tat nicht gerade unterkomplexen Fragebogen zumindest schon einmal abgearbeitet hat), interessiert uns das auch aus persönlicher Betroffenheit.Im großen Rahmen sind natürlich die Hintergründe und allgemeinen Ziele, wie sie derzeit kumuliert kommuniziert werden, interessanter.

Ein Artikel im Nachrichtenbereich von Nature (Van Noorden, 2014) vermittelte unlängst Einiges zu den Versuchen, qualitätssichernde Wände in das mittlerweile zum Tummelplatz nicht immer ganz im Sinne der wissenschaftsethischen Grundeinstellung des ursprünglichen Open-Access-Gedankens stehender Business-Ansätze (u.a. das so genannte „Predatory-Open-Access“) gewordene Gebäude eines Zentralverzeichnisses der Open-Access-Zeitschriften einzuziehen.

Der erste Schritt ist die „Reapplication“, die für jede Zeitschrift, die gern im DOAJ gelistet werden möchte, notwendig ist. Das entsprechende Formular gibt es hier über diesen Link und enthält für LIBREAS mit seinem nicht ganz stromlinienhaften Format durchaus überraschende und herausfordernde Elemente, die wir hoffentlich erfolgreich bezwungen haben und die in jedem Fall zur Reifung der Zeitschrift beitragen.

Das Basiskriterium ist erwartungsgemäß absolut freier Zugang zu den publizierten Inhalten, worauf auch Rick Anderson in seinem Bericht im Fachblog The Scholarly Kitchen hinweist:

„According to the application form, access embargoes of any length will disqualify a journal from inclusion; journals that put any content at all behind a pay wall (i.e. hybrid journals) are also excluded.“ (Anderson, 2014)

Allerdings galt dies, soweit ich mich erinnere, auch schon vor zehn Jahren. Darüberhinaus verweist Rick Anderson auf einen etwas schwierigeren Aspekt, nämlich den der Transparenz bei der Gewichtung der Angaben im Fragebogen. Tatsächlich weiß man nicht so recht, worauf man achten muss, um sich nicht doch eventuell aus dem Angebot zu klicken, wobei man den Betreibern vielleicht doch zutrauen sollte, hier differenziert im Zweifel auch den Einzelfall im Blick zu behalten:

„Otherwise, little information is provided about how the various criteria will be weighted, and it appears that the decisions will be substantially subjective.“ (Anderson, 2014)

Bei wohlwollender Auslegung meint „subjective“ nämlich genau diese Art von qualitativer, individueller Inaugenscheinnahme. Für die Journals, die im Verzeichnis bleiben, wird als Neuerung eine Gütesiegel für Publikationen erstrebenswert und relevant, mit dem das DOAJ die Titel kennzeichnen möchte, welche die höchsten Standards erfüllen und damit in gewisser Weise vom Organisationsmodell und ihren formalen Eigenschaften zu den besten 10 bis 15 % der Open-Access-Zeitschriften zählen.

So wird also an beiden Enden der OA-Skala qualitätsoptimiert. Einerseits gilt, was Alma Swan vom derzeitigen DOAJ-Betreiber IS4OA ( Infrastructure Services for Open Access C.I.C.), bei dem naheliegend DOAJ-Gründer und eigentlich Gesicht Lars Bjørnshauge als Manager des DOAJ angestellt ist sagt:

„We need to show which journals come up to a minimum standard of quality [.]“ (vgl. Van Noorden)

Andererseits wird eine Exzellenzgruppe ermittelt. Dazu kommen 10 % aktuell noch im DOAJ verzeichnete Publikationen, die die Hürde des Mindeststandards nicht nehmen werden, so jedenfalls die Vermutung Lars Bjørnshauges. (ebd.)

Ob die eventuell als Gegenentwurf zur schwarzen Liste von Jeffrey Beall (bei Anderson auch „Beall’s List“ genannt, bei Van Noorden einfach „blacklist“, vgl. dazu auch ausführlich Crawford, 2014, dessen Kernaussage lautet: „I believe the lists should be ignored.“) gedachte „Whitelist“ des DOAJ den zukünftigen Standard zur Qualitätsbewertung von Open-Access-Zeitschriften darstellen wird, ist freilich noch offen. Dass die DOAJ-Verantwortlichen nach der Kritik an ihrer Qualitätssicherung nun mit einer Flucht nach vorn versuchen, als dominanter Akteur eine eminente Position im Open-Access-Feld nicht nur zu erhalten, sondern intensiver als zuvor selbst u.a. per eigenem Gütesiegel Standards für das Open-Access-Publizieren zu setzen, durchzusetzen und zu steuern und damit ihre Reichweite und Bedeutung auszudehnen, lässt sich nicht übersehen.

Nach offizieller Lesart steht dies übrigens weniger im Zusammenhang mit der Liste Bealls, sondern mit einer grundsätzlichen Überarbeitung des DOAJ nach der Übernahme des Betriebs durch die IS4OA C.I.C., wie sie im Dezember 2012 angekündigt wurde (DOAJ, 2012) und die offensichtlich auch eine weitere Professionalisierung nach extra-universitären Ansprüchen zum Ziel hat. Auch für eine Community Interest Company bildet Business den Vordergrund des Geschäfts, selbst wenn im Hintergrund das Interesse der Gemeinschaft steht.

Van Noorden zitiert dabei eine Hauptherausforderung (und in gewisser Weise Konkurrenten) für das Verzeichnis und seine Rolle im Alltagsbetrieb der Wissenschaft:

„Moreover, Beall points out, many researchers and universities will instead judge a journal’s quality by whether it is indexed in major citation databases, such as Elsevier’s Scopus index, rather than looking at the DOAJ’s list.“ (Van Noorden)

Mit einer rigorosen Qualitätskampagne bzw. sogar OA-Exzellenzmessung per Hand –

 „a small cohort of some 30 voluntary associate editors — mainly librarians and PhD students — will check the information submitted in reapplications with the publishers, and there will be a second layer of checks from managing editors“ (ebd.)

– bemüht man sich also, öffentlichkeitswirksam und – jedenfalls nach dem Eindruck Rick Andersons – etwas dünnhäutig (mit „touchiness“), Boden gut zu machen und das Profil zu schärfen.

Die Hauptherausforderung gegenüber der Open-Access- bzw. Wissenschaftscommunity wird in diesem Prozess darin liegen, zureichend Transparenz zu zeigen, um jeden Verdacht einer lückenhaften, zu lockeren oder zu strengen Sortierung und Bewertung auszuräumen. Es geht, wie so oft, um Vertrauen, das gegenüber dem DOAJ relativ leicht zu erschüttern war.

Dass es, vorsichtig formuliert, traditionell eher inklusiv vorging, wusste allerdings bereits lange vor der Beall’schen Liste jeder, der einmal quer durch das Verzeichnis browste. Die Geschichte des Open-Access-Publishings ist de facto auch eine der Politur, des strategischen Setzens von Markern und des Vorspiegelns von Initiative, deren Hauptziel nicht in der tatsächlichen Verbesserung der wissenschaftlichen Kommunikation lag. Und dass, seitdem mit Open Access Geld zu verdienen ist, eine ganze Reihe von Akteuren vor allem dieser Motivation folgen und raushebeln, was dieser Markt so hergibt, war eigentlich auch erwartbar.

Gerade vor diesem Hintergrund ist es für die DOAJ-Betreiber fraglos auch relevant, überzeugend zu vermitteln, wie die Wissenschaftscommunity als interessenleitend für die Arbeit der CIC im Rahmen des jeweils Ertragsmodells ihre wirkliche Berücksichtigung findet.

Die Schritte, die das DOAJ (bzw. IS4OA) gerade einleitet, kommen einerseits selbstverständlich etwas spät und ein bisschen sehr von außen induziert. Andererseits sind sie unvermeidbar und folgen generell einem auch für die Wissenschaft richtigen Ziel und präzise nah an deren Bedarf.  Wo Publikationsstrukturen sehr komplex werden, braucht man Verfahren und Instanzen, die diese Komplexität verlässlich vorfiltern und durchschaubar machen. Das DOAJ war und ist ein Ansatz dafür. Ob die aktuellen Schritte konkret zu etwas führen, was für das Verzeichnis wie auch das wissenschaftliche Publizieren befriedigend ist, lässt sich naturgemäß heute noch nicht absehen.

Als wir LIBREAS circa im Jahr 2006 dort registriert haben, lag die Qualitätshürde übrigens in der Frage nach dem Review-Verfahren. Die Angabe „Editorial Peer Review“ in einer formlosen E-Mail war zu diesem Zeitpunkt zureichend. Es verblüfft uns schon immer wieder, wie sehr diese Welt des lockeren Vertrauens und fröhlichen Probierens in diesem Zweig mittlerweile eine von Gestern zu sein scheint.

(Berlin, 14.08.2014)

Quellen

Rick Anderson (2014) Housecleaning at the Directory of Open Access Journals. In: The Scholarly Kitchen. 14.08.2014 http://scholarlykitchen.sspnet.org/2014/08/14/housecleaning-at-the-directory-of-open-access-journals/

Walt Crawford (2014) Journals, “Journals” and Wannabes: Investigating The List. In: Cites & Insights, Vol. 14, No. 7 http://citesandinsights.info/civ14i7.pdf

DOAJ / Alma Swan (2012) Future plans for the development of the DOAJ. In: is4oa.org. 18.12.2012 http://is4oa.org/2012/12/18/future-plans-for-the-development-of-the-doaj/

Richard Van Noorden (2014) Open-access website gets tough. In: Nature News. 06.08.2014, http://www.nature.com/news/open-access-website-gets-tough-1.15674

Institutionelles Publikationsaufkommen in Open Access Zeitschriften — ein Vorschlag mit R

Posted in LIBREAS.Visualisierung by libreas on 2. April 2013

Das DFG Programm Open Access Publizieren fördert Hochschulen, die dauerhafte und verlässliche Strukturen für die Begleichung von Artikelbearbeitungsgebühren, die für die Veröffentlichung in Open-Access-Zeitschriften erhoben werden, an ihrer Einrichtung etablieren. In diesem Sinne erfordert die Antragstellung belastbare Angaben zum entsprechenden Publikationsaufkommen der Hochschule in OA-Zeitschriften und eine transparente Darlegung der Datenerhebung.

Die Universität Bielefeld beteiligt sich mit ihrem Publikationsfonds bereits seit 2011 an der DFG-Ausschreibung. Um die jährlichen Berichtserfordernisse mit möglichst geringem Aufwand über das Institutionelle Repositorium „PUB — Publikationen an der Universität Bielefeld“ zu beantworten, basiert das Berichtswesen auf Standards der Digital Library Community (SRU, CQL, MODS) und Routinen der statistischen Programmiersprache R. Somit lassen sich Datenerhebung und -auswertung nicht nur transparent nachvollziehen und reproduzieren, sondern, dank der Standardisierung, auch an anderen Hochschulen wiederverwenden.

Eine Beispiel für eine Anforderung der DFG im Programm „Open Access Publizieren“ ist die Darlegung des institutionellen Publikationsaufkommens in Open-Access-Zeitschriften je Verlag.

Abbildung 1: Jährliche Verteilung Open Access Zeitschriftenartikel an der Universität Bielefeld auf Verlage

Abbildung 1: Jährliche Verteilung Open Access Zeitschriftenartikel an der Universität Bielefeld auf Verlage

Abbildung 1 stellt die fünf häufigsten Verlage, auf die Open-Access-Veröffentlichungen an der Universität Bielefeld entfallen, dar. Ein solches Diagramm erlaubt die kontinuierliche Prüfung möglicher Mitgliedschaften oder Vorauszahlungen. Solche Angebote der OA-Verlage versprechen eine Verringerung des Verwaltungsaufwands für Forschende und Bibliothek.

Ebenfalls zeigt die Abbildung, dass sich die Publikationsmöglichkeiten deutlich ausdifferenzieren. Zeitschriftenartikel in Verlagen, die zugunsten der Übersichtlichkeit in die Kategorie „other“ zusammengefasst sind, veröffentlichen meistens sehr junge oder kleine Journals. Diese sind häufig (noch) nicht Teil der Master Journal List des Web of Science und lassen sich daher am Besten über eine Erhebung vor Ort eruieren. Am Beispiel der Universität Bielefeld umfasst die Kategorie „other“ OA-Journale wie das Journal of Social Science Education (JSSE), das an der UB Bielefeld gehostet wird, oder die von der DFG geförderte Zeitschrift Social Work and Society.

Im folgenden werden die einzelnen Schritte zur Gewinnung der Abbildung 1 mit R dargelegt:

1. Schritt: Publikationsaufkommen 2007 – 2012

Alle in PUB verzeichneten Publikationen für den Zeitraum 2007 — 2012 lassen sich über SRU/CQL abfragen.

Die standardmäßige Ausgabe der Daten erfolgt in MODS. Relevante Felder lassen sich mit R wie folgt parsen.

require(RCurl)
require(XML)

#all

url <- "http://pub.uni-bielefeld.de/sru?version=1.1&operation=searchRetrieve&query=publishingYear%20%3E%202006%20AND%20publishingYear%20%3C%202013&maximumRecords=1000"

id <- c()
year <- c()
genre <- c()

for(i in seq(0, 40000, by = 1000)) {
  
  url.d<-paste(url, "&startRecord=", i , sep = "")
  
  doc <- xmlTreeParse(url.d, useInternal=T)
  id.tmp <- xpathSApply(doc,"//r:recordInfo//r:recordIdentifier", 
  namespaces= (c(r="http://www.loc.gov/mods/v3")) ,xmlValue)
  
  year.tmp <- xpathSApply(doc,"//r:dateIssued", 
  namespaces= (c(r="http://www.loc.gov/mods/v3")) ,xmlValue)
  
  genre.tmp <- xpathSApply(doc,"//r:genre", 
  namespaces= (c(r="http://www.loc.gov/mods/v3")) ,xmlValue)
  
  if(length(id.tmp) == 0)
    break
  else
    id <- c(id, id.tmp)
  year <- c(year,year.tmp)
  genre <- c(genre,genre.tmp)
  
  df.tmp <- data.frame (id, year, genre)
  
}

Hieraus lässt sich sowohl die Gesamtanzahl aller registrierten Publikationsnachweise eruieren wie die Anzahl der Zeitschriftenartikel im Zeitraum 2007 bis 2012.

#gesamt
dim(df.tmp)

#Zeitschriftenartikel
nrow(df.tmp[df.tmp$genre == "article",])

#Anteil in %

nrow(df.tmp[df.tmp$genre == "article",]) / nrow(df.tmp) *100

Insgesamt sind zum 31.3.2013 13.393 Publikationen registriert, 5.960 Veröffentlichungen entfallen auf Zeitschriftenartikel, was einen Anteil am Publikationsaufkommen von rund 44,5 % entspricht.

2. Schritt: Gewinnung ISSN

Der zweite Schritt umfasst die Aggregation der ISSN oder EISSN, die für den eindeutigen Abgleich mit der Journalliste des DOAJ benötigt wird:


#subset journal article

my.journal <- df.tmp[df.tmp$genre == "article",]

#query for issn/eissn

df.enrich <- data.frame()

u <-  "http://pub.uni-bielefeld.de/sru?version=1.1&operation=searchRetrieve&query=id=%22"

for (i in unlist(my.journal$id)) {
  
  url.t <-paste(u,i,"%22", sep="")
  
  doc = xmlTreeParse (url.t, useInternal=T)

issn <- xpathSApply(doc,"//r:relatedItem//r:identifier[@type='issn']",namespaces= (c(r="http://www.loc.gov/mods/v3")) ,xmlValue)
  
  if (length(issn) == 0) {
    
    issn <- "notFound"
    
  } else { issn <- issn }


  df.all.tmp <- data.frame(i, issn)

  df.enrich <- rbind(df.enrich, df.all.tmp)

}


#join with data.frame 
journal.tmp <- merge(df.ernrich, my.journal, by.x="i", by.y="id")

ISSN ist in PUB kein Pflichtfeld, um den Registrierungsaufwand der Forschenden möglichst niedrigschwellig zu gestalten. Fehlende ISSN können jedoch ex post durch den PUB Support nachgepflegt werden.

Eine solche Tabelle zur nachträglichen Datenpflege lässt sich mit R wie folgt generieren:

# exclude records without issn

#subset
my.miss <- journal.tmp[journal.tmp$issn =="notFound",]

nrow(my.miss) # number of records without issn  (174)

#export csv

wirte.csv(my.miss, "missingISSN.csv")

3. Schritt: Abgleich DOAJ

Das Directory of Open Access Journals (DOAJ) bietet eine Liste aller verzeichneten Open-Access-Zeitschriften als csv-Download an:

http://www.doaj.org/doaj?func=csv

Das Laden und der Abgleich über ISSN und EISSN mit R:


#load DOAJ data
doaj <- read.csv("http://www.doaj.org/doaj?func=csv", header = TRUE, sep=",")

#merge by ISSN/EISSN

doaj.issn <- subset(journal.tmp, issn %in% doaj$ISSN)

doaj.essn <- subset(journal.tmp, issn %in% doaj$EISSN)

#combine

doaj.comp <- rbind(doaj.issn, doaj.essn)

#add additional doaj info

test.1 <- merge(doaj.issn, doaj, by.x="issn",by.y="ISSN")

test.2 <- merge(doaj.essn, doaj, by.x="issn",by.y="EISSN")

colnames(test.2) <- colnames(test.1)

my.comp <- rbind(test.1, test.2)

#exclude duplicates

my.comp <- my.comp[!duplicated(my.comp$i),]

Insgesamt lassen sich so 496 Artikel in DOAJ-Zeitschriften an der Universität Bielefeld für die Jahre 2007 – 2012 identifizieren.

4. Schritt Datenexploration

Das data.frame my.comp bildet nun die Datengrundlage für die Visualisierung der Verteilung nach Verlagen, in denen die zuvor identifizierten Zeitschriftenartikel erschienen sind.


require(ggplot2)

#normalize year
my.comp$year <- as.numeric(format(my.comp$year, format = "%Y")) 

#relevel Publisher 

my.comp$Publisher <- factor (my.comp$Publisher, levels = c(rownames(data.frame(rev(sort(table(my.comp$Publisher)))))))

levels(my.comp$Publisher)[6:length(levels(my.comp$Publisher))] <- "other"

#get data.frame for ggplot2 plotting
my.mat <- as.matrix(table(my.comp$Publisher,my.comp$year))

my.publish <- data.frame(my.mat)

#plot

p <- ggplot(my.publish, aes(as.Date(Var2), Freq, group =Var1)) + 
geom_line(aes(colour = Var1, show_guide=FALSE)) + 
geom_point() + 
theme_bw() +
scale_colour_brewer("OA Publisher",palette=2, type="qual") + 
xlab("Year") + ylab("UNIBI Contributions") + 
opts(legend.key=theme_rect(fill="white",colour="white"))

#save plot
ggsave(plot = p, "oapublisher2.png", h = 3.08, w = 7.2)

Zusammenfassung

Die vorgestellte Skizze erhebt Publikationsdaten für die Begleitung des Open-Access-Publizieren in wissenschaftlichen Zeitschriften mittels R. Sie legt das lokale Publikationsaufkommen dar und gleicht es mit dem DOAJ ab. Da die verwendeten Protokolle und Formate auf Digital-Library-Standards beruhen, können Hochschulen und akademische Einrichtungen, deren Repositorien oder Forschungsinformationssysteme diese Standards unterstützen, die vorgestellten Methoden wiederverwenden.

Die R-Routinen, die für das Berichtswesen des Publikationsfonds an der Universität Bielefeld verwendet werden, werden im Laufe des Jahres 2013 als Funktionsaufrufe reformuliert und als Open Source Distribution mit weiteren Auswertungsmöglichkeiten veröffentlicht.

(Najko Jahn)

Najko Jahn ist zugleich an der Universitätsbibliothek Bielefeld tätig

„In retrospect it would have been better to follow the research assistant’s advice“ – Über die Langzeitarchivierung von Open Access Journalen

Posted in LIBREAS.Referate by libreas on 30. Januar 2012

Rezension zu: Michael Seadle (2011) Archiving in the networked world – open access journals. Library Hi Tech 29 (2): 394-404. DOI: 10.1108/07378831111138251 , Grundlage des Referats – URN: urn:nbn:de:kobv:11-100197292

Najko Jahn

Das Directory of Open Access Journals (DOAJ) stellt wohl die bedeutendste Quelle für den Nachweis  von Open-Access Journalen dar. Es verzeichnet nicht nur Zeitschriftentitel, sondern weist auch Volltextdokumente nach. Michael Seadle, Herausgeber von Library Hi Tech, erkennt in seiner Kolumne „Archiving in the networked world – open access journals“ den Wert einer solchen Quelle für die Beantwortung von bibliotheks- und informationswissenschaftlichen Fragestellungen, wenn er zur Disposition stellt, inwieweit die Langzeitarchivierung der in DOAJ verzeichneten Titel gewährleistet sei und wann Initiativen in diesem Bereich, und zwar LOCKSS/CLOCKSS, Portico und e-Depot, die Aufgabe der Langzeitarchivierung der Open Access Zeitschriftenaufsätze erfüllen könnten.

Motiviert der Autor zunächst relevante Fragestellungen, so sind Methodendarstellung, Datengewinnung und die darauf aufbauende Ergebnisdarstellung und -diskussion in seiner Kolumne weniger überzeugend.

(more…)

Open Access Journals – eine Weltkarte

Posted in LIBREAS.Visualisierung by libreas on 25. August 2011

Verteilung Open Access Journals nach Ländern (Quelle: DOAJ)

Das Directory of Open Access Journals (DOAJ)  verzeichnet qualitätsgeprüfte wissenschaftliche Zeitschriften, die unter Kriterien des Open Access publizieren. Bis dato sind 6936 Zeitschriften dokumentiert und auch LIBREAS.Library Ideas ist  auf Artikelebene erfasst (vgl. hier).

Angeregt von einer Vielzahl an Aktivitäten, Open Access  Entwicklungen über Visualisierungen global zu erfassen, wie Open Access Map oder Repository66.org Repository Maps, setzen wir passend zur Reisezeit unsere Rubrik LIBREAS.Visualisierung fort. Auch in diesem Fall erfolgt die Datenvisualisierung mit R. Neben der obigen Weltkarte können über eine Google API dynamische Karten aus R heraus  gewonnen werden.

Dynamische DOAJ-Karte | Tabellarische Übersicht
(more…)