LIBREAS.Library Ideas

Das Jahr 2012 bei LIBREAS und in der Bibliotheks- und Informationswissenschaft. Zu einem guten Start und einem Abgrenzungsproblem.

Posted in LIBREAS aktuell, LIBREAS.Referate by Ben on 6. Januar 2012

(mit Anmerkungen zu: Erjia Yan, Ying Ding, Staša Milojević, Cassidy R. Sugimoto (2012) Topics in dynamic research communities: An exploratory study for the field of information retrieval. In: Journal of Informetrics. Volume 6, Issue 1, January 2012, S. 140-153   DOI: 10.1016/j.joi.2011.10.001)

von Ben Kaden

Die erste Arbeitswoche des Jahres 2o12 lässt sich für LIBREAS durchaus als erfolgreich bezeichnen, denn soviele Zugriffe gab es selten und ebenso rar waren hier bisher fachliche Diskussionen wie diese. Die schlagwortartige Sichtung internationaler Zeitschriftenliteratur zur Bibliotheks- und Informationswissenschaft, ursprünglich als Tischbereinigung angesetzt, erfreut sich einer durchaus regen Aufmerksamkeit bis ins Ausland, was für uns als LIBREAS-Redaktion ein unfehlbares Zeichen ist, dass der Bedarf für Synopsen der Aktivitäten des eigenen Fachs besteht. Nun bleiben nicht nur bei der Weihnachtserhebung zahlreiche Fragen offen, die allesamt Stoff für mittlere Abschlussarbeiten hergeben könnten.

Klaus Graf bemerkte zum Beispiel „es wäre schon interessant zu wissen, welcher Anteil einer an Wichtigkeit orientierten Auswahl aus diesem Literatursegment OA ist“ und hat damit weitgehend recht. Einzig der Punkt der Orientierung auf die Wichtigkeit ist im Einwurf überstrapaziert, denn dieses Kriterium kann ich mir nicht als Leitlinie anmaßen. Es steckt tatsächlich mehr Zufälligkeit und persönliche Vorliebe hinter der Auswahl.

Zweifellos ist aber richtig, dass man eine Themenclusterung mit dem Anspruch, über ein silvesterabendliches Stimmungsbild zur Informationswissenschaft hinauszureichen, auf Kriterien der Wichtigkeit aufsetzen sollte. Die sind freilich noch zu definieren. Aussagen zur Zitationshäufigkeit der Zeitschriftenaufsätze eines Jahres sind beispielsweise derart zeitnah kaum möglich, da sich die zitierenden Publikationstexte mitunter selbst noch im Pre-Publishing befinden. Oder – hier liegt der Anschluss zum Open Access-Thema – man sichtet Volltexte auf Pre-Print-Servern antizipierend. Dort spielt aber wiederum das konkrete Publikationsverhalten hinein: Nicht jeder Aufsatz in unserer Disziplin wird in dieser Form vorveröffentlicht.

Hans-Christoph Hobohm ergänzt zwei weitere Aspekte:

a) „Wie sieht es denn vergleichsweise mit der deutschen Informationswissenschaft aus?“

b) „Wichtig wäre jetzt wohl die Erörertung der Frage, wie man Ihren schönen Text noch stringenter darstellen kann. Visualisieren?“

Zum Betrachtungspunkt der deutschen Informationswissenschaft habe ich in diesem Kommentar bereits einiges skizziert. Eine Schwierigkeit liegt in der Kategorisierung dessen, was man zur „deutschen Informationswissenschaft“ zählen kann.  Gerade in der biblio-, infor- und szientometrischen Forschung vermischen sich die Herkunftsdisziplinen der AutorInnen. Ist also ein Nicht-Informationswissenschaftler, der bibliometrisch forscht, Teil der informationswissenschaftlichen Community? Daneben wäre zu klären, ob bzw. wie Ausbildungs-, Arbeits- oder Geburtsort jemanden als Teil der deutschen informationswissenschaftlichen Community definieren.

Die Visualisierung stößt dagegen die Tür zu einem Feld auf, das unendliche Perspektiven bietet. In gewisser Weise ist der Text selbst schon dahingehend eine Visualisierung, dass er im gnadenlosen Stakkato unter mehr oder weniger weichen Überschriften Kernaussagen der gesichteten Arbeiten auflistet. Was man aus ihm vor allem ablesen kann, ist die Tatsache, dass in der Bibliotheks- und Informationswissenschaft viel publiziert und daher mutmaßlich auch erheblich geforscht wird. Viel mehr gibt die Abhandlung in der dargestellten Form aber nicht her.

Ein begrüßenswerter Schritt für weitere Analysen dieser Art wäre die strukturiertere Erfassung der Daten, was problemlos möglich sein sollte, mir aber erst nach vielleicht dem 25sten Aufsatz so klar wurde und daher aus Zeitgründen unterblieb. Denn auch hierfür ist eine Entwicklungsarbeit bei Abstimmung zwischen dem gewünschten Darstellungsziel und den zu erhebenden Daten notwendig. Soll z.B. der Arbeitsort der AutorInnen erfasst werden? Nehmen wir die vom Journal oder den AutorInnen als inhaltsbeschreibend vergebenen Keywords dazu? Berücksichtigen wir die Erfassung der Publikationen bei Connotea, Mendeley oder ähnlichen Plattformen zur vernetzten und vernetzenden Literaturorganisation? (vgl. dazu auch diesen Kommentar)

Und dann stehen noch die Hinweise zur Befangen- bzw. Begrenztheit des Web of Science (und ähnlich sicher auch für andere Metaplattformen zum Retrieval bzw. Nachweis einschlägiger Publikationen) im Raum, wie sie Walther Umstätter in diesem Kommentar gibt.

Nimmt man also die Ausgangsfragestellung, ihre Spezifizierungsäste, die methodologischen Probleme und die Einwände zusammen, dann hat man einen guten Grundstock für ein Dissertationsexposé. (Wobei man den Messzeitraum genauso variieren könnte, wie man auch andere Publikationsformen von Konferenzbänden bis hin zu Science-Blogs einbeziehen kann.): Der Stand der informationswissenschaftlichen Forschung im Zeitraum …  bis … unter besonderer Berücksichtigung der anteiligen Open-Access-Verfügbarkeit des Publikationsaufkommens sowie der Rolle deutscher WissenschaftlerInnen. Eine szientometrisch-basierte Visualisierung. Wer mag, darf hier gern ansetzen und das Thema weiterentwickeln. Mir wäre es aber eine Nummer zu groß.

Lieber weise ich auf eine freundliche Koinzidenz hin. Denn wie das Wissenschaftsleben so spielt, taucht häufig im richtigen Moment eine Studie zu einem drängenden Problem auf. In der Januarausgabe 2012 des Journal of Informetrics zeigen nämlich Erjia Yan, Ying Ding, Staša Milojević und Cassidy R. Sugimoto, wie man methodisch präziser einen Aspekt aus dem angedeuteten Problemzusammenhang behandelt. (Topics in dynamic research communities: An exploratory study for the field of information retrieval. DOI: 10.1016/j.joi.2011.10.001) Die Autorinnen untersuchen, wie sich Communities und Themen kreuzen und vermengen. Das passt präzise auf die Schwierigkeit der Kategorisierung oder auch Kartographierung der „deutschen Informationswissenschaft“, aus der man möglicherweise hinsichtlich der Rezeptionspraxen eine „deutschsprachige“ machen müsste. Und eröffnet eine Chance darauf, die Antwort auf die Frage

Ist also ein Nicht-Informationswissenschaftler, der bibliometrisch forscht, Teil der informationswissenschaftlichen Community?

zu finden. Er ist es vermutlich mit einem Bein, nämlich dem bibliometrischen, genaugenommen gehört er aber zur Community der Bibliometriker, in der vielleicht die Informationswissenschaftler einen Großteil der Population stellen. Die Autorinnen gehen dem nicht nach, entwerfen aber ein Konzept, mit dem man sich einer solchen Frage möglicherweise ganz gut nähern könnte.

Es gilt in jedem Fall zu untersuchen, wo sich Grenzen einer Forschungsdisziplin ziehen lassen und wo Diffusionsräume für Forschungsgegenstände, -methoden und Akteure bestehen. Es handelt sich dabei natürlich um Interdisziplinaritätsforschung und für diese gilt:

„it is necessary to integrate the two threads of research on community detection and topic identification, and utilize them to understand the dynamic interactions between topics and communities.“

Die Größen, die es in Beziehung zu setzen gilt, sind folglich Forschungsgegenstände und Akteure. Was die Studie aber wirklich für den akutellen Diskursstrang relevant macht, ist der Gegenstandsbereich, auf den sich die Autorinnen beziehen: Information Retrieval (IR) ist unbestritten eine Kerndomäne der Informationswissenschaft. Wenn es also gelingt, in diesem Bereich die Interdisziplinarität erfolgreich zu erfassen, dann hätte man eine Grundlage, die sich auch auf alle weiteren Domänen von Social Media-Anwendungen über Katalogisierung bis hin zur Bibliometrie anwenden lassen könnte. Anhand des jeweils spezifizierten Anteils der Interdisziplinarität wäre es nun im Gegenzug möglich, geschlossene und offene Themenfelder der bibliotheks- und informationswissenschaftlichen Community zu bestimmen. (Die Autorinnen sprechen von einer „dynamicity of a domain“.) Und zu visualisieren.

Um es gleich vorwegzunehmen: Im Ergebnis ist der Aufsatz tatsächlich mehr aus methodologischer Sicht bedeutsam. Der Bezugsraum liegt schon eine Weile (nun fünf Jahre) zurück und die Themen aus dem IR-Bereich sind eher Mittel zum Zweck. Jedenfalls werden sie inhaltlich nicht weiter diskutiert. Dennoch ist es unzweifelhaft hervorragend, zu sehen, wie man vorgehen kann.

In ihrer für einen solchen Ansatz als Modellvorhaben zu bewertenden Untersuchung analysierten die Autorinnen die bei Scopus nachgewiesenen Publikationen zum Oberthema Information Retrieval für den Zeitraum 2001-2007 u.a. hinsichtlich der Ko-Autorenschaften und ermittelten somit entsprechende Netzwerke. Dabei überprüften sie auch besonders produktive Ausbrecher (Outliers), in diesem Fall Autoren, für die mehr als acht Publikationen im Jahr ermittelt wurden. Von den 115 extrahierten Kandidaten erwiesen sich dabei nur acht als tatsächlich derart schöpferisch, „while the rest were attributed to repetitive names“.

Zu weiteren Analyse extrahierten sie drei Zeitabschnitte (2001-2003, 2004-2005, 2006-2007), zu denen sie jeweils die zehn Top-Topics und die zehn Top-Communities ermittelten. Diese wurden schließlich mit einander in Beziehung gesetzt, was sich sehr anschaulich in einer so genannten Heat Map Visualization niederschlägt.

Während die Zahl der Publikationen zunahm (von 12194 im Zeitabschnitt 1 auf 21423 im Zeitabschnitt 3), sank die Zahl der Publikationen pro Autor von ca. 1,7 Aufsätzen/Zeitraum auf 1,2 Aufsätze/Zeitraum (meine Ergänzung im Anschluss an dieses Thema).

Die Gesamtzahl der AutorInnen nahm von 7345 auf 17710 zu, woraus Yan, Ding, Milojević et al. ableiten: „that more scholars have joined the IR research community.“ Dazu kamen Fluktuationen (bzw. ein „degree of permeability“): Nur ca. 30 % der AutorInnen aus dem ersten Zeitabschnitt publizierten durchgängig. Zehn Prozent der AutorInnen aus dem ersten Zeitabschnitt wurden erst wieder im dritten Zeitabschnitt als aktiv nachweisbar. Bei 60 % der AutorInnen fand über die Zeit ein Austausch statt.

Parallel dazu veränderten sich die Terminologie bzw. die Gegenstände des Feldes (Topics). Auch hier stieg die Gesamtzahl der Ausdrücke von 3785 (2001-2003) auf 9794 (2006–2007). Die AutorInnen interpretieren diesen Zuwachs  vor allem mit einer thematischen Öffnung des Forschungsfeldes. Dabei wurden etwa 60 % der Ausdrücke/Gegenstände aus dem Zeitabschnitt in den zweiten übernommen. Von diesen und den neu dazu gekommenen fanden sich wiederum 47 % auch im dritten Zeitraum. Auch hier lassen sich erstaunlicherweise zehn Prozent Springer nachweisen, die im Zeitabschnitt eins und drei, nicht jedoch in den Jahren 2004-2005 nachgewiesen werden konnten.

Beide Phänomene wurden nun in Relation gesetzt und lassen einige Aussagen zu Eigenschaften von Communities zu. Beispielsweise stellen die Autorinnen fest, dass kleinere Wissenschaftsgemeinschaften dazu neigen, sich thematisch zu konzentrieren. Topics können in der Zeit von anderen Communities übernommen werden, während sich der Schwerpunkt der Ursprungsgemeinschaft verändert. Wenig überraschend, aber eben konkret nachgewiesen, ist die Erkenntnis, dass populärere Themen von einer größeren Zahl von Autoren aufgegriffen werden. Weiterhin lassen sich Topics finden, die nicht einer konkreten Community zugeordnet werden können. Dies betrifft anscheinend hauptsächlich so genannte Emerging Topics, zu denen einzelne Autoren verschiedener Communities zu publizieren beginnen, die sich eventuell anhand dieses gemeinsamen Themas nach und nach finden. Diese emergenten Themen können in der Entwicklung eigene Communities hervorbringen. Kenntnisse über diese Dynamiken sind zweifellos auch für das Entstehen neuer Disziplinen hochinteressant und ein ersprießliches Forschungsthema (ebenfalls abschlussarbeitswürdig) wäre es, die sich herausbildenden Digital Humanities auf Herz und Geist zu prüfen. (vgl. dazu auch diesen Kommentar)

Mehr will ich gar nicht zu der hochinteressanten Studie anmerken, die man am besten selbst konsultiert. (Einen Preprint oder eine andere frei zugängliche Fassung konnte ich leider nicht ermitteln.) Bestimmte Parameter – z.B. die Transformation von Publikationsstrukturen in der Zeit – könnte man in weiteren Schritten sicher ebenfalls berücksichtigen, aber die Komplexität scheint auch so schon ausreichend hoch zu sein.

Für die Diskussion der letzten Tage und Stunden in diesem Weblog bleibt erfreulich festzuhalten, dass aus der Bibliotheks- und Informationswissenschaft (die Autorinnen kommen von der School of Library and Information Science der Indiana University in Bloomington) heraus methodologische Ansätze entwickelt werden, die uns sehr differenziert und elaboriert den Umgang mit der Fragestellung, wo eigentlich welche Grenzen des Faches liegen, umgehen lassen. Dass dies intellektuell ziemlich anspruchsvoll, in der Ausführung sehr strapaziös und in Ergebnis und Echo im Vergleich zum Aufwand vielleicht sogar ernüchternd ist, steht natürlich außer Frage, ist jedoch auch zu erwarten. Andererseits hat die Gesellschaft den epistemologischen Funktionsraum Wissenschaft genau dafür hervorgebracht. Auch wenn sie es mitunter vergisst.

Berlin, 06.01.2012

2 Antworten

Subscribe to comments with RSS.

  1. W. Umstaetter said, on 7. Januar 2012 at 19:24

    Zunächst muss bei der Frage: Ist also ein Nicht-Informationswissenschaftler, der bibliometrisch forscht, Teil der informationswissenschaftlichen Community?“ an die Diskussion um die Invisible Colleges (D. J. de Solla Price) erinnert werden. Außerdem ist sie dahingehend zu beantworten: Er ist insoweit ein Teil der Community, als er mit seinem Beitrag auch sein Fachwissen auf diesem Gebiet belegt. So ist es ja nicht neu, dass wir in allen wissenschaftlichen Disziplinen immer wieder Beiträge von fachfremden Personen finden, die ein ganzes Fachgebiet massiv beeinflussten. Nicht selten konnten das ja auch ganz einfache revolutionierende Beobachtungen von Laien sein.

    Wenn wir eine umfangreichere Recherche zu einem bestimmten Thema durchführen, so wissen wir aus dem vielfach bestätigten Bradford’s Law of Scattering, dass dieses ein Bild für die Interdisziplinarität des jeweiligen Themas ist. ( http://www.ib.hu-berlin.de/~wumsta/lectg.html ) Wie weit wir allerdings Gewinn aus Publikationen ziehen können, die von „Nicht-Informationswissenschaftlern“ stammen, ist eine andere Frage. Diese Frage stellt sich aber für jede Publikation, die wir sichten bzw. lesen gleichermaßen. Dass hinter der Beobachtung von Erjia Yan, Ying Ding, Staša Milojević und Cassidy R. Sugimoto letztendlich das Bradford’s Law of Scattering steht, erkennt man auch daran, dass sie sozusagen nur 30% Kernautoren fanden. Um so erstaunlicher ist es, dass die Autoren, diesen Zusammenhang gar nicht bemerkt haben. Was die Frage aufwirft, seit wann und wie weit sie selbst fachlich auf dem Gebiet der Bibliometrie beheimatet sind.

    Bis hierhin erbringt also diese Publikation eigentlich noch nichts neues. Als ein interessanter Ansatzpunkt der Methode kann allerdings der zeitliche Aspekt angesehen werden, um den es im Bradford’s Law of Scattering weniger geht. Denn er eröffnet die Möglichkeit, zu analysieren, in welcher Richtung sich ein Fach verstärkt entwickelt.

    Es geht also weniger um den „degree of stability“, als um die Frage, aus welchen Bereichen die meisten neuen Impulse für ein bestimmtes Thema (hier die Informationswissenschaft) im Laufe der Zeit kommen. Genau genommen ist diese Frage natürlich nur entscheidbar, wenn man die jeweiligen Aufsätze genau liest, aber die hier empfohlene Methode kann dabei behilflich sein, die dafür relevanten Aufsätze besser einzuordnen.

  2. […] Viel Mühe machte sich Ben Kaden und veröffentlichte im Blog LIBREAS.Library Ideas einen Rückblick auf wichtige Publikationen in der Bibliotheks- und Informationswissenschaft, die im Jahr 2011 erschienen sind. Es handelt sich hierbei nicht um eine Liste, sondern eher um eine Analyse der Trends der Themen und Meinungen des Fachgebietes handelt (mit Verlinkungen zu den Publikationen). Der Beitrag wurde von der bloglesenden Fachwelt mit Interesse aufgenommen. Deshalb gab es zu den Anmerkungen der Kollegen noch einen Nachtrag. […]


Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: