LIBREAS.Library Ideas

Kulturkurven für Achtjährige: Ein kurzer Blick auf Googles Ngrammatologie

Posted in Sonstiges by libreas on 17. Dezember 2010

(Dieser kleine Beitrag ist der großen Maxi gewidmet, unserer wunderbaren und heute Geburtstag feierenden Redaktionskollegin. Hier ist Deine Kurve!)

„The goal is to give an 8-year-old the ability to browse cultural trends throughout history, as recorded in books“

zitiert die New York Times den Harvard Junior Fellow Erez Lieberman Aiden, der mit anderen hinter dem Google Books Ngram Viewer steht. (Patricia Cohen: In 500 Billion Words, New Window on Culture. In: nytimes.com, 16.12.2010) Die Alterszuschreibung ist dabei weniger zufällig gewählt, als der kurzsichtige Zeitungsleser möglicherweise annimmt. Das „childparenting“-Portal von About.com weist für Achtjährige (auch in Hinblick auf die anstehenden Weihnachtsfestivitäten interessant) neben dem Fahrrad auch folgende zielgruppengeeignete Objekte aus:  „Science Kits, Craft Kits,…, Books…“. Und wo findet man schon mehr Bücher als bei Google Books und das auf der Kostenebene für den Gegenwert eines Internetzugangs?

Google Labs führt mit dem Ngram-Viewer in gewisser Weise „Science Kits“ und „Books“ zusammen und streut eine Prise Franco Moretti (=quantitative Literaturwissenschaft) dazu. Die Leute hinter dem Ngram-Viewer nennen die daraus resultierenden Erkenntnismethoden Culturomics und von dort dürften es nur noch wenige Schritte zu einer Culturmetrics zu nennenden aktualisierten Bibliometrie sein.

Der Ngram-Viewer zeichnet schon einmal ganz wunderbar den Verlauf der Häufigkeit des Auftretens von Zeichenketten im – so wird gesagt – 500 Milliarden Wörter starken Korpus der Google Book-Scans. Wirklich spannend wenn man Verläufe verschiedener Ausdrücke übereinander legt und damit die Tür zur Interpretation der Stellung der bezeichneten Phänomene innerhalb des Publikationsgeschehens des 20. Jahrhunderts (ins 21ste lappt der Korpus bis 2008) per Graphen öffnet.

Vergleicht man beispielsweise die zunächst etwas konkurrierenden und mittlerweile komplementär auftretenden „Bibliothekswissenschaft“ und „Informationswissenschaft“, erhält man folgendes Bild:

Die Informationswissenschaft betritt die Bühne des Publikationswesens ziemlich genau zum Zeitpunkt der  Shannon-Zäsur (Publikation der Mathematical Theory of Communication), schrammt eine Weile an der X-Achse entlang, um Mitte der 1960er Jahre abzuheben, Mitte der 1980er den Klimax zu erreichen und schließlich in ein sanftes Tal hinabzugleiten, das sich gen Millenium etwas aufhügelt.

Die Bibliothekswissenschaft saust dagegen schon 1920 mit einer gewissen Häufigkeit auf die Bühne, springt um 1930 über die 0,000010 % Marke (des Gesamtaufkommens an Wörtern), erlebt nach 1945 eine Hausse, die wahrscheinlich der Wachstumskurve des Wirtschaftswunders nicht unähnlich ist, um in den 1970er Jahren an die Decke der Darstellung zu stoßen. Danach bricht sie ein wie der Neue Markt im Herbst des Jahres 2000, kämpft sich aber interessanterweise mit dem Boom der Dot-Com-Industrien kurz davor tapfer nach oben. Was die obige Grafik verbirgt, sieht man, wenn man die Suche bis zum chronographischen Ende des Korpus (2008) erweitert: Etwa um 2002 bricht die Bibliothekswissenschaft ein und wir in Berlin wissen, was die lokalen Hochschulstrukturreformbemühungen zu diesem Zeitpunkt beabsichtigten…

Die Dokumentationswissenschaft zeitigt weniger Auf-und-Abs, hat es aber nie geschafft, auch nur die Linie der Informationswissenschaft zu tangieren.

Nun werden sich die Achtjährigen aller Altersstufen nur bedingt für die Schicksalslinien der beschrieben drei disziplinären Teile unseres Wissenschaftsblickwinkels beschäftigen. Sondern eher musikalische Phänomene vergleichen,  ihre Lieblingsportarten gegeneinander aufrechnen, die Popularitätsverläufe einzelner Haustierrassen nachzeichnen oder die Beliebtheit von Schriftstellern der Gruppe 47 aneinanderlegen. Oder ermitteln, dass Heckenbraunelle und Williams Christ bei der Häufigkeit ihrer Referenzierung im letzten Jahrhundert gar nicht so weit auseinander liegen.

Weitaus mitreißender als die Parallelität von Vögeln und Birnen ist aber das, was Rückschlüsse auf den Unterschied zwischen E- und P-Welt zulässt. Beispielsweise der Vergleich dieser zwei Basisbausteine unserer Kultur:

Das deutschsprachige Google-Internet positioniert das Verhältnis dagegen aktuell so: Rot=23 Millionen Treffer, Blau=8,87 Millionen Treffer. Das harmoniert wiederum mit den Trends, die uns die Kurve für englischsprachigen Druckerzeugnisse vorzeichnen (Wobei man allerdings berücksichtigen sollte, wie stark dabei aufgrund der erweiterten Semantik im Englischen der Feminismus in diese Kurven eingeflossen sein dürfte.)

Das Potential der Ngram-Visualisierung wird vermutlich bereits anhand der wenigen angeführten Beispiele deutlich, wobei es noch aussteht, die einflussnehmenden und mitunter verzerrenden Faktoren zu ermitteln. Für retrospektive Trendanalysen bietet sich damit jedoch in jedem Fall ein wundersames Werkzeug für gesellschafts- und kulturorientierte (undbibliotheksorientierte) Wissenschaften. Und die ideale Festtagsbeschäftigung für alle, auf die diese Beschreibung des zurückgezogenen achtjährigen Kindes auch in späterem Alter noch zutrifft:

„An introverted child may enjoy some limited group activity that is balanced with independent playtime. She often likes to read or play alone.“

Für die Generation des Post-Web 2.0, also die notorischen Facebookcases muss das Angebot noch mit entsprechenden Schnittstellen ausgerüstet werden, die aus dem Ngram-Buch-Vergleich ein Gesellschaftsspiel werden lassen. Denn für diese Akteure gilt laut About.com:

„The extraverted child will not be happy playing alone for long and she revels in group activities such as sports and games.“

3 Antworten

Subscribe to comments with RSS.

  1. Heinz Pampel said, on 18. Januar 2011 at 21:49

    Liebe Kolleginnen und Kollegen,

    es wäre fantastisch, wenn Ihr die Posts zukünftig unter dem Namen des jeweiligen Autors veröffentlichen könntet.

    Danke und Gruß,

    Heinz

  2. Ben said, on 19. Januar 2011 at 09:34

    Hallo Heinz,

    manchmal schreiben wir bei LIBREAS kollaborativ als Redaktion. Manchmal genieren sich Autoren auch ein wenig für ihre Texte. Für alle anderen Fälle greifen wir Deinen Vorschlag sehr gern auf und versuchen, uns zukünftig daran zu halten.

    (Wann können wir eigentlich wieder einmal einen Beitrag unter Deinem Namen veröffentlichen?)

    Viele Grüße,

    Ben


Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: