LIBREAS.Library Ideas

#bibtag11 – Daten und Visualisierungen zur Twitterkommunikation II

Posted in LIBREAS aktuell, LIBREAS Veranstaltungen by libreas on 13. Juni 2011

Konnten während des 100. Bibliothekartags Mittwoch mittgas 142 Twitter-Accounts, die 695 Tweets mit dem Hash-Tag #bibtag11 versehen haben, identifiziert werden, so wuchs das Kommunikationsnetzwerk auf 2.238 Tweets von 173 verschiedenen Twitter-Accounts an.

Visualisierungen, und inbesondere Netzwerke, positionieren sich selten und sind häufig nur der Beginn für die weitere wissenschaftliche Untersuchung. Aber ohne Datengewinnung und die anschließende Exploration von Beziehungsgefügen wären Nachvollziehbarkeit, Anschlussfragen und Kritik nicht möglich. Und sind Informationsvisualisierung und die Bereitstellung von Korpora im Bereich der wissenschaftlichen Kommunikation nicht originäre Felder der Bibliotheks- und Informationswissenschaft?

Datengewinnung

Twitter ist ein Medium, das sich für die Untersuchung von Teilnehmern wissenschaftlicher Konferenzen eignet. Um an die entsprechenden Tweets, die eine Konferenz begleiten, zu gelangen, bietet sich die Suche nach dem entsprechenden Hash-Tag an. Stand mit Twapperkeeper.com lange Zeit ein webbasierter Dienst für die Datensammlung von Tweets bereit, so musste Twapperkeeper.com zum 20. März 2011 seine Download-Funktion der tabellarisch aufbereiteten Daten abschalten. (TwapperKeeper-Archiv für #bibtag11 )

Eine Alternative bietet das Ein- und Auslesen der Feeds der Twitter Suche. Mit R gelingt es wie folgt:

#Twitter Parsen mit R

library(XML)

url<-c("http://search.twitter.com/search.atom?tag=bibtag11&rpp=10")

id <- c()

name <- c()

tweet <- c()

updated <- c()

for (i in seq (1, 100, by=1 )) {

url.d <- paste (url, "&page=", i , sep="")

doc <- xmlTreeParse(url.d,useInternal=T)

id.tmp = tweet.tmp = xpathSApply(doc, "//r:entry//r:id",xmlValue,
namespaces=c(r="http://www.w3.org/2005/Atom"))

name.tmp = xpathSApply(doc, "//r:name",xmlValue,
namespaces=c(r="http://www.w3.org/2005/Atom"))
tweet.tmp = xpathSApply(doc, "//r:entry//r:title",xmlValue,
namespaces=c(r="http://www.w3.org/2005/Atom"))
updated.tmp = xpathSApply(doc, "//r:entry//r:published",xmlValue,
namespaces=c(r="http://www.w3.org/2005/Atom"))

if (length(id.tmp) == 0)
break
else

id <- c(id, id.tmp)
name <- c(name,name.tmp)
tweet <- c(tweet, tweet.tmp)
updated <- c(updated, updated.tmp)

my.data <- data.frame (id, name, tweet, updated)

}

Created by Pretty R at inside-R.org

Der Vorteil der Methode ist, dass kein API-Key und kein Twitter-Account vonnöten ist, um an die entsprechenden Daten zu gelangen. Nachteilig ist allerdings, dass nur Tweets der letzten fünf Tage und dann auch nur maximal 1.000 über die Suche aufgerufen werden können. Das Skript muss somit bei einem längeren Zeitraum oder einer hohen Twitter-Intensität regelmäßig aufgerufen und die Datensätze zusammengeführt werden (Deduplikation über id).  Zudem ist fraglich, wie lange Twitter noch Feeds unterstützt.

Abschließend steht ein R-Objekt, das für die weitere statistische Aufbereitung und Analyse in R verwendet oder in eine Tabellenkalkulation geladen werden kann.
Der Datensatz:

bibtag11gesamt.xls

Der so gewonnene Datensatz war Grundlage für die Extraktion der Hash-Tags und der Bildung einer bipartiten Matrix, um das Netzwerk mittels visone zu visualisieren.

Tweets pro Tag

Um die Verteilung der Tweets je Tag zu explorieren, bietet R nützliche Funktionen:

#time

library(ggplot2)

my.data$updated <- as.Date(my.data$updated, format="%Y-%M-%d")

time.bib <- as.data.frame(table(unlist(my.data$updated)))

ggplot(time.bib, aes(x=as.Date(Var1), y=Freq)) +
geom_bar(fill="darkred", stat="identity") +
xlab("Day") + ylab("Tweets")

Created by Pretty R at inside-R.org

Und das Ergebnis: Verteilung der Tweets mit dem Hash-Tag #bibtag11 auf Tage:

(Najko Jahn)

2 Antworten

Subscribe to comments with RSS.

  1. […] Jahn, Najko: #bibtag11 – Daten und Visualisierungen zur Twitterkommunikation II, LIBREAS.Libreas Ideas [Update] Plieninger, Jürgen: Zukunftswerkstatt, Bibliothekartag 2011: […]

  2. […] Vergleich mit dem Twitter-Kommunikationsnetzwerk während des Bibliothekartag 2011 ist beeindruckend, sowohl hinsichtlich der hohen Frequenz als auch der Anzahl der distinkten […]


Hinterlasse einen Kommentar