LIBREAS.Library Ideas

„Credit to whom credit is due“ – Bloganalysen mit Google und R

Posted in LIBREAS.Projektberichte by libreas on 31. Januar 2011

angeregt vom  wachsenden Interesse  quantitativen Untersuchungen über die Wirkung von Bloginhalten, wie zuletzt im Beitrag Blogs als Quellen in der bibliothekarischen Fachkommunikation, lässt sich ebenfalls die Verlinkung innerhalb von Blogs näher explorieren.

Um schnell an möglichen Daten zu gelangen, erscheint http://blogsearch.google.com/ vielversprechend. Dank R sind die Daten für die weitere statistische Untersuchung der Bloglinks auf den LIBREAS Blog auch ohne Programmierkenntnisse schnell gewonnen:

library(XML)

google <- "http://blogsearch.google.de/blogsearch_feeds?q=link:"

para <- "&num=100&hl=de&lr=&safe=off&output=atom"

blog <- "libreas.wordpress.com" #blog url

url<-paste(google,blog,para)#query

doc<-xmlTreeParse(url,useInternal=T)

name=xpathApply(doc, "//r:uri",xmlValue,namespaces=c(r="http://www.w3.org/2005/Atom"))

name=as.character(unlist(name))

lib<-as.character(rep(blog,times=length(name)))

df<-as.data.frame(cbind(lib,name))

Created by Pretty R at inside-R.org

Schnell noch mit table als Matrix umgewandelt, lässt sich ein Ego-Netzwerk visualisieren.  Die Knoten- und Kantengrößen entsprechen der Anzahl der Links

Das Ego-Netzwerk wurde mit visone visualisiert, aber auch R bietet mit sna entsprechende Funktionen. (more…)

Advertisements