SPEAR findet Spammer in sozialen Netzwerken

Software unterteilt Internet-User in „Discoverer“ und „Follower“

Ein deutsch-britisches IT-Wissenschafterteam hat eine Software namens SPEAR (Spamming-resistant Expertise Analysis and Ranking) entwickelt, die Internetuser in Spammer und vertrauenswürdige Experten unterteilt. Basierend auf dem bekannten Algorithmus HITS (Hypertext-Induced Topic Selection), der Webseiten automatisch auf ihren Inhalt beurteilt und unter anderem von Suchmaschinen wie Google verwendet wird, ist es dem Team gelungen, User in sogenannte „Discoverers“ und „Followers“ einzuteilen. Die Discoverers sind jene Nutzer, die einen gewissen Inhalt zuallererst auf sozialen Netzwerken wie Flickr http://www.flickr.com oder Delicious  entdecken, beschlagworten und ihn daraufhin mit anderen Nutzern teilen. Die treue Gefolgschaft der Discoverer, die Followers, forcieren die Popularität des Inhalts wiederum, indem sie ihn im großen Maß weiter über das WWW verbreiten. Unter Zweiteren sind jedoch häufig Spammer zu finden, die sich ein populäres Thema im Web zu Nutze machen und mit meist ungewünschtem Werbeinhalt aufladen. Die Einführung von SPEAR stellt damit einen neuerlichen Versuch dar, die Verbreiter von Spam-Nachrichten im Netz auszuforschen und zu bekämpfen.

Üblicherweise wird die Vertrauenswürdigkeit…

eines Internetnutzers über die Quantität seiner Online-Beiträge bewertet. Michael Noll, der das Forschungsprojekt am Hasso Plattner Institut der Universität Potsdam  geleitet hat, sagt verständlicherweise aber, dass „Quantität nicht automatisch Qualität bedeutet.“ SPEAR verfolge demnach einen anderen Ansatz, der auf dem Konzept der „gegenseitigen Verstärkung“ basiert, so der Wissenschafter. Der Algorithmus von SPEAR bewertet populäre User und populären Inhalt und definiert anhand dessen die Experten als jene User-Gruppe, die als einzige wichtige Inhalte identifizieren kann. Die Qualität der Inhalte wird wiederum durch die Beschlagwortung der Nutzer entscheidend beeinflusst. „Das Resultat ist, dass sowohl die Experten als auch qualitätsvolle Inhalte identifiziert werden können“, fasst der nicht im Projekt involvierte IT-Wissenschafter Jon Kleinberg das Konzept der gegenseitigen Verstärkung zusammen.

Das Expertenlevel des jeweiligen Users wird in „gut“, „durchschnittlich“ und „Anfänger“ abgestuft und zusätzlich noch um einen zeitlichen Faktor gemäß dem Ansatz „Der frühe Vogel fängt den Wurm“ ergänzt. Jene User, die einen bestimmten Inhalt im Internet als erste entdecken und ihm in der Folge zu großer Popularität verhelfen, können als Trendsetter in der Community bezeichnet werden. „Sie sind es, die den Nutzwert eines Dokuments erkennen, bevor es andere tun“, erklärt Ching-man Au Yeung, der ebenfalls an der Entwicklung des SPEAR-Algorithmus mitgearbeitet hat, gegenüber Technology Review. Au Yeung vergleicht den steigenden Einflussgewinn eines Expertennutzers mit jenem eines Akademikers, der sich im wissenschaftlichen Milieu einen guten Ruf verschaffen möchte.

Die Wissenschafter haben SPEAR mithilfe von Daten der Social-Bookmarking-Seite Delicious getestet und kürzlich auf der SIGIR-Konferenz http://sigir2009.org präsentiert. Mehr als 71.000 Internetdokumente, 500.000 User und zwei Mio. geteilte Lesezeichen wurden unter die Lupe genommen. „Wir haben zum Beispiel nach Experten für JavaScript gesucht und daraufhin eine Liste von Usern erhalten. An der Spitze standen zwei professionelle Software-Entwickler und unter den ersten 200 war kein einziger Spammer zu finden“, berichtet Noll. Dem Wissenschafter zufolge könne der Algorithmus praktisch auf jedes soziale Netzwerk im Internet ausgeweitet werden. Unternehmen wie Microsoft hätten bereits Interesse bekundet und wollen den Algorithmus vor allem im Rahmen von Social-Search-Angeboten, wo Dokumente aufgrund von Nutzer-Lesezeichen bewertet werden, einsetzen. „Ich denke, dass die Kombination von gegenseitiger Verstärkung mit der Unterscheidung zwischen Discoverer und Follower in vielen Bereichen hilfreich sein kann“, so Noll zusammenfassend.