Kreuvfs Allerweltsblog

2012-12-31

Stylometry and Online Underground Markets

Abgelegt unter 29C3 von Kreuvf um 22:02:38

Sprecher: Sadia Afroz, Aylin Caliskan Islam
Sprache: Englisch
Link: noch keiner
Unterhaltungswert: 1/5
Informationsgehalt: 5/5
Bonus: „publicly available on Rapidshare“
Nochmal?: Ja
Bewertung: Ein Update zu den Talks auf dem 26C3 und dem 28C3 und es waren wieder viele interessante Dinge dabei. So sind Erkennungsraten bei fremdsprachigen Texten höher, wenn diese zuvor ins Englische übersetzt werden, durch Erstellung von Graphen lassen sich Netze erzeugen, die eine Übersicht über die Nutzer eines Forums geben, was dann wiederum genutzt werden kann, um eben jene Nutzer zu analysieren. Dieses Wissen kann dann genutzt werden, um allein auf Basis automatisierter Auswertung fünf Nutzer aus einem anderen Forum zu identifizieren, unter denen mit einer Wahrscheinlichkeit von 70% auch tatsächlich der gesuchte Nutzer ist.

Nun mögen diese Zahlen auf den ersten Blick nicht nach allzu viel aussehen, aber es gibt mehrere Gründe, wieso solche Untersuchungen dennoch als großer Erfolg gewertet werden müssen:

  • Die Forscher hinter diesem Thema arbeiten nur im kleinen Kreis und mit vergleichsweise geringen Mitteln. Und da das auch Doktoranden sind, bezweifle ich, dass die 100% ihrer Zeit auf die eigentliche Forschungsarbeit verwenden können.
  • Einkreisung auf 5 Nutzer mit 70% Wahrscheinlichkeit heißt, dass man von allen anderen Nutzern nichts manuell zu analysieren braucht und unter den 5 Nutzern dann mit 70% Wahrscheinlickeit (also gut 2/3 der Fälle) der gesuchte Nutzer darunter ist.

Würde man diese Forschung auf finanzstarkem Niveau fortführen, ergäben sich weitaus bessere Trefferraten. Es ist deshalb gut zu wissen, was mit einfachen Mitteln bereits erreicht werden kann.