Methode

 

Social Bots zu erkennen ist komplex. Social Bots können antworten, eine Diskussion führen, über mehrere Themen twittern und auf seriöse Quellen verlinken. Sie können faven, Medientweets veröffentlichen und im Tag- und Nachtrhythmus twittern. Social Bots können sich vertippen, in Listen aufgeführt sein, eigene Listen anlegen, Tweets an ihr Profil anheften und sie können für eine lange Zeit inaktiv und geschützt sein, bevor sie für die nächste Kampagne aufwachen. Social Bots verstehen wir als Accounts, die, im Vergleich zu ausschließlich händisch geführten Accounts, mit einem überdurchschnittlich hohen Grad an Automation im Social Web arbeiten.

Botnets sind täglich im Wandel. Wir wissen dies aus mehreren Jahren Erfahrung in der händischen Social Bot Detection im politischen Raum und nach mehreren Testings mit unterschiedlichen Samples, die wir seit dem Sommer 2016 analysiert haben. Im Sommer 2016 haben wir unseren eigenen Kriterienkatalog für die Bot Detection entwickelt, den wir laufend aktualisieren. Ihm liegen komplexe Kriterien zugrunde, die eine große Menge Daten verarbeiten.
Wir haben lange diskutiert, welche unserer Kriterien wir den hier veröffentlichten Analysen zugrunde legen. Zugunsten der Nachvollziehbarkeit und der Eindeutigkeit haben wir uns im ersten Schritt für die Aktivität von Twitteraccounts als Kriterium entschieden. Mit diesem Ansatz der Bot Detection arbeitet bereits die Oxford University: welcher Account durchschnittlich gleich oder mehr als 50 Tweets am Tag veröffentlicht, wird als Social Bot klassifiziert. Bei unseren Testings von verschiedenen Samples konnten wir darüber hinaus eine Korrelation zwischen einer hohen Aktivität im Faven und von Social Bots feststellen. Aus diesem Grund haben wir unsere Bot Detection mit dem Kriterium ‚durchschnittlich gleich oder mehr als 50 Favs am Tag‘ ergänzt. Unsere Daten erheben wir über die offizielle Twitter API.

Der von uns entwickelte Botindex als prozentualer Anteil von Social Bots an politischen Diskussionen auf Twitter gibt immer den geringsten Anteil von Social Bots an, selbst wenn wir bei zusätzlichen Accounts weitere Hinweise finden konnten, die für eine hohe Automatisierung der Accounts spricht. Das bedeutet, dass die erfassten Daten mit hoher Wahrscheinlichkeit weitere Social Bots enthalten, die in unseren Analysen nicht aufgeführt werden, da Botnets neue und für unsere Erfassung nicht eindeutige Eigenschaften entwickelt haben. Unsere Kriterien prüfen und aktualisieren wir mehrmals in der Woche.

Wir wissen, dass unsere Ergebnisse unvollständig sind. Aber sie sind ein Anfang von mehr Transparenz auf Twitter bei politischen Ereignissen. Derzeit suchen wir Kooperationspartner, mit denen wir unsere noch nicht angewandten Kriterien testen und Botswatch weiterentwickeln können. Dazu gehören Skripte für die Bot Detection von qualitativen Parametern der Accounts sowie zusätzliche automatisierte Auswertungen von quantitativen Parametern und Metadaten. Diese Prozesse benötigen ein hohes Daten- und Rechenvolumen. Unsere Bot Detection können wir in Echtzeit anwenden und auswerten.