Hate-Mining is a thing

Neu auf dem Weg zum algorithmischen Hatespeech-Filter: HateMining vom Institut für Wirtschaftsinformatik. Not sure about this.

HateMining fokussiert sich auf automatische Text- und Inhaltsanalysen, um Hass im Internet zu erkennen und letztlich einzudämmen. Die Erkennung mit Hilfe von Textanalyse-Techniken ist schwierig – aber wir zeigen jedoch mögliche Wege auf. Dafür entwickeln wir keine eigene Kommentarplattform, sondern prototypische Verfahren, die sich durch Betreiber von Internetseiten leicht in bestehende Foren oder Kommentarfunktionen integrieren lassen. Am Ende dieser Webseite können Sie selbst ausprobieren, wie gut die verschiedenen Verfahren funktionieren.

Hier der Troll-Score, sowas wie Klout für Shitposter:

trollscore

Hier das Hass-Wörterbuch: „Das Diagramm zeigt die Wörter mit den höchsten Koeffizienten der beiden Klassifikationsverfahren Logistische Regression und Ridge Regression. Positive Koeffizienten weisen auf Hass hin, Negative auf Kein-Hass.“

Bildschirmfoto 2016-09-07 um 13.59.31

Die Argumente gegen solche Projekte liegen auf der Hand, dennoch werden genau solche Tools so sicher kommen, wie die Hackfleischbällchen am fliegenden Spaghettimonster. Ich wiederhole hier einfach mal, was ich beim Yahoos algorithmischen Hatespeech-Filter geschrieben hatte:

hier ein faszinierendes Bit aus [Yahoos] Paper zur Quantifizierung von Hatespeech.

Laut deren Korpus wurden zwischen 7% (in Yahoos Finance-Comments) und massiven 20% (Yahoos News-Comments) als Hatespeech identifiziert. Bei aller Kritik und nehmen wir mal kurz an, dass diese identifizierten Kommentare tatsächlich juristisch relevante Beleidigungen und Drohungen aka Hatespeech enthalten und nicht etwa Ironie, Sarkasmus oder scharf formulierte Kritik: Dieses Aufkommen an gezielten Attacken übersteigt das im Real Life um ein Vielfaches und eine algorithmische Bekämpfung des Phänomens, ähnlich wie Spam, dürfte langfristig unvermeidbar sein.