282.596 ungefilterte Pegida-Kommentare

Mein Buddy Gregor zieht seit Dezember letzten Jahres Kommentare von der deutschen Pegida-Facebook-Seite, bevor die gelöscht werden. Mit dem Textkorpus hatten wir eigentlich irgendwas mit Kunst vor, möglicherweise in Kombination mit einer Fotoausstellung oder einer Doku, das hat sich aber nun wohl mit der Selbstzerfleischung der fremdenfeindlichen Bewegung von selbst erledigt, zumindest für's erste. Wohl auch deshalb hat er zusammen mit Hannes Bajohr die gesammelten Comments nun in einer 71,5MB (23MB gezipt) großen Text-Datei veröffentlicht (nachdem er vor ein paar Wochen schon ein Pegida-Gedicht aus den Kommentaren generiert hatte).

Anfangs nur zu Dokumentationszwecken ließ 0x0a (Gregor Weichbrodt und Hannes Bajohr) diese Kommentare durch ein Scraping-Script regelmäßig sammeln. Seit Dezember letzten Jahres ist bis heute ein 282.596 Kommentare und 7.751.654 Wortformen umfassendes Textkorpus der Pegida-Sprache entstanden. Erst jetzt umfangreich genug um repräsentativ zu sein, stellen wir es heute online. Zwar enthält es, da ungefiltert gesammelt, auch die Stimmen der Gegner Pegidas, dennoch ist diese Datenbank zur linguistischen Auswertung nicht weniger als zur literarischen Nutzung geeignet.

Ob Pegida nur Ängste artikuliert oder Hass schürt, ob sich unter ihrem Namen besorgte Bürger austauschen oder Rachephantasien Luft gemacht wird, mit welcher Häufigkeit, Wertung und Ausgewogenheit Wörter wie »Systemmedien«, »Lügenpresse«, »Gutmenschen« oder »Islamisierung« auftauchen, wann zu Besonnenheit und wann zu Provokation aufgerufen wird – all das kann man hier nachlesen, parsen, quantitativ analysieren oder künstlerisch aufbereiten. Wir hoffen, dass man davon Gebrauch machen wird.

0x0a: Die Sprache Pegidas