Hidden Lorem-Ipsum-Messages in Google Translate from the Ghost of Machine Learning

Gepostet vor 2 Jahren, 9 Monaten in #Misc #Bugs #Error #Google #Language #Pareidolia

Share: Twitter Facebook Mail

ipsum1

Bis vor wenigen Tagen gab's einen schönen Bug in Google Translate, das auf die Eingaben von zufälligen Stellen aus dem Lorem-Ipsum-Blindtext fast vollständige, kryptische Übersetzungen anbot, die seltsam geopolitisch unterfüttert waren. Bei Krebs Security gingen sie davon aus, dass jemand bei Google die Übersetzungen manuell beeinflusst hatte, um da subversive Botschaften zu verstecken. Die tatsächliche Erklärung ist aber wohl einfacher:

Google Translate lernt Übersetzung mit Machine Learning und wertet Sprache auf den Webseiten im Google Index statistisch aus. Nun gibt es im Web drölf Millionen Layout-Leichen voller Blindtext und Lorem-Ipsum-Schnippsel mit Links zu tatsächlichen Homepages und Meldungen. Google fügt das zu Übersetzungen eines scheinbaren Ghost in the Machine zusammen und die menschliche Mustererkennung in Form eine Art linguistischer Pareidolia erledigt den Rest. Fascinating Stuff.

The joys of statistical translation. Lorem Ipsum and other Latinish gibberish is used as boilerplate by news sources when they want to test a new page design or tweak an existing layout a bit. That means there are a lot of Lorem Ipsums on news sites, a lot of them forgotten and left with links in place to real pages. When you put this garbage Latinish into Google Translate it hunts those pages down and checks those links to other pages for ‘statistical significance’. Since there isn’t any the algorithm matches the Latinish to words and phrases commonly found in the news - China, the US, main focus, Europe, business, company, etc - and spits out near-sentences. Human pattern-seeking does the rest.

Google hat den Bug mittlerweile gefixt: „Google had changed its translation algorithm to make reproducing these results impossible. Now, rather than 'lorem' returning 'China', Google Translate simply throws 'lorem' right back at you. And, for its part, Google responded cheekily with a Tweet. Garbage in, garbage out, they said.“

Vorher auf Nerdcore:
Tracking Faces in Places
Tracking Faces in Places: Machine Pareidolia
Tracking Faces in Places: Google Earth Pareidolia
Porn Pareidolia in GCHQs Yahoo-Webcam-Surveilance (Pic NSFW, kinda)

BBC News Live-Nothing

Vor ein paar Tagen so bei BBC News At Ten: Nachrichtensprecher Huw Edwards sagt 4 Minuten lang nichts und während…

Gun-Emoji Pairings 🔫😶

Interesting analysis of the Gun-Emoji-Pairings: „What does the Gun shoot at?“ and „Who pulls the Trigger?“

The Power of Language

„In this reel, we explore the incredible power of language—written, spoken and performed. First, meet the creator of Game of…

Anthony Burgess lost Dictionary of Slang discovered

Die International Anthony Burgess Foundation in Manchester hat neulich das verlorene Slang-Wörterbuch von Anthony Burgess im Keller gefunden („at the…

Neural Network Genesis Alpha

Douglas Summers hat das erste Buch Genesis der Bibel mit Neural Network Voodoo in Worte übersetzt, die allesamt mit dem…

Algo-Faces reconstruced from Monkey Brainwaves

Vor drei Wochen erst bloggte ich über die visuelle Rekonstruktion von Gedanken anhand von EEG-Aufzeichnungen, mit denen man Neural Networks…

Podcasts: Sid Vicious, Baudrillards Simulacra, das Wörterbuch der Unruhe und das Märchen vom unglaublichen Super-Kim aus Pjöngjang

Jede Menge Podcasts und Hörspiele, die ich in den letzten Wochen gehört habe, unter anderem ein Hörspiel um einen mutierenden…

Urban Dictionary Anagrams, ranked

Sean Carney hat die Anagramme aus dem Urban Dictionary ermittelt und mit einem Algorithmus sortiert: How to Find Anagrams on…

Social Media based Substance Use Detection

Shit, they got me. (I think they follow me on Twitter, too. Damn. [Not really.]) Table 6 is hilarious: In…

15000yrs old ultraconserved Words from the Stone-Age found in present Languages

[update] Der verlinkte Artikel ist vier Jahre (hatte ich nicht gesehen), hier eine ausführliche Kritik im Languagelog: „The authors intend…

Do not pet a Snip Snap Doggo

I find this funnier than I should: this is the only video i need pic.twitter.com/uxN7AIc2X2 — Dank Memes 💎💎💎 (@FreeMemesKids)…