Hidden Lorem-Ipsum-Messages in Google Translate from the Ghost of Machine Learning

Gepostet vor 2 Jahren, 8 Monaten in #Misc #Bugs #Error #Google #Language #Pareidolia

Share: Twitter Facebook Mail

ipsum1

Bis vor wenigen Tagen gab's einen schönen Bug in Google Translate, das auf die Eingaben von zufälligen Stellen aus dem Lorem-Ipsum-Blindtext fast vollständige, kryptische Übersetzungen anbot, die seltsam geopolitisch unterfüttert waren. Bei Krebs Security gingen sie davon aus, dass jemand bei Google die Übersetzungen manuell beeinflusst hatte, um da subversive Botschaften zu verstecken. Die tatsächliche Erklärung ist aber wohl einfacher:

Google Translate lernt Übersetzung mit Machine Learning und wertet Sprache auf den Webseiten im Google Index statistisch aus. Nun gibt es im Web drölf Millionen Layout-Leichen voller Blindtext und Lorem-Ipsum-Schnippsel mit Links zu tatsächlichen Homepages und Meldungen. Google fügt das zu Übersetzungen eines scheinbaren Ghost in the Machine zusammen und die menschliche Mustererkennung in Form eine Art linguistischer Pareidolia erledigt den Rest. Fascinating Stuff.

The joys of statistical translation. Lorem Ipsum and other Latinish gibberish is used as boilerplate by news sources when they want to test a new page design or tweak an existing layout a bit. That means there are a lot of Lorem Ipsums on news sites, a lot of them forgotten and left with links in place to real pages. When you put this garbage Latinish into Google Translate it hunts those pages down and checks those links to other pages for ‘statistical significance’. Since there isn’t any the algorithm matches the Latinish to words and phrases commonly found in the news - China, the US, main focus, Europe, business, company, etc - and spits out near-sentences. Human pattern-seeking does the rest.

Google hat den Bug mittlerweile gefixt: „Google had changed its translation algorithm to make reproducing these results impossible. Now, rather than 'lorem' returning 'China', Google Translate simply throws 'lorem' right back at you. And, for its part, Google responded cheekily with a Tweet. Garbage in, garbage out, they said.“

Vorher auf Nerdcore:
Tracking Faces in Places
Tracking Faces in Places: Machine Pareidolia
Tracking Faces in Places: Google Earth Pareidolia
Porn Pareidolia in GCHQs Yahoo-Webcam-Surveilance (Pic NSFW, kinda)

Rogue Apostrophe Vigilante

Wie die Graffiti Grammar Police aus Ecuador, nur mit Deppen-Apostroph in Bristol. (via Martin)

Finding Animal-Shapes in Noise

Michael Trott hat im Forum von Wolfram Alpha ein random Noise-Pic generiert, die Verdichtungen und Shapes im Noise isoliert, die…

The best Anagramm

Mark Dominus hat das beste Anagramm der englischen Sprache ausgerechnet. Dazu hat er die komplette Liste der Anagramme (der englischen…

RechtsLinks 17.2.2017: Fuckopoulos at Maher, PewDiePie is a racist SuperNazi from hell, Trump is 4chan

Pic: Lie Lie Land von Bambi First things first: Milo Fuckopoulos ist heute abend bei Bill Maher: „Yiannopoulos will be…

Where Slang Comes From

Schönes Posting von Matt Daniels über 2016er Slang: Where Slang Comes From – Emerging slang, identified by searches for words’…

MuscularAnimeGirl[NSFW].jpg = IndustrialMusic.mp3

Cool Bug featuring „a muscular girl“.jpg, anime style („slighly NSFW“ [„it's the only sample I had“ – sure]) and Industrial…

RechtsLinks 12.2.2017: Seeßlen über die Sprache der Rechten und eine Tour der pro-authoritaristischen Neo-Reaktion

The Atlantic: Behind the Internet's Anti-Democracy Movement – White House chief strategist Steve Bannon is reportedly a reader of neoreactionary…

Semiotics of Pepe

PBS Idea Channel über die Semiotik von Pepe: „Feels several different ways, man“. Bücher-Wiki über die im Clip angesprochene Polysemie:…

21 Things that Trump says make a „Bing“-Sound

Bing! 21 things that President Trump says make a "bing" sound pic.twitter.com/7e1Smlwoai — VICE News (@vicenews) February 7, 2017

Why Germans Can Say Things No One Else Can

School of Life: „Backpfeifengesicht, a face that's begging to be slapped. Generosity towards others is key, but German is bracing…

Bundestagswahl-SEO-Spam von Verschwörungstheoretikern

Vor ein paar Tagen tweetete Stefan Niggemeier „Wenn ich @GoogleDE nach dem Tag der Bundestagswahl frage, bekomme ich neben dem…