Programmers identifiable by compiled Code

Gepostet vor 1 Jahr, 1 Monat in #Misc #Science #Tech #Coding #Language #Privacy

Share: Twitter Facebook Mail

Vor einem Jahr hatte ich über ein Paper gebloggt, laut dem Programmierer anhand ihres Coding-Styles identifiziert werden konnten. Überraschend war das nicht wirklich, man kann schon länger Menschen anhand ihres Sprachabdrucks online identifizieren. Jetzt haben sie ihre Studie erweitert und das geht wohl auch bei kompiliertem Code, was nochmal ’ne Spur abgefahrener ist. (Kompilierung ist, grob vereinfacht, die Übersetzung von Code in Maschinensprache.)

Executable binaries of compiled source code on their own are difficult to analyze because they lack human readable information. Nevertheless reverse engineering methods make it possible to disassemble and decompile executable binaries. After applying such reverse engineering methods to executable binaries, we can generate numeric representations of authorial style from features preserved in binaries. […]

- By comparing advanced and less advanced programmers’, we found that more advanced programmers are easier to de-anonymize and they have a more distinct coding style.
- We also de-anonymize GitHub users in the wild, which we explain in detail in the paper. These promising results are encouraging us to extend our method to large real world datasets of various natures for future work.
- Why does de-anonymization work so well? It’s not because the decompiled source code looks anything like the original. Rather, the feature vector obtained from disassembly and decompilation can be used to predict, using machine learning, the features in the original source code — with over 80% accuracy. This shows that executable binaries preserve transformed versions of the original source code features.

Freedom to Tinker: When coding style survives compilation: De-anonymizing programmers from executable binaries (via Schneier)
media.ccc.de: De-anonymizing Programmers: Large Scale Authorship Attribution from Executable Binaries of Compiled Code and Source Code

Stupid Hacks from Stupid Hackathon Sweden

Vor ein paar Tagen ging der Stupid Hackathon Schweden zu Ende, hier eine Liste aller dort realisierten Projekte. Spontan mein…

RechtsLinks 17.2.2017: Fuckopoulos at Maher, PewDiePie is a racist SuperNazi from hell, Trump is 4chan

Pic: Lie Lie Land von Bambi First things first: Milo Fuckopoulos ist heute abend bei Bill Maher: „Yiannopoulos will be…

Cool Coding Sticker: I hate Programming I love Programming!

I can relate. Gibt's auf Redbubble für 3 Euro. (via Sara Soueidan)

Where Slang Comes From

Schönes Posting von Matt Daniels über 2016er Slang: Where Slang Comes From – Emerging slang, identified by searches for words’…

MuscularAnimeGirl[NSFW].jpg = IndustrialMusic.mp3

Cool Bug featuring „a muscular girl“.jpg, anime style („slighly NSFW“ [„it's the only sample I had“ – sure]) and Industrial…

RechtsLinks 12.2.2017: Seeßlen über die Sprache der Rechten und eine Tour der pro-authoritaristischen Neo-Reaktion

The Atlantic: Behind the Internet's Anti-Democracy Movement – White House chief strategist Steve Bannon is reportedly a reader of neoreactionary…

Semiotics of Pepe

PBS Idea Channel über die Semiotik von Pepe: „Feels several different ways, man“. Bücher-Wiki über die im Clip angesprochene Polysemie:…

21 Things that Trump says make a „Bing“-Sound

Bing! 21 things that President Trump says make a "bing" sound pic.twitter.com/7e1Smlwoai — VICE News (@vicenews) February 7, 2017

PostScript-Malware manipulates Print-Jobs

Fefe hat gestern ein interessantes Sicherheits-Leck verlinkt mit dem lapidaren Satz: „Benutzt hier jemand Postscript-Drucker?“ This post is about manipulating…

Why Germans Can Say Things No One Else Can

School of Life: „Backpfeifengesicht, a face that's begging to be slapped. Generosity towards others is key, but German is bracing…

Polyglot Inception = JPEG = CSS = JS = HTML

JS-Wizard Martin Kleppe hat ein JPG, ein Stylesheet, ein Javascript und ein HTML in dasselbe Textfile gebacken: Polyglot Inception4. Levels…