Programmers identifiable by compiled Code

Gepostet vor 1 Jahr, 3 Monaten in #Misc #Science #Tech #Coding #Language #Privacy

Share: Twitter Facebook Mail

Vor einem Jahr hatte ich über ein Paper gebloggt, laut dem Programmierer anhand ihres Coding-Styles identifiziert werden konnten. Überraschend war das nicht wirklich, man kann schon länger Menschen anhand ihres Sprachabdrucks online identifizieren. Jetzt haben sie ihre Studie erweitert und das geht wohl auch bei kompiliertem Code, was nochmal ’ne Spur abgefahrener ist. (Kompilierung ist, grob vereinfacht, die Übersetzung von Code in Maschinensprache.)

Executable binaries of compiled source code on their own are difficult to analyze because they lack human readable information. Nevertheless reverse engineering methods make it possible to disassemble and decompile executable binaries. After applying such reverse engineering methods to executable binaries, we can generate numeric representations of authorial style from features preserved in binaries. […]

- By comparing advanced and less advanced programmers’, we found that more advanced programmers are easier to de-anonymize and they have a more distinct coding style.
- We also de-anonymize GitHub users in the wild, which we explain in detail in the paper. These promising results are encouraging us to extend our method to large real world datasets of various natures for future work.
- Why does de-anonymization work so well? It’s not because the decompiled source code looks anything like the original. Rather, the feature vector obtained from disassembly and decompilation can be used to predict, using machine learning, the features in the original source code — with over 80% accuracy. This shows that executable binaries preserve transformed versions of the original source code features.

Freedom to Tinker: When coding style survives compilation: De-anonymizing programmers from executable binaries (via Schneier)
media.ccc.de: De-anonymizing Programmers: Large Scale Authorship Attribution from Executable Binaries of Compiled Code and Source Code

C64-Demo generates itself from Soundtrack

Gewinnerdemo der Revision 2017 von Linus Akesson, ein C64-Hack in 256 Bytes: A Mind is born. Ich verstehe ja noch…

Binary Keyboard

Nette Spielerei von Chris Johnston: „A two-button backlit mechanical keyboard that types ASCII values, one bit at a time.“ (via…

Rogue Apostrophe Vigilante

Wie die Graffiti Grammar Police aus Ecuador, nur mit Deppen-Apostroph in Bristol. (via Martin)

Digital-Uhr in Conways Game of Life

Großartig: Eine Digital-Uhr in John Horton Conways zweidimensionalen zellulären Automaten: Get the design from this gist. Copy the whole file…

A Banana Keytar and more from Stupid Hackathon: Inverted Eyetracker-Pong, Robot Porn Addict or the Shitty Sharpie Tattoo Gun)

Ein weiterer Fav vom Stupid Hackathon NYC 2017, die Banana-Keytar von Amanda Lange. Auch geil: der Twitter-Bot Robot Porn Addiction,…

Dwitter – Social-Network für JavaScript-Remixe

Dwitter, ein Social Network von Andreas Løve Selvik für visuelle Javascript-Experimente in 140 Zeichen mit eingebauter Remix-Option für jedes Code-Snippet.…

Finding Animal-Shapes in Noise

Michael Trott hat im Forum von Wolfram Alpha ein random Noise-Pic generiert, die Verdichtungen und Shapes im Noise isoliert, die…

The best Anagramm

Mark Dominus hat das beste Anagramm der englischen Sprache ausgerechnet. Dazu hat er die komplette Liste der Anagramme (der englischen…

./code--poetry

„This website displays a collection of twelve code poems, each written in the source code of a different programming language.…

Stupid Hacks from Stupid Hackathon Sweden

Vor ein paar Tagen ging der Stupid Hackathon Schweden zu Ende, hier eine Liste aller dort realisierten Projekte. Spontan mein…

RechtsLinks 17.2.2017: Fuckopoulos at Maher, PewDiePie is a racist SuperNazi from hell, Trump is 4chan

Pic: Lie Lie Land von Bambi First things first: Milo Fuckopoulos ist heute abend bei Bill Maher: „Yiannopoulos will be…