Programmers identifiable by compiled Code

Gepostet vor 11 Monaten, 2 Tagen in Misc Science Tech Share: Twitter Facebook Mail

Vor einem Jahr hatte ich über ein Paper gebloggt, laut dem Programmierer anhand ihres Coding-Styles identifiziert werden konnten. Überraschend war das nicht wirklich, man kann schon länger Menschen anhand ihres Sprachabdrucks online identifizieren. Jetzt haben sie ihre Studie erweitert und das geht wohl auch bei kompiliertem Code, was nochmal ’ne Spur abgefahrener ist. (Kompilierung ist, grob vereinfacht, die Übersetzung von Code in Maschinensprache.)

Executable binaries of compiled source code on their own are difficult to analyze because they lack human readable information. Nevertheless reverse engineering methods make it possible to disassemble and decompile executable binaries. After applying such reverse engineering methods to executable binaries, we can generate numeric representations of authorial style from features preserved in binaries. […]

- By comparing advanced and less advanced programmers’, we found that more advanced programmers are easier to de-anonymize and they have a more distinct coding style.
- We also de-anonymize GitHub users in the wild, which we explain in detail in the paper. These promising results are encouraging us to extend our method to large real world datasets of various natures for future work.
- Why does de-anonymization work so well? It’s not because the decompiled source code looks anything like the original. Rather, the feature vector obtained from disassembly and decompilation can be used to predict, using machine learning, the features in the original source code — with over 80% accuracy. This shows that executable binaries preserve transformed versions of the original source code features.

Freedom to Tinker: When coding style survives compilation: De-anonymizing programmers from executable binaries (via Schneier)
media.ccc.de: De-anonymizing Programmers: Large Scale Authorship Attribution from Executable Binaries of Compiled Code and Source Code

Tags: Coding Language Privacy

pf

„Postfaktisch“ ist Wort des Jahres

Die Gesellschaft für deutsche Sprache hat „postfaktisch“ zum Wort des Jahres gewählt, nachdem bereits das Oxford Dictionary vor ein paar Wochen…

Atari 2600-Emulator in Minecraft

Atari 2600-Emulator in Minecraft

Impressive: „I built an Atari 2600 Emulator in vanilla Minecraft using a couple thousand command blocks.“

code

Gomix – Code-Remix-Environment for building Bots and Web-Apps

FogBugz, die Macher von Stack Overflow und Trello, haben eine neue Coding-Plattform online gestellt: „Gomix is the easiest way to…

algo1

Algorithmic Nicolas Cage/Taylor Swift Face-Swaps

Iryna Korshunova, Wenzhe Shi, Joni Dambre und Lucas Theis haben einen Algorithmus für FaceSwaps programmiert und zur Illustration ihrer Methode…

sat

Neural Network Satellite-Images from Doodles

Invisible Cities, ein Neural Network, das Satellitenbilder aus Gekritzel generiert. Funktioniert so ein bisschen wie Style-Transfer, nur für Satellitenpics. In…

slack-header

Slack für C64

Endlich ein vernünftiger Slack-Client: „Team communication for the 21st century… now backwards compatible with 1985!“

ww

Westworld Version 4.5.2 Patch Notes

McSweeney mit dem ReadMe.txt des letzten Westworld-Updates. Die Hosts haben jetzt größere Hüte, die besser riechen. Ein paar Favs: GENERAL…

birdsounds

Google A.I. sortiert Vogelgesang

Google hat unter AI-Experiments ’ne Spielwiese für Machine Learning und AI eingerichtet. Ein paar der Experimente kannte ich bereits von…

banklobby_example

Neural Enhance getting sharp

Neues von AI-basiertem Zoom & Enhance (Vorher auf NC: Zoom & Enhance via Neural Network Super Resolution, Neural Network Super…

bildschirmfoto-2016-11-02-um-15-31-50

Ein algorithmisches Tagebuch aller Zeiten

Gestern startete der Algo-Literatur-Wettbewerb National Novel Generation Month 2016 mit jetzt bereits rund 80 eingereichten Robot-Text-Projekten und nach einem Tag…

inv

Oscilloscope Music

Vektorgrafiken mit Sound in ein Oszilloskop malen: Oscilloscope Music, „an audio-visual album that uses old analogue oscilloscopes for displaying hand…