Programmers are identifiable by Coding-Style

Gepostet vor 1 Jahr, 7 Monaten in Misc Science Tech Share: Twitter Facebook Mail

Dass Menschen anhand ihres Schreibstils identifizierbar sind, ist nichts neues. Vor zwei Jahren gab's einen Vortrag auf dem 29C3 über Sprachabdrücke in Underground-Märkten im Darkweb (aka Silkroad u.ä.) Jetzt hat eine neue Studie festgestellt, dass dasselbe Prinzip für Coding gilt und sich da längst nicht nur auf wiederverwendete Funktionen bezieht.

Researchers […] have developed a “code stylometry,” which uses natural language processing and machine learning to determine the authors of source code based on coding style. Their findings, which were recently published in the paper “De-anonymizing Programmers via Code Stylometry,” could be applicable to a wide of range of situations where determining the true author of a piece of code is important. For example, it could be used to help identify the author of malicious source code and to help resolve plagiarism and copyright disputes.

The authors based their code stylometry on traditional style features, such as layout (e.g., whitespace) and lexical attributes (e.g., counts of various types of tokens). Their real innovation, though, was in developing what they call “abstract syntax trees” which are similar to parse tree for sentences, and are derived from language-specific syntax and keywords. These trees capture a syntactic feature set which, the authors wrote, “was created to capture properties of coding style that are completely independent from writing style.”

IT World: CSI Computer Science: Your coding style can give you away (via /.)

Tags: Coding Language

code

Potaka: Erste Programmiersprache in bengalischer Schrift

Vor dreieinhalb Jahren gab's die erste Programmiersprache in arabischer Schrift, nun hat Ikrum Hossain eine erste Programmiersprache in bengalischen Zeichen…

fract

Fractal Droste

Schönes Posting von Roy Wiggins über fraktale Droste-Effekte inklusive jeder Menge Beispiele mit editierbarem Code, an denen man auch ohne…

doc1

.doc Unzipped

Ich hatte dankenswerterweise in meinem Leben nur selten mit Word-Dokumenten zu tun. Ich wusste daher nicht, dass .docx-Files tatsächlich gepackte…

ddos

DDoSCoin: Kryptowährung für Server-Angriffe

DDoSCoin, ein Bitcoin-Klon, in dem die Rechenleistung während des Minings für DDoS-Angriffe verwendet und als Gegenleistung für die Angriffe und/oder…

kanye

Kanye Wests favorite Aaaaaahs

Kanye Wests und die beknackten Rap-Interjektionen im Supercut. In dieser komprimierten Form sogar totalsuperbeknackt, aber ich hab’ ja auch keine…

r00

GIFs & Generative Art by Raven Kwok

Tolle Arbeiten von Raven Kwok (Tumblr, Tweeties), vor allem in Processing zusammengehackt, Code zu vielen seiner Projekte findet man hier.…

map1

Fantasy-Map-Generator

Tolles Browsertoy von Martin O'Leary, ein Map-Generator der Karten wie aus alten Fantasy-Pulp-Büchern erzeugt. Hier der Code auf Github, hier…

wir-haben-mit-einem-insider-ber-die-deutsche-amok-fanszene-gesprochen-body-image-1470402248

Interview mit einem Amoklauf-verherrlichenden Teenager

Vice hat ein faszinierendes Interview mit einem „amoklauf-verherrlichenden“ Teenager (Hervorhebungen von mir). Ein sehr schönes Beispiel, wie Aufmerksamkeitsökonomie zusammen mit…

words

Textanalysis of Drumpf-Tweets: Orange Android is angry

Data-Scientist David Robinson hat sich die Tweets von Donald Drumpf angesehen und anscheinend kommen alle nicht-agressiven, non-hyperbole Tweets, Danksagungen oder…

phoo

Typefaces for Source Code Beautification

Grade runtergeladen: Die fetteste Font-Library für Code-Editoren, die ich bislang gesehen habe, Typefaces for Source Code Beautification. Ich trainiere grade…

ref

Flüchtlinge basteln App für deutsche Bürokratie

Munzer Khattab und Ghaith Zamrik haben eine App namens Bureaucrazy entwickelt, um Flüchtlingen das Ausfüllen der Formulare des deutschen Bürokratie-Dschungels…