Programmers are identifiable by Coding-Style

Gepostet vor 1 Jahr, 6 Monaten in Misc Science Tech

Dass Menschen anhand ihres Schreibstils identifizierbar sind, ist nichts neues. Vor zwei Jahren gab's einen Vortrag auf dem 29C3 über Sprachabdrücke in Underground-Märkten im Darkweb (aka Silkroad u.ä.) Jetzt hat eine neue Studie festgestellt, dass dasselbe Prinzip für Coding gilt und sich da längst nicht nur auf wiederverwendete Funktionen bezieht.

Researchers […] have developed a “code stylometry,” which uses natural language processing and machine learning to determine the authors of source code based on coding style. Their findings, which were recently published in the paper “De-anonymizing Programmers via Code Stylometry,” could be applicable to a wide of range of situations where determining the true author of a piece of code is important. For example, it could be used to help identify the author of malicious source code and to help resolve plagiarism and copyright disputes.

The authors based their code stylometry on traditional style features, such as layout (e.g., whitespace) and lexical attributes (e.g., counts of various types of tokens). Their real innovation, though, was in developing what they call “abstract syntax trees” which are similar to parse tree for sentences, and are derived from language-specific syntax and keywords. These trees capture a syntactic feature set which, the authors wrote, “was created to capture properties of coding style that are completely independent from writing style.”

IT World: CSI Computer Science: Your coding style can give you away (via /.)

Tags: Coding Language

windowlicker

Music DNA Visualisierung

Tolles Browsertoy von jemandem namens Paul: Music DNA visualisiert die Frequenzen eines MP3s kreisförmig in Regenbogenfarben, wie knallbunte Songstruktur-Pupillen, oder…

Bildschirmfoto 2016-07-28 um 13.55.11

Was ist das nur für 1 Chrome-Plugin?

Nettes Chrome-Plugin von @Moklick, das jedes noch so seriöse Medium, das versucht hier 1 auf Schwurbelprätentiösheimer zu machen, auf Internet-Niveau…

part

Typo-Particle-Browsertoy

Hübsches Browsertoy für Typo-Particle-Animationen von Mario Heigl.

glitch

Glitchy Malware Demos

Über den YT-Channel von danooct1 voller Demos von Viren hatte ich schonmal vor drei Jahren gebloggt, seitdem ist jede Menge…

poodoo

Poodoo im Apollo11-Assembler-Code

„Poodoo“ ist in der Sprache Jabba The Huts „Bantha Futter“. Die Sprache der Huts hatte Lucas damals aus Versatzstücken von…

type1

Dyslexia-simulating Font

Nettes Typo-Experiment von Daniel Britton, ein Font, der die Lesegeschwindikeit auf die eines an Dyslexie leidenden Menschen reduziert. Erinnert ein…

metal

Most and least Metal Words

Jemand namens Iain hat sich einen Datensatz der Lyrics von 222.623 Metal-Songs von 7364 Bands aus 22314 Alben gezogen. Dann…

metal

Metal Riff Generator

Ein Metal-Generator per Web Audio API. Who needs musicians, really. Hier der Code auf Github. (via Algorithmic)

Bildschirmfoto 2016-06-30 um 15.10.22

Linguistics of Coming: Konzepte des Orgasmus in 27 Sprachen

Schöne Stude von Anita Yen Chiang und Wen-yu Chiang von der Uni Sussex: Behold, I am Coming Soon! A Study…

kata0

Katamari Damacy Text-Adventure

Eine Text-Adventure-Version des japanischen Weirdogame-Klassikers Katamari Damacy, Download auf Github, spielbar als Python-Dings per Kommandozeile. Ist so ziemlich genau so…

frump

Scottish Trump-Insults, ranked

Drumpf today tweeted „Just arrived in Scotland. Place is going wild over the vote.“ Ofcourse, Scotland voted to stay in…