Programmers are identifiable by Coding-Style

Gepostet vor 1 Jahr, 10 Monaten in Misc Science Tech Share: Twitter Facebook Mail

Dass Menschen anhand ihres Schreibstils identifizierbar sind, ist nichts neues. Vor zwei Jahren gab's einen Vortrag auf dem 29C3 über Sprachabdrücke in Underground-Märkten im Darkweb (aka Silkroad u.ä.) Jetzt hat eine neue Studie festgestellt, dass dasselbe Prinzip für Coding gilt und sich da längst nicht nur auf wiederverwendete Funktionen bezieht.

Researchers […] have developed a “code stylometry,” which uses natural language processing and machine learning to determine the authors of source code based on coding style. Their findings, which were recently published in the paper “De-anonymizing Programmers via Code Stylometry,” could be applicable to a wide of range of situations where determining the true author of a piece of code is important. For example, it could be used to help identify the author of malicious source code and to help resolve plagiarism and copyright disputes.

The authors based their code stylometry on traditional style features, such as layout (e.g., whitespace) and lexical attributes (e.g., counts of various types of tokens). Their real innovation, though, was in developing what they call “abstract syntax trees” which are similar to parse tree for sentences, and are derived from language-specific syntax and keywords. These trees capture a syntactic feature set which, the authors wrote, “was created to capture properties of coding style that are completely independent from writing style.”

IT World: CSI Computer Science: Your coding style can give you away (via /.)

Tags: Coding Language

algo1

Algorithmic Nicolas Cage/Taylor Swift Face-Swaps

Iryna Korshunova, Wenzhe Shi, Joni Dambre und Lucas Theis haben einen Algorithmus für FaceSwaps programmiert und zur Illustration ihrer Methode…

sat

Neural Network Satellite-Images from Doodles

Invisible Cities, ein Neural Network, das Satellitenbilder aus Gekritzel generiert. Funktioniert so ein bisschen wie Style-Transfer, nur für Satellitenpics. In…

slack-header

Slack für C64

Endlich ein vernünftiger Slack-Client: „Team communication for the 21st century… now backwards compatible with 1985!“

ww

Westworld Version 4.5.2 Patch Notes

McSweeney mit dem ReadMe.txt des letzten Westworld-Updates. Die Hosts haben jetzt größere Hüte, die besser riechen. Ein paar Favs: GENERAL…

birdsounds

Google A.I. sortiert Vogelgesang

Google hat unter AI-Experiments ’ne Spielwiese für Machine Learning und AI eingerichtet. Ein paar der Experimente kannte ich bereits von…

banklobby_example

Neural Enhance getting sharp

Neues von AI-basiertem Zoom & Enhance (Vorher auf NC: Zoom & Enhance via Neural Network Super Resolution, Neural Network Super…

bildschirmfoto-2016-11-02-um-15-31-50

Ein algorithmisches Tagebuch aller Zeiten

Gestern startete der Algo-Literatur-Wettbewerb National Novel Generation Month 2016 mit jetzt bereits rund 80 eingereichten Robot-Text-Projekten und nach einem Tag…

inv

Oscilloscope Music

Vektorgrafiken mit Sound in ein Oszilloskop malen: Oscilloscope Music, „an audio-visual album that uses old analogue oscilloscopes for displaying hand…

South Park: Language and Censorship

South Park: Language and Censorship

Falls in diesem Leben nochmal dazu komme, schreibe ich mal den Artikel, der mir seit einem Jahr im Kopf rumschwebt…

noto1

Googles Noto – 1 Opensource-Babelfont für alle Sprachen und Schriften

Monotype hat für Google einen Opensource-Font entwickelt, der mehr als 800 Sprachen und 100 Alphabete abdeckt. Die größte und umfassendste…

3d

F3: Live-Coding 3D-Objects

F3 [Form From Function], eine neue Umgebung zur Programmierung von 3D-Objekten in der OpenGL Shading Language: Like Processing, F3 offers…