Nerdcore per Mail

RSS Feed About Archive NC-Sources Impressum Datenschutz

Programmers are identifiable by Coding-Style

Gepostet vor 1 Jahr, 3 Monaten in

Dass Menschen anhand ihres Schreibstils identifizierbar sind, ist nichts neues. Vor zwei Jahren gab's einen Vortrag auf dem 29C3 über Sprachabdrücke in Underground-Märkten im Darkweb (aka Silkroad u.ä.) Jetzt hat eine neue Studie festgestellt, dass dasselbe Prinzip für Coding gilt und sich da längst nicht nur auf wiederverwendete Funktionen bezieht.

Researchers […] have developed a “code stylometry,” which uses natural language processing and machine learning to determine the authors of source code based on coding style. Their findings, which were recently published in the paper “De-anonymizing Programmers via Code Stylometry,” could be applicable to a wide of range of situations where determining the true author of a piece of code is important. For example, it could be used to help identify the author of malicious source code and to help resolve plagiarism and copyright disputes.

The authors based their code stylometry on traditional style features, such as layout (e.g., whitespace) and lexical attributes (e.g., counts of various types of tokens). Their real innovation, though, was in developing what they call “abstract syntax trees” which are similar to parse tree for sentences, and are derived from language-specific syntax and keywords. These trees capture a syntactic feature set which, the authors wrote, “was created to capture properties of coding style that are completely independent from writing style.”

IT World: CSI Computer Science: Your coding style can give you away (via /.)

More:

arctic_t2m_dfa_2016

Arctic Heatwave off the charts 🌞

In der Arktis ist es derzeit so warm (oder eher: nicht kalt), die Messergebnisse des National Snow and Ice Data Center passen nicht mehr in…

olly

Spoilers still cool

Die Uni California wärmt ihre 5 Jahre alte Studie zu Spoilern nochmal auf, in der Psychologen feststellten, dass Spoiler die Rezeption der Story verbessern und…

weird

Pixelsynth

Pixelsynth (Code auf Github), nettes Spielzeug von Olivia Jack mit dem man Sounds aus Bildern erzeugen kann. I sound weird.

blade

Neural Network dreams of electric Blade Runners

Terence Broad hat ein Neural Network auf die ersten 10 Minuten von Bladerunner trainiert. (via CreativeAI) A frame by frame reconstruction of the first 10…

314_1_morpheus-1

Science: Wie Künstliche Intelligenzen die Menschheit zerstören könnten

Aus einem amüsanten Paper von Federico Pistono und Roman V. Yampolskiy von der Uni Louisville: Unethical Research: How to Create a Malevolent Artificial Intelligence (PDF).…

sleep

Trees sleep 🌳💤

Wissenschaftler haben zum ersten mal den Tag/Nacht-Rythmus von Bäumen in freier Natur untersucht und sind zum (jetzt nicht sonderlich überraschenden) Ergebnis gekommen: Trees go to…

eye

Sunspring: Shortfilm from Algorithmic Script

Ross Goodwin arbeitet mit Neural Networks und Storytelling und ließ für die „2016 Sci-Fi London 48 Hour Film Challenge“ einen Kurzfilm von einer auf SciFi-Drehbüchern…

kill

BAHFest 2016

„BAHFest is the Festival of Bad Ad Hoc Hypotheses, a celebration of well-researched, logically explained, and clearly wrong evolutionary theory.“ All 2016-Talks here, full playlist…

HYPER-REALITY_A5

Keiichi Matsudas Hyper Reality 3

Neuer Augmented Reality-Schnickschnack von Keiichi Matsuda. Den ersten (exakt genauso aussehenden) Clip hatte er vor sechs Jahren veröffentlicht, später crowdfinanzierte er dann eine Kurzfilmserie, das…

stones

Machine sorts Stones by Age

Schöne Arbeit von Prokop Bartoníček und Benjamin Maus, eine Maschine, die Kieselsteine aus der Iller (Nebenfluss der Donau) nach ihrem geologischen Alter sortiert: The machine…

robotcar

Google erfindet klebende Unfallopfer-Fänger für Roboter-Autos

You can't make this shit up: Google patent: Glue would stick pedestrian to self-driving car after collision. (via NewAesthetics) In a world with self-driving cars,…