Nerdcore per Mail

RSS Feed About Archive NC-Sources Impressum Datenschutz

Programmers are identifiable by Coding-Style

Gepostet vor 1 Jahr, 5 Monaten in Science Tech Und so. Coding Language

Dass Menschen anhand ihres Schreibstils identifizierbar sind, ist nichts neues. Vor zwei Jahren gab's einen Vortrag auf dem 29C3 über Sprachabdrücke in Underground-Märkten im Darkweb (aka Silkroad u.ä.) Jetzt hat eine neue Studie festgestellt, dass dasselbe Prinzip für Coding gilt und sich da längst nicht nur auf wiederverwendete Funktionen bezieht.

Researchers […] have developed a “code stylometry,” which uses natural language processing and machine learning to determine the authors of source code based on coding style. Their findings, which were recently published in the paper “De-anonymizing Programmers via Code Stylometry,” could be applicable to a wide of range of situations where determining the true author of a piece of code is important. For example, it could be used to help identify the author of malicious source code and to help resolve plagiarism and copyright disputes.

The authors based their code stylometry on traditional style features, such as layout (e.g., whitespace) and lexical attributes (e.g., counts of various types of tokens). Their real innovation, though, was in developing what they call “abstract syntax trees” which are similar to parse tree for sentences, and are derived from language-specific syntax and keywords. These trees capture a syntactic feature set which, the authors wrote, “was created to capture properties of coding style that are completely independent from writing style.”

IT World: CSI Computer Science: Your coding style can give you away (via /.)

More: Coding Language

kata0

Katamari Damacy Text-Adventure

Eine Text-Adventure-Version des japanischen Weirdogame-Klassikers Katamari Damacy, Download auf Github, spielbar als Python-Dings per Kommandozeile. Ist so ziemlich genau so gleichzeitig dämlich und großartig, wie…

frump

Scottish Trump-Insults, ranked

Drumpf today tweeted „Just arrived in Scotland. Place is going wild over the vote.“ Ofcourse, Scotland voted to stay in the EU and because they…

cit

Generative Cities in your Browser

ViziCities, eine JavaScript-Framework für Stadt-Visualisierungen im Browser. Frisst CPU-Ressourcen wie Sau, macht aber Spaß. (via Algoritmic)

wave

Liquid Dynamics Simulator in your browser

Nettes Browsertoy von David Dotli.

dot

.🔫

Psychologen am Harpur College haben vor ein paar Monaten festgestellt, dass der Punkt (this guy „.“) Postings und Messages unglaubwürdiger macht, anscheinend übernimmt der Punkt…

Another (TED)-Talk about nothing.

Another (TED)-Talk about nothing.

Pat Kelly macht das gleiche wie Will Stephen vor ein paar Wochen: Beide halten Vorträge über Vorträge und wie man rein mit Körpersprache, Betonung und…

doener

Döner-Emoji kommt! 🙌

Vor ein paar Monaten setzte das Unicode Consortium den Döner auf seine Liste von möglichen Emoji-Kandidaten für den nächsten Unicode Release. Jetzt haben sie entschieden…

A.I. figures out Prison-Language

Eine Künstliche Intelligenz hat ein Knast-Codewort erkannt. In US-Gefängnissen werden alle Telefonate aufgezeichnet und nun haben sie einen Machine Learning-Algorithmus auf diesen Datenberg angesetzt. Interessanterweise…

Bildschirmfoto 2016-05-30 um 18.00.00

Emoji Bible 😇

Jemand namens 😎 twittert seit ein paar Wochen die Bibel in einer Emoji-Version. Gibt's jetzt auch als iBible. In the beginning God created the heaven…

sort

Sorting Algorithm Animations

Hübsche Sorting-Visualisierung: „These pages show 8 different sorting algorithms on 4 different initial conditions.“ Natürlich nach wie vor unschlagbar in seiner Visualisierungs-Technique: Explaining Sort-Algorithms with…

invisible

Invisible Programming Language

Well played: „I've decided to dial up the crazy a notch and make a completely invisible programming language! I named it Anguish and, based on…