Programmers are identifiable by Coding-Style

Gepostet vor 2 Jahren, 4 Monaten in #Misc #Science #Tech #Coding #Language

Share: Twitter Facebook Mail

Dass Menschen anhand ihres Schreibstils identifizierbar sind, ist nichts neues. Vor zwei Jahren gab's einen Vortrag auf dem 29C3 über Sprachabdrücke in Underground-Märkten im Darkweb (aka Silkroad u.ä.) Jetzt hat eine neue Studie festgestellt, dass dasselbe Prinzip für Coding gilt und sich da längst nicht nur auf wiederverwendete Funktionen bezieht.

Researchers […] have developed a “code stylometry,” which uses natural language processing and machine learning to determine the authors of source code based on coding style. Their findings, which were recently published in the paper “De-anonymizing Programmers via Code Stylometry,” could be applicable to a wide of range of situations where determining the true author of a piece of code is important. For example, it could be used to help identify the author of malicious source code and to help resolve plagiarism and copyright disputes.

The authors based their code stylometry on traditional style features, such as layout (e.g., whitespace) and lexical attributes (e.g., counts of various types of tokens). Their real innovation, though, was in developing what they call “abstract syntax trees” which are similar to parse tree for sentences, and are derived from language-specific syntax and keywords. These trees capture a syntactic feature set which, the authors wrote, “was created to capture properties of coding style that are completely independent from writing style.”

IT World: CSI Computer Science: Your coding style can give you away (via /.)

Gun-Emoji Pairings 🔫😶

Interesting analysis of the Gun-Emoji-Pairings: „What does the Gun shoot at?“ and „Who pulls the Trigger?“

The Power of Language

„In this reel, we explore the incredible power of language—written, spoken and performed. First, meet the creator of Game of…

Very Bad Volume Control Interfaces

Vor einer Woche postete Redditor Jacobone dieses Interface für Lautstärkeregelung von irgendeiner Win-App. Then this happened: r/ProgrammerHumor/search?q=volume&restrict_sr=on. Because ofcourse it…

Anthony Burgess lost Dictionary of Slang discovered

Die International Anthony Burgess Foundation in Manchester hat neulich das verlorene Slang-Wörterbuch von Anthony Burgess im Keller gefunden („at the…

Neural Network Genesis Alpha

Douglas Summers hat das erste Buch Genesis der Bibel mit Neural Network Voodoo in Worte übersetzt, die allesamt mit dem…

Podcasts: Sid Vicious, Baudrillards Simulacra, das Wörterbuch der Unruhe und das Märchen vom unglaublichen Super-Kim aus Pjöngjang

Jede Menge Podcasts und Hörspiele, die ich in den letzten Wochen gehört habe, unter anderem ein Hörspiel um einen mutierenden…

Urban Dictionary Anagrams, ranked

Sean Carney hat die Anagramme aus dem Urban Dictionary ermittelt und mit einem Algorithmus sortiert: How to Find Anagrams on…

Social Media based Substance Use Detection

Shit, they got me. (I think they follow me on Twitter, too. Damn. [Not really.]) Table 6 is hilarious: In…

15000yrs old ultraconserved Words from the Stone-Age found in present Languages

[update] Der verlinkte Artikel ist vier Jahre (hatte ich nicht gesehen), hier eine ausführliche Kritik im Languagelog: „The authors intend…

Do not pet a Snip Snap Doggo

I find this funnier than I should: this is the only video i need pic.twitter.com/uxN7AIc2X2 — Dank Memes 💎💎💎 (@FreeMemesKids)…

Zalgo Droplet

A Javascript-Droplet „to invoke the hive-mind representing chaos. Invoking the feeling of chaos. With out order. The Nezperdian hive-mind of…