TOP > ネタ・話題 > 精度95%以上! ソースコードは指紋、作者はほぼ特定できる | ギズモード・ジャパン

精度95%以上! ソースコードは指紋、作者はほぼ特定できる | ギズモード・ジャパン

ほぼドンピシャでバレバレです。 スペースやタブ、大文字やアンダーバーを組み合わせた命名規則、コメント…コードの書き方には、人によってスタイルがありますよね。それはもう指紋のようなもので、それさえ見えれば、誰がコードを書いたかほとんどわかってしまう…そんな驚きの研究結果が発表されました。 米ドレクセル大学、メリーランド大学、プリンストン大学、独ゲッティンゲン大学の共同チームの研究によると、自然言...

ツイッターのコメント(106)

この話を思い出しました。特定が可能って事は、結局はユニークにならざるを得ないのだろうなって。
@stdaux ソースコードにDNAは無いですが、書かれたソースコードで特定することは可能なようです
a,b,c,d,e,... みたいな変数を作りつつもプログラムを走らせることができる友人は数行見ればわかる
某漫画で「コードから童貞臭がする」という表現があったが、あながち間違いじゃないのかもなぁ
機械学習を使えばソースコードから作者はほぼ特定できるらしい?
書いた時期によって、同じ人でも書き方が違うくらいだからなぁ ───  ソースコードは指紋、作者はほぼ特定できる|ギズモード・ジャパン
ほへー95%でプログラマ当てれるとかそんなにコードに違いでるんか
GCJで提出されたソースコードがデータとして利用されている。「競技プログラミングは(ある意味で)役に立つ」の例だ
去年の記事だけどおもしろい。
ソースコードは指紋、作者はほぼ特定できる|ギズモード・ジャパン
王様たちのヴァイキングのCODE RADERだ
興味深いなああ
標準規約とか、オールインワンの開発環境がばら蒔かれたら、どうするんだろう( ´△`)
なるほど。これで犯人探しが捗りますね。 /
あーわかるw / “ : ギズモード・ジャパン”
お習字を始めよう✋
【精度95%以上!ソースコードは指紋、作者はほぼ特定できる】  難読化しない限りは、多分クセ出るよねぇ。自慢じゃ無いですが私のソースなんか超汚いんで、すぐ分かると思います。
OJT一ヶ月目位で既に「ソースコードに癖が出てきましたね。他の人の良いいコードを読んで読みやすく保守性の高いコードを勉強しましょう」って言われた俺氏が通りますよっと
三( ゜∀゜)
"@gizmodojapan:
組織によっては、記法やプレフィックス、インデントや{}の位置まで決まっているから特定は難しい気がしますが‥本当かな
"@gizmodojapan:
ほぼドンピシャでバレバレです。 "
作業跡
ああ、抽象構文木に特徴が出るのか、面白いなコレ
ほほぅ…。><
これすごいな....
@gizmodojapan Golangとかはインデントとか強制する部分が多いから、C言語ほどではないよなぁ。気持ち悪いソースってあるんだよね
自然言語処理と機械学習によるコード分析により、95%の精度で作者は特定できる
-
難読化だけでなく、コードの匿名化技術も必要か?
そう言われるとそんな気もしてきたw /
マジでか / 精度95%以上
ソースコードの怖いところは、その人の人生や生き方さえ透けて見えるところ >
確かに、コードの書き方って性格でるなとは思っていました。
ソースじゃなくてエクセルの資料とかでも結構わかるよね。
めっちゃ分かりやすい人いそう
ハッカーがソース出すとでも思ってるの? /
確かに自分の書いたコードは見たらすぐ分かる。ただ、命名はその時の流行りで変わったりするけど。▼
わかる気がする…▽
これはよく分かるわ。私のコードなんかすぐ特定されるんだろうなぁ:
つまり、あっちこっちからサンプルコードをコピペしたスパゲティだと特定できないわけですね?//
どうやってソースコード手に入れるのさ。実行可能プログラムからコメントやインデント割り出せないだろ。
他人のReSharper調教済ファイルがあれば・・
同じチーム内とかだとどうなんだろう|
これで捕まる人とか仮に出たら、コードの意味を変えずに癖だけをごまかすようなツールとかで対応されそう。/
コメントの入れ方とかは特徴出るね。
人間の知能が及ばない因果を人工知能が解きほぐす。 / 他77コメント “ : ギズモード・ジャパン”
もっと見る (残り約56件)
 

いま話題のニュース

PR