Prev / Next / たまにっき。

Authorship Analysis: Identifying The Author of a Program

Category: [研究]
2003-08-07

読んでみた。

読んで一番気になったことは Authorship analysis と plagiarism detection の違いだ。

この論文で提案されている metrics は Grover([2003-07-31-2])の言う birthmark
そのものであるが、Plagiarism Detection(盗用発見) ではなく、著作証明のように使っている。

この Plagiarism Detection と Authorship Analysis は本質的に違うものだ。
Plagiarism Detection の場合、同じ作者が作っていようが、作っていまいが、
プログラム自体が盗用されたものかどうかを判断する。
対して、Authorship Analysis は盗用であろうがなかろうが、同じ作者であるかどうかを判定する。

そのため、Authorship Analysis の場合はソフトウェアが同じ種類のものでなくても
同じ作者であると判断しなければならない。
逆に Plagiarism Detection の場合は同じ種類のソフトウェアが
盗用されたものかどうかを判定しなければならない。

そのため plagiarism detection はオリジナルのプログラムとの比較で比較するために
プログラムの冗長な箇所は除いて比較したい。
逆に authorship analysis は plagiarism detection では削除した、
プログラムの冗長な箇所にこそ、人のクセなどが残っていると考えられるため、
その冗長な部分はそのままで比較したい。

例えば、コメントの書き方は人によって色々とあるだろうから、authorship analysis に使える。
しかし、コメントは非常に書き換えるのが楽だ。書き換えるのも面倒ならば削除すれば良い。
このことから plagiarism detection には使えない。

まぁ、authorship analysis のイメージとしては、誰が書いたプログラムかわからない場合に
誰が書いたのかを特定するというものだろう。盗用に関しては authorship analysis の適用範囲外だ。

目的のための手段が同じようなものだけに混乱されそうだ。

Ivan Krsul, "Authorship Analysis: Identifying The Author of a
Program, " Technical Report CSD-TR-94-030, Computer Science
Deparment, Purdue University, 1994

Category: [研究]