レポートのコピー・ペーストを探すサービス

マイスターです。

大学のレポートや卒業論文などで横行していると思われるのが、「webサイトからの丸写し」。
ネットで検索をして見つけた文章を適当にコピー・ペーストしてつなげ、レポートに仕上げるというものです。

おそらくインターネットが登場するずっと前から、どこかの書籍の一部分を丸写ししたようなレポートを提出する学生は大勢いたでしょう。インターネットによってアクセスできる情報量が爆発的に増え、検索&収集もとても簡単になり、文章の丸写しも手間なく行えるようになった結果、そのようなより安易な丸写しが増えた、ということなのかなと思います。
(それに昔は学生が参照できる情報ソースが限られていましたから、教員の方にとっても見抜きやすかったと思いますが、今、一人の教員がネット上の情報すべてに目を通すのは極めて困難ですよね)

大学生や高校生の皆様のために一応お断りしておきますと、情報をコピー・ペーストするという行為そのものには、罪はありません。
ただその際は、出典をきちんと表記し、どこからどこまでが引用部分であるかということを明示する必要があります。そうでなく、他人の文章を勝手に丸写しし、それをあたかも自分が書いたかのように振る舞うのが問題なのです。
また、ほとんど全部が引用、なんてのもダメです。あくまでも自分で考え自分で論じるのが大学のレポートや論文。引用は、学術的なルール・マナーとして許される範囲に留めるべきです。

というわけで、楽をしたり、手を抜いたりするためにこっそりと行うコピー・ペーストは、いけません。
しかし実際には、大学でもこっそりコピー・ペーストした文章を、自分が書いたように見せかけてレポートを仕上げ、単位を得ようとする学生はいます。
受講生の人数が増えていくと、教員側もすべてを見抜くのは難しくなってきます。

そこで、こんなサービスが登場するわけです。

【今日の大学関連ニュース】
■「コピペしたリポート、ばれちゃうぞ 検出ソフト開発」(Asahi.com)

インターネット上の公開情報を引き写しただけの「コピー・アンド・ペースト(コピペ)」でないかをチェックするパソコンソフトを、金沢工業大学教授が開発した。コピペは学生のリポートなどで横行しているとされ、先生らには朗報になりそうだ。
金沢工大知的財産科学研究センター長の杉光一成教授が今年2月に特許出願した。来年にも市販する予定という。
電子データで提出された文章をソフトに入力すると、翻訳ソフトに使われている「形態素解析」という技術で、文章を文節や単語に分解。それぞれの文節や単語をネット検索し、類似した文章がネット上で見つかれば、URLを表示して知らせる。複数のリポートを比べて、学生同士が写し合っていないかチェックすることもできる。
(略)杉光さんは「先生が不正を見抜く技術を持てば、学生には大きな抑止力になるはず。安易にコピペできなくなれば自分で文章を考えるから、学生のためにもなる」といっている。
(上記記事より)

市販したら、売れそうです。

もしかしたら、大学以上に、中学・高校でのコピペが深刻かもしれません。
中高で安易な丸写しに慣れた学生が、大学のレポートを軽く見る、という流れもあるような気がします。
ぜひ、中学や高校でも導入できるくらいの価格設定にしていただければと思います。

ところで、海外でも丸写しによるレポートは深刻な問題になっているらしく、こういったソフトやサービスの開発に関しても、海外の企業が先行しています。

■「佐藤渡辺通信 No.42 査察ロボット・盗作発見」(株式会社佐藤渡辺)

昨年8月頃から、TurnitinBotというロボットが来るようになりました。たまに来て、数百ページを持っていきます。
(略)さて、この TurnitinBotですが、ある日500以上のファイルを持っていったので、一体、誰のロボットだろうと、調べてみました。会社名は Turnitin.comということになっていて、一般消費者向けの会社ではありません。何をしているかというと、大学の学生が書いた論文、レポートの類がネットから探してきた資料の丸コピーでないか、チェックする会社で、世界中の大学の先生などが、顧客になっていて、学生のレポートをこの Turnitin.comに調べてもらうと、それは、ネットの中のこのページのコピーである、とかを査察して、それで商売をしているわけです
(上記記事より)

ここで言う「ロボット」とは、世の中のwebサイトを調査し、検索エンジンの検索結果などに反映させるプログラムの一種のことを指します。
Turnitin.comを運営しているのは、どうやらiParadigmsという企業のようです。この企業が、こうしたロボットプログラムを放って世界中のwebサイトの情報を精査し、独自のデータベースを構築しているのですね。
上記のページは2003年4月に書かれたものですので、少なくとも5年前には、このサービスが商用化されていたことになります。

(このロボットの詳細はこちら)
■「TurnitinBot General Information Page」(iParadigms, LLC)

何のためにそんなことをしているかと言えば、大学向けに、剽窃探知サービスを売るためです。
具体的には↓このような感じ。

……カルフォルニア大学バークレイ校でシステム開発の教義を取っていたジョン・ベアリー氏がそこでデータベースプログラムを完成させる。構内にあるコンピュータルームより、どこからダウンロードし、カット&ペーストを行ったという記録を抽出し、レポート内の何処から何処までの部分がどのようなサイトから、ダウンロードされ、カット&ペーストされた部分なのかがわかるというものだ。
それが turnitin.com
turnitin.comで彼らのレポートをスキャンさせると、なんとカット&ペーストした部分が赤色で表示される。その赤色で表示された部分は、彼らが独自に考え出した文献ではなく、様々なサイトから、カット&ペーストされたものだというのがばれてしまうのである。
さらに、そこから、解析ツールがあり、その画面では画面左部分に生徒のレポート内のカット&ペーストそして、右部分にその文献がどのサイトから引っ張ってきたものなのかが解析され、アドレスが引っ張り出される。
turnitin.comでスキャンされるレポートの数はなんと、1日に5万件らしい。
(「cell-phone, i-paq and turnitin.com」(lah-di-dah)より)

この記事は2004年5月に書かれたもののようですから、現在はおそらく、1日5万件じゃきかないでしょう。

■「Turn it in:Plagiarism Prevention」(iParadigms, LLC)

↑iParadigms社による宣伝ページがありますから、ご興味のある教員の皆様はどうぞ。「Sample Report」をクリックすると、サンプルイメージが出てきますが、確かに良くできているようです。
途中に他のワードがいくつか挟まっていても、類似点を見つけてくれるみたいですね。
(きっと上記の2004年当時から、また進化しているんでしょうね……)

Every paper submitted is returned in the form of a customized Originality Report. Results are based on exhaustive searches of billions of pages from both current and archived instances of the internet, millions of student papers previously submitted to Turnitin, and commercial databases of journal articles and periodicals.
(上記ページより)

……とありますので、どうやらこちらはwebページだけでなく、様々な商用データベースや、集まってくる学生レポート同士での比較も行える模様。
最近では日本でも海外でも、「レポート代行サービス」と呼ばれる、レポートの代筆ビジネスが広がっていますので、こういった比較も大事なのかも知れません。

代筆行も商売なら、それを見破るのも商売。
双方がより精度を上げるように進化を続けていて、完全にいたちごっこです。

冒頭でご紹介した、今回の杉光教授の製品を始め、日本でもこれからこの種のビジネスが発達していくのでしょうね。
本来ならこういった製品を使わなくても済む状態が理想ですが、現状ではやはり必要だと思います。
こういったサービスを使いながら、著作権や学術行為の価値について考えさせる教育ができれば良いのですが。

以上、マイスターでした。

<関連記事>
■米コピペ検出サービス最大手、日本語サービス開始

※この記事は、現役高校生のための予備校「早稲田塾」在籍当時、早稲田塾webサイト上に掲載したものです。

1 個のコメント

  • こうしたソフトがなくても、コピペレポートは、Googleを上手く使えば発見できるように思います(私個人としては100%摘発できている自信があります)。Googleでコピペを調べることと比較して、このソフトのどこが優れているのか、そうしたより突っ込んだ報道が欲しいですね。優れていれば、私も買います。