独自の学術データベースを活用し論文の類似性チェックを可能とするTurnitin

日々の研究成果をまとめた論文や大学生たちの授業を踏まえたレポート。インターネットでさまざまな情報を手軽に確認でき、コピー&ペースト(コピペ)も容易に行える現代においては、大学や研究機関も、そうしたコピペをはじめとする剽窃や盗用に対する研究者や学生への啓発などを行っているものの、意図しなかった剽窃とされることなどもあり、そうしたものも含め、剽窃かどうかを検出、判別するための技術活用が進みつつある。

Turnitin(ターンイットイン)は、1998年にカリフォルニア大学バークレー校(UCバークレー)の学生4人が創業した企業で、自分たちの成果物のピュアレビューに向けてライティングを向上させるために開発したツールを起源に、文章の類似性をチェックするツールなどを開発して成長してきた。

現在、世界185か国で約1万6000の大学や研究機関、企業、高校などと契約。約5400万人の学生や研究者が活用しているという。

日本には2020年に法人が設立され、これまでに200を超す大学や研究機関で活用されてきた実績を有している。実際に「Turnitin」で検索を行えば、いくつかの大学で利用方法やどういったツールであるかを学生に説明するページが出てくる。

同社が提供する主なソリューションは「Feedback Studio」「Turnitin Originality」「Gradescope」「Turnitin Similarity」「iThenticate(アイセンティケイト)」の5つ。このうち、日本ではiThenticateとFeedback Studioが主に提供されている。これらのツールは、それぞれ12か月のサブスクリプションという形で研究機関や大学ごとに契約。必要数に応じたアカウント数をパッケージとして提供するというビジネスモデルを採用している。

  • Turnitinの提供する各種ツールの概要

    Turnitinの提供する各種ツールの概要 (提供:Turnitin。以下すべてのスライド同様)

同社の最大の強みは、学術雑誌(世界のトップ1万誌の97%をカバーしているとする)や学術出版社の出版物、インターネットのWebサイトなどのインデックス情報を独自に収集した学術データベース(25年前から情報収集を進め、現在までに540億のWebページ、2億4400万の出版物、24億の学生レポート、そして6億以上の日本語のコンテンツを収蔵している)を有している点。iThenticateもFeedback Studioも、このデータベースを活用する点には違いはないが、iThenticateは主に、研究者や学術誌の出版側などが、論文発表の前に既存の出版物と類似性がないかを確認することをメインに、意図しない剽窃がないかなどをチェックすることを目的としたツール。一方のFeedback Studioは、大学などの教育機関に所属する学生(学部生)と指導する教員に向けたもので、教員による学生へのレポート指導、学生同士の剽窃の防止などを目的としたツールとなっている。

  • Turnitinの最大の強みとなる独自データベース

    Turnitinの最大の強みとなる独自データベース。日本のオンラインプラットフォーム「J-STAGE」掲載データのインデックスなども収録されているという

いずれもデータベースを活用した類似性のチェックは可能で、どこの文章がどの程度の類似性であるかをパーセンテージで表示するとともに、もととなったソースを一覧として表示する機能を有しているが、Feedback Studioでは、レポートに対する教官による採点やフィードバック機能が搭載されており、学生へのフィードバックによく使う定型コメントを設定したり、基準を明確に記した評価表(ルーブリック)に基づく採点などといった指導する側に役立つ機能も各種搭載されているという。

  • Feedback Studio

    Feedback Studioの特長。その名の通り、学生に評価をフィードバックすることに主眼が置かれたツールとなっている

  • レポートの類似性チェック機能
  • レポートの類似性チェック機能
  • レポートの類似性チェック機能
  • レポートの類似性チェック機能のほか、教員が学生にフィードバックを行う際に役立つ各種ツールなども提供されている

こうしたデータベースの活用と学生へのフィードバックを含めた機能について、同社の日本法人Turnitin JapanでNE Asia Area Directorを務める松永ベッツィ氏は「ライティングスキルを向上させるため」と説明する。

  • Turnitin JapanでNE Asia Area Directorを務める松永ベッツィ氏

    Turnitin JapanでNE Asia Area Directorを務める松永ベッツィ氏

AIの活用でレポートの類似性などをチェック

同社は、近年の生成AIの急速な技術発展を踏まえ、AI時代におけるツールの活用に向けた取り組みも推進してきている。同氏も「AIを使うことが必須の時代になる中、教室の中でもAIを教えるようになる。そうした時代において、正しい使い方を教えないといけないのと同時に悪用のリスクも教える必要がある。AIに丸投げして論文やレポートを書いてもらったり、宿題をコピペしてもらったりという行為は本質的な学習にならない。結果として自身の想像力や思考力を失う危険性が生じ、将来、大学を卒業した後、就職しても仕事ができない人間になるという懸念もでてくる」とAIの活用に対する期待と、AIに頼りすぎた場合の問題点を指摘。大学に提出する成果物がAIが書いたものなのか、学生が実際に書いたものなのかの見極めを行うための「AIディテクションツール」の活用を講師に推奨しているとする。

例えばAIインディケーターと呼ぶ機能は、類似性レポート上でAIが生成したと思われる文書の全体的な割合を、類似性のスコアとは別に表示することを可能としたもの。また、この指数はAIで生成されたと想定されるテキストのセグメントがハイライト表示される「AIライティングレポート」にリンクして、指導教官などはそれをチェックすることができるようになっている(学生側には表示されない)

  • AIインディケーター

    AIインディケーターにより、AIで生成されたと思われる文章の割合を確認することができるようになる

ただし、「AIディテクションによってスコアが付いていても、悪用したとすぐに決めつけることはできない」(同)とする。あくまで学生と指導者の対話のきっかけとするもので、対話の中で当該セクションについての説明を学生にしてもらうなど、より深いコミュニケーションを推進する役割を意図したものだとする。

  • AIライティングレポート

    AIインディケーターと連携するAIライティングレポート。あくまでAIで生成されたと思われる個所へのハイライトであり、指導者と学生のコミュニケーションを通じて実際にAIを活用したのかどうかの判断などを行ってもらいたいとしている

  • 類似性スコアとAIインディケーターのスコアの違い

    類似性スコアとAIインディケーターのスコアの違い。類似性はデータベース上の論文などとの一致割合、AIインディケーターはAIによる生成部分の割合となる

執筆過程もAIで理解

さらなるAIの活用に向けて同社は米国では2025年3月4日に、日本でも7月16日付でAIの責任ある活用を支援するために設計された専用ライティングソリューション「Turnitin Clarity(ターンイットイン・クラリティ)」の提供を発表している。

  • Turnitin Clarity

    Turnitin Clarityの概要

このツールで提供されるのは主に以下の4つの機能。

  1. ガイド付きAIライティングアシスタント
  2. 執筆プロセスの透明性と洞察
  3. 統合されたアカデミック・インテグリティソリューション
  4. 迅速かつパーソナライズされたフィードバック

具体的に言うと、いつどこで編集をしたり、削除や修正をしたのか、コピペをしたのか、どのくらい作業に時間をかけたのか、といったライティングプロセスをビデオのように見ることを可能とするもので、例えば類似性やAIライティングスコアと並んで短時間で書いたために注意が必要といったコメントや、あまり編集が行われていないために注意といったコメントなどが表示され、指導者側が学生のライティング過程を素早く理解することを可能にするという。

  • Turnitin Clarity

    Turnitin Clarityの活用イメージ

さらにAIによるフィードバックについてもAIアシストが入るとのことで、責任のある生成AIの使い方として、質問をすると、必要に応じた項目に対するヒントを提示してくれたりするようになるという。例えばイントロダクションの作り方を教えてくれたりするようになるが、全部代わりに書いてもらいたいと伝えたとしても、それは断られ、こういった書き方ではどうか? といったフィードバックが返ってくることになるという。

こうした生成AIとのやり取り、プロンプトも記録されて指導者側が確認できるとのことで、同氏も「教える側も生成AIの使い方を理解しないといけない。論文の書き方や考え方も変わってくる可能性があるし、嘘の参考文献なども出てくる可能性がある」とAIの活用でレポートや論文の書き方そのものが変わってくる可能性を指摘する。

剽窃・盗用を行った場合、研究者が論文不正を働いたことが判明すれば、その後の評価は言わずもがなであるし、学生のレポートであっても大学によってはカンニングと同じ扱いをされる場合もある。海外の大学では、剽窃をしたことで退学が命じられることもあるという。Turnitinでは、そうした剽窃を減らし、自分で考えてレポートや論文の作成ができるように支援していくことを目指したツールの拡充や機能強化を図っていくことで、日本に限らず、世界の教育の質の向上につなげていきたいとしている。