東芝と慶応義塾大学は7月15日、慶応義塾大学矢上キャンパスで、オンライン授業向け字幕システム「ToScLive(トゥースクライブ)」を活用した実証実験を報道向けに公開した。
東芝が開発した同システムは、AI技術でオンライン授業の講師の音声をリアルタイムで字幕化し、学生に配信する音声自動字幕システム。さまざまなオンライン会議システムと併用でき、生徒側は新たにアプリケーションをダウンロードすることなく、スマートフォンやパソコンを利用してWebブラウザで音声を受信できる。
同大学では、2020年6月30日より同システムを実証導入しており、今後80人程度が受講するオンライン授業で活用する予定だという。
慶応義塾大学理工学部電気情報工学科教授の青木義満氏は、「新型コロナウイルスの影響により、慶応義塾大学では春学期が終わるまでオンライン型の授業形式をとる予定。現在は、事前に録画した授業をアーカイブして配信するオンデマンド型で行っている。ToScLiveを導入することで、講義での聞き逃しをテキストベースで把握することが可能になることや、聴覚障がいをもっている学生に対しても有効に活用できると考えた」と、導入の背景を語った。
また青木氏は、「90分もある授業映像をずっと見続けるのは困難」という学生の声を受け、30分の動画を3回に分けて配信を行い、今後は授業の進行具合が分かる目次スライドも動画の中に組み込む予定だという。
同大学はオンデマンドの配信しか行っていないが、今回の報道向け実証では、リアルタイムで学生とつながるライブ形式でのオンライン授業をデモンストレーションした。
以下、同システムの主要な機能を紹介する。まず、同システムには、オンライン授業での音声トラブルを事前に防ぐため、マイクの接続状況や音声を確認できる機能がある。
また、講義資料などのテキストデータから専門用語を自動抽出することもできる。足りない単語は手入力で追加できる。
青木氏は「私の講義では理工系の技術系専門用語を多く使うため、従来の音声認識システムでは、音として認識できても単語として変換されなかった。ToScLiveでは専門用語も自動で抽出されるため、授業の準備にかかる時間を削減できる。キーワードを正しく認識できることによって、キーワード前後の音声認識の精度も向上している」と説明した。
また、登録した専門用語は辞書として保存することが可能で、講義によって辞書を使い分けることもできるという。
さらに、「ええと」「あのー」などのフィラーや「きょ、今日は」などの言いよどみを検知し、字幕上で薄く表示する機能も備わっている。これにより字幕表示の可読性が保たれる。
今回のデモンストレーションに参加した、中国からの留学生で学部4回生の女子学生は、同システムを導入したオンライン授業について以下のように感想を述べた。
「留学生である私にとって、授業中は日本語のわからない単語が多く、何度聞き直しても音声だけでは単語のスペリングがわからないことがあります。ToScLiveで字幕が導入されたことによって、単語を簡単に調べられるようになりました」
留学生ではない学生も「講義内容を聞き逃したり、講義スライドに表示されていなかったりする内容を文字として確認できるようになったため、効率的に復習を行えるようになりました」と、講義の質が向上したと話していた。
一方で、「オンライン授業の画面とToScLiveの画面が同一になれば、より効率的な講義になると思います」という学生の意見もあった。同システムは現在、さまざまな動画配信サービスと併用できるように、同一画面にするためのシステムの組み込みは行っていないが、同社は要望により検討していく次第だという。
東芝研究開発センターメディアAIラボラトリー研究主務の岩田憲治氏は「オンライン授業だけでなく、オンラインによるセミナーや会見や、オンライン・オフラインにかかわらず、聴覚障がい者の支援としてToScLiveを活用できると考えている」と述べた。実際、東芝社内の聴覚障がい者が会議に参加する時などにToScLiveを活用しているという。
同社は今後、慶応義塾大学大学以外にも法政大学をはじめとした5つの大学で順次、ToScLiveの導入実証実験をしていく方針で、2022年までのサービス事業化を目指しているとのことだ。