米OpenAIが注目している英会話アプリがある。AI技術を駆使した「Speak(スピーク)」だ。
2018年の韓国でのサービス提供を皮切りに、台湾や南米諸国、ヨーロッパ諸国など40カ国でサービスを展開している。2023年に韓国と同様の英語学習課題を持つ日本で2カ国目となるサービス提供が開始された。累計ダウンロード数は世界で1000万を超える。
「ChatGPT」を開発するOpenAIは、スピークのポテンシャルを評価し、同社が運営する投資ファンド「OpenAI Startup Fund」を通じて出資している。スピークは、米Khosla Venturesや米Y Combinatorの共同創業者であるポール・グレアム氏などからも資金を調達しており、これまでの出資総額は8400万ドル(約132億円)に達した(2024年6月時点)。
OpenAIとの連携により、同社の最新AIモデルを活用して新しい体験を実現しているスピーク。2024年10月には最新AIモデル「GPT-4o」を活用し、自然な対話で英会話を学習できる機能を搭載した。
スピークは他の英会話アプリと何が違うのか。また、AIを活用した英会話学習では、どのような体験が実現されるのか。スピークの開発・提供を手掛ける米Speakeasy Labs 創業者 兼 CEOのコナー・ズウィック氏と、共同創業者 兼 CTOのアンドリュー・スー氏の2人に直撃した。
CEO「競合アプリは意識していない」
--スピークのサービスの強みを教えてください。ほかの英会話アプリとの違いを教えてください。
ズウィックCEO:他の英会話アプリとの最大の違いは、ユーザーが英語を自由に、そして流ちょうに話せるような仕様にこだわっていること。英文法や語彙を教えるのではなく、英語での最適なコミュニケーション方法を提供しています。ですので、競合アプリのことはそれほど意識していません。
また、AIを活用することで、あたかも本当の人間と会話しているかのような設計にしていることも特徴の一つです。例えば、英会話の初心者には発音に強い癖がありますが、AIはそれを理解して訂正し、滑らかな会話を作り上げることができます。まさに家庭教師のような存在です。
ユーザーの英会話レベルや使用目的によって、AIが最適な言い回しを提案します。ユーザーの学習経験を蓄積し、個別最適な学習を提供できる点もスピークの強みです。
--OpneAIの最新AIモデルを活用することで、どのような体験を実現していますか。
スーCTO:スピークの音声認識や学習プロンプトには、OpenAIのGPT技術が搭載されています。
直近では、OpenAIの代表的なAIモデル「GPT-4o」を活用したリアルタイム音声対話機能を開発し、今年中に全ユーザーへの実装を予定しています。GPT-4oの導入により、今まで以上に自然な英会話を提供できるようになるでしょう。
従来のモデルでは、ユーザーが発話した言葉をAIが認識して処理し、応答する必要があったため、リアルタイムでの会話は難しいという課題がありました。しかし、GPT-4oによって、音声から音声への直接的な変換を活用することにより、会話のタイムラグを劇的に削減することに成功しています。
また、ユーザーの話し方のトーンや発音、繊細なニュアンスを今まで以上に理解できるようになったため、本物の先生と対話しているような体験が実現されます。
ようやく私たちの理想のレベルに達してきたなと感じています。
最適なAIモデルを選択していく
--推論型のモデル「OpenAI o1」との相性はどうでしょう。もし実装されたとすれば、どのような体験が実現されるのでしょうか。
ズウィックCEO:o1は、スピークの可能性を広げてくれるAIモデルだと捉えています。
例えば、ユーザーごとに適した英会話の学習プランを、今まで以上に正確にプランニングできるようになるでしょう。
また、高度な思考を持ったAIによって「このユーザーはなぜ、この問題を間違ったのか」といったことを的確に導き出せるようになる。極めて高いレベルの英会話学習が実現されるでしょう。
直近で実装する予定はありませんが、長期的な視点で大いに活用できるものだと期待しています。OpenAIのサム・アルトマンCEOとは時折交流しており、教育分野におけるAIの可能性について議論しています。
--OpenAIだけでなく、Googleの「Gemini」やMetaの「Llama」といった他の企業のAIモデルの活用は考えていますか。
スーCTO:実はOpenAIだけでなく、さまざまなAIモデルをすでに活用しています。
我々の一番の目的は、ユーザー自身が最適な道のりで英会話学習することをサポートすること。その目的を実現するために、非常にオープンな姿勢で技術開発に取り組んでいます。
OpenAIに限らず、今後より最適なモデルが出てくればそれを使っていく考えです。もちろん自社でもAIを開発しているので、総合的に考えて適した技術を採用していきます。まだまだ開発の余地はあります。
なぜ日本市場に参入したのか
--サービス提供に関して、なぜ韓国の次に日本を選んだのでしょうか。
ズウィックCEO:日本と韓国には共通した英語学習課題があると感じています。
それは、英語を学びたいという強い意志を持った人が多くいるにも関わらず、実践機会が少ないこと。
韓国人も日本人も、長い年月をかけて英語を学んでいるため、語彙や文法を正しく理解している人が多いです。アメリカ人より正しい文法を理解している人も少なくありません。
ただ、実践機会が少ないために、英語を話すことに自信が持てない人が多い。自主的に発話をせず、発音の間違いを怖がっている人が多いという印象を受けました。
一方で、日本人はAIに対する抵抗感が小さいと感じています。生成AIといった最新の技術に対して強い興味を示す人が多いということも日本に進出した理由の一つです。
--日本市場における今後の目標を教えてください。
ズウィックCEO:まずはスピークの存在をより多くの人に認知してもらいたいです。私たちのサービスが英会話の学習に最適な手法であるということを多くの人に知ってもらいたい。ブランドの認知度向上が大きな目標の一つです。
また、スピークは大人だけを対象にしたサービスではありません。子どもを対象にしたサービスの提供も検討しています。また個人だけでなく、教育機関や企業をターゲットにしたサービス開発もしてきたいと考えています。
英会話スキルの習得は絶対に可能なものです。スピークの認知度を高め、英会話を学びたいという多くの方の挑戦を後押しする。そのためには、実現しなければいけないことがまだまだたくさんあります。英語への抵抗感をなくし、自信を持って勉強できるようなツールを作れるように、今後も改良を重ねていきます。