トヨタ自動車は11月10日、「TOYOTA Developers Night」をテーマに同社が未来創生センターで実施する取り組みを紹介した。その中から、数理データサイエンスの研究事例である制御ソフトの自動検証技術と不完全なデータを用いた機械学習手法についてお届けしよう。
未来創生センターとは、すぐに製品化が可能な技術ではなく、次の世代のトヨタに役立つと予想される先端技術について研究開発を進める組織だ。「ロボティクス」「社会システム」「数理データサイエンス」「バイオヒューマン」の4つの研究領域を対象として、モビリティ技術を中心に生活者のWell-beingな人生の支援を目指す。
同センターの数理データサイエンス研究では、数理工学や群体数理、行動経済学など幅広い領域を研究対象としている。これらの研究結果は、将来的にコネクテッドシティ事業や自動車関連事業への応用が期待されているのだという。同センターの数理データサイエンス研究における特徴は「ヒト中心の研究を実施している点」「多くの研究機関と共創研究に取り組んでいる点」とのことだ。
イベントでは、同センターの西谷一平氏が「シミュレーションを活用した制御ソフトの自動検証技術」の事例を紹介した。同氏はソフト品質を担保したシステムを提供するための検証技術の開発に携わる。
西谷氏のチームらが開発した検証技術の一つに、「SBT(サーチベーステスト)」がある。システムの要求を違反するケースをシミュレーションで自動探索可能な技術であり、これにより効率的な制御ソフトの検証が可能となるのだ。一般的に使用されるグリッドテストと比較して、SBTは最適化技術を用いることで挙動の怪しい部分を重点的に探索するため、効率的に要求違反ケースを検出できるのだという。
ロジック検討のような開発プロセスの初期段階からSBTを継続的に使用することで、スピーディに品質を高めることが可能となる。同社では、自律走行ロボットが充電ステーションへ帰還する際に、自己位置の推定に誤差が生じる課題を抱えていたという。この課題に対してSBTを用いることで、推定誤差が生じる環境要件を特定してソフトの修正を実現したとのことだ。最終的には、推定誤差を80%低減している。
また、同社ではシミュレーション技術の開発と並行して、現実世界での課題対応にも取り組んでおり、さまざまな課題を一般化した上で研究として着手するのだそうだ。一例として、安心感のあるロボット動作の実現のために、ロボットと利用者の距離が十分か否かを2値分類したい場合を考えてみよう。この時、実環境ではロボットと利用者の距離が十分な場合のデータしか取得できない。現実世界では、ロボットとぶつかる前に利用者が回避するため、実際に事故につながるケースがほとんどないからだ。
このように、2値分類をしたいものの一方のクラスのデータしか得られない場合に、どのように分類境界を学習するのだろうか。同センターの篠田和彦氏が事例を交えて解説した。
Positive-confidence(Pconf)分類は、ポジティブなサンプル(正例)と補助情報としての信頼度が得られる場合に使用する手法だという。アプローチとしては、正例の分布とその信頼度だけで、分類ミスによって生じる損失の期待値を最小化する手段を採用する。Pconf分類の実用上の問題点として、現実世界で得られる信頼度は過大/過小評価によってゆがんでいる可能性があるため、精度が落ちる点があるという。
そこで同氏らの研究チームは、正例の誤分類率φが事前に分かっていると仮定する「Adjusted Pconf」を提案した。誤分類率φは、正例の分布のうち、最適な分類境界では負例と推定されるサンプルの割合を示す。事前に知っているφとデータから得られる推定値が最も近くなるハイパーパラメータkを最適化し、リスクを最小化する流れを取るとのことだ。
篠田氏は、同手法を社内で試験的に採用した例を紹介した。ドライバーの心電情報から眠気を推定する際に用いたのだという。実車で眠くなるまで試験をするのは危険なため眠い時のデータが取れず、同手法を採用したとのことだ。なお、信頼度には顔の表情から判定した眠気スコアを採用している。
補正を用いない通常のPconfでは信頼度のゆがみが大きく、すべてのサンプルを「覚醒」と推定したため、F値を計算できなかったという。一方で、Adjusted Pconfでは教師あり分類に迫る成績を残している。これにより、人手による信頼度評価のゆがみを補正して推定精度を向上できることが明らかになった。