機械の目が見たセカイ　-コンピュータビジョンがつくるミライ(44) ディープラーニングの基礎(3) - 回帰・2クラス分類・多クラス分類の出力層

今回は、「回帰」、「2クラス分類」、「多クラス分類」におけるディープラーニングの出力層の違いについて解説したいと思います。

回帰

回帰(Regression)とは、簡単に言うと「連続的な数値の予測」です。具体的には、図1のネットワークの出力層が連続をとることになります。前回も同様の例を上げましたが、0層目に顔画像を入力し、出力層で写っている人の年齢を推定する問題が回帰です。

推定したい数値の範囲に応じて、活性化関数を選ぶ必要があります。例えば値域が[-1:1]の場合は、出力層に双曲線正接関数を用いることになります。また、値域が[-∞:∞]の場合は、恒等写像となります。

そして、誤差逆伝搬法により推定誤差から重みwを更新するのですが、その際に誤差関数を定義する必要があります。回帰では、図1内に記載している二乗誤差を全サンプルで加算したものを誤差関数とします。

図1 回帰における出力層の設計

2クラス分類

出力が連続値ではなく、「顔」か「顔以外」といったように入力を2つに分類するものが2クラス分類です。このとき、ラベルdが1のときに「顔」、0のときに「顔以外」といったように各クラスに2値の正解値を付与します。

出力層の活性化関数は、[0:1]の範囲の値を取るロジスティックシグモイド関数を用いることになります。誤差関数は、例えば入力x (x₁ , x₂,…, x_D)が与えられた際にラベルdが1となる事後確率p(d=1|x)をモデル化する方法があります。確率が0.5以上であればd=1、それ以下であればd=0とみなします。数式の詳細は割愛しますが、誤差関数は図2内に記載している通りとなります。

図2 2クラス分類における出力層の設計

多クラス分類

多クラス分類では、入力画像が「人の顔」なのか、「猫の顔」、「犬の顔」、「猿の顔」なのかといったように、入力データを複数のクラスに分類します。数字の0から9と書かれた画像を分類する(文字を読み取る)場合も、この多クラス分類となります。多クラス分類では、図3のように分類したいクラス数分だけ出力を並べます。クラス数が0～9の10クラスの場合、数字の3の正解値は、[0 0 0 1 0 0 0 0 0 0]といった具合に該当するクラスを1、それ以外を0とします。

多クラス分類では、出力y₁, y₂, …, y_Kの総和が常に1となるソフトマックス関数と呼ばれる活性化関数を用います。

誤差関数は、入力x(x₁,x₂…, x_D)がクラスCkに属する確率p(C_k|x)によりモデル化します。こちらも数式の詳細は割愛しますが、図3内に記載している交差エントロピーと呼ばれる関数を誤差関数として用いることになります。

図3 多クラス分類における出力層の設計

今回ご紹介したように、回帰、2クラス分類、多クラス分類といったように推定したい対象に応じて出力層の設計を変える必要があります。独自のネットワークを設計する際は、注意するようにしましょう。

著者プロフィール

樋口未来(ひぐち・みらい)
日立製作所日立研究所に入社後、自動車向けステレオカメラ、監視カメラの研究開発に従事。2011年から1年間、米国カーネギーメロン大学にて客員研究員としてカメラキャリブレーション技術の研究に携わる。

日立製作所を退職後、2016年6月にグローバルウォーカーズ株式会社を設立し、CTOとして画像/映像コンテンツ×テクノロジーをテーマにコンピュータビジョン、機械学習の研究開発に従事している。また、東京大学大学院博士課程に在学し、一人称視点映像(First-person vision, Egocentric vision)の解析に関する研究を行っている。具体的には、頭部に装着したカメラで撮影した一人称視点映像を用いて、人と人のインタラクション時の非言語コミュニケーション(うなずき等)を観測し、機械学習の枠組みでカメラ装着者がどのような人物かを推定する技術の研究に取り組んでいる。

専門:コンピュータビジョン、機械学習

ディープラーニングの基礎(3) - 回帰・2クラス分類・多クラス分類の出力層

回帰

2クラス分類

多クラス分類

著者プロフィール

この連載の前後回

Members+ 会員限定記事

大塚製薬はゲーミフィケーションで「子どもの食育」を叶えられるのか - 「もぐもぐタウン」開発の裏側

業務フローを変革し働き方まで刷新した富山県立中央病院、その手法とは

メタバース×日常に強み - アダストリアが見出した活路とは

国内株式取引システムをAWSクラウドへ移行したSBI証券、狙いと効果を説明

LINEヤフーの生成AI活用のカギは攻めと守りの教育 - 新入社員も学ぶ

リボン・コミュニケーションズ、事業戦略を説明 - IP＆光伝送製品市場で成長を

編集部が選ぶ関連記事

機械の目が見たセカイ　-コンピュータビジョンがつくるミライ第42回ディープラーニングの基礎(1) - ニューラルネットワークとは

Hisa Andoのディープラーニング挑戦記第1回 NVIDIAのDeep Learning Instituteを体験してみた

ディープラーニングの先にあるものとは? - 東大松尾准教授が語った人工知能の未来(前編)

ディープラーニングの先にあるものとは? - 東大松尾准教授が語った人工知能の未来(後編)

東芝、量子インスパイアード計算機を用いた5G基地局向けリソース制御技術を開発

島津製作所の米国子会社が3地域でR＆Dセンターを開所 - 製薬事業拡大へ

住友ゴムと村田製作所、タイヤの摩耗を可視化する新システムを共同開発

NTT Comの「アプレット領域分割技術」を活用したSIMが自販機のキャッシュレスを推進へ

PCI-SIG、PCI Express 7.0のRevision 0.5 Draft完成をアナウンス

あらゆるAIニーズに旧Xilinxとのシナジーで対応を進めるAMD、日本でも市場を拡大

このカテゴリーについて

ディープラーニングの基礎(3) - 回帰・2クラス分類・多クラス分類の出力層

回帰

2クラス分類

多クラス分類

著者プロフィール

この連載の前後回

Members+ 会員限定記事

大塚製薬はゲーミフィケーションで「子どもの食育」を叶えられるのか - 「もぐもぐタウン」開発の裏側

業務フローを変革し働き方まで刷新した富山県立中央病院、その手法とは

メタバース×日常に強み - アダストリアが見出した活路とは

国内株式取引システムをAWSクラウドへ移行したSBI証券、狙いと効果を説明

LINEヤフーの生成AI活用のカギは攻めと守りの教育 - 新入社員も学ぶ

リボン・コミュニケーションズ、事業戦略を説明 - IP＆光伝送製品市場で成長を

編集部が選ぶ関連記事

機械の目が見たセカイ -コンピュータビジョンがつくるミライ 第42回 ディープラーニングの基礎(1) - ニューラルネットワークとは

Hisa Andoのディープラーニング挑戦記 第1回 NVIDIAのDeep Learning Instituteを体験してみた

ディープラーニングの先にあるものとは? - 東大 松尾准教授が語った人工知能の未来(前編)

ディープラーニングの先にあるものとは? - 東大 松尾准教授が語った人工知能の未来(後編)

東芝、量子インスパイアード計算機を用いた5G基地局向けリソース制御技術を開発

島津製作所の米国子会社が3地域でR＆Dセンターを開所 - 製薬事業拡大へ

住友ゴムと村田製作所、タイヤの摩耗を可視化する新システムを共同開発

NTT Comの「アプレット領域分割技術」を活用したSIMが自販機のキャッシュレスを推進へ

PCI-SIG、PCI Express 7.0のRevision 0.5 Draft完成をアナウンス

あらゆるAIニーズに旧Xilinxとのシナジーで対応を進めるAMD、日本でも市場を拡大

このカテゴリーについて

機械の目が見たセカイ　-コンピュータビジョンがつくるミライ第42回ディープラーニングの基礎(1) - ニューラルネットワークとは

Hisa Andoのディープラーニング挑戦記第1回 NVIDIAのDeep Learning Instituteを体験してみた

ディープラーニングの先にあるものとは? - 東大松尾准教授が語った人工知能の未来(前編)

ディープラーニングの先にあるものとは? - 東大松尾准教授が語った人工知能の未来(後編)