機械孊習を採甚する䌁業が増加

機械孊習(ML)を詊隓導入する䌁業は増え続けおおり、その採甚率も䞊がっおいたす。McKinseyの調査によるず、39%の䌁業がすでに䜕らかの圢匏のMLをビゞネスに導入しおいたす。

MLの採甚はただ初期段階ですが、効率性の向䞊、顧客行動の予枬、将来を芋据えたビゞネスむンテリゞェンスなどのメリットが芋蟌たれ、あらゆる䌁業にずっお魅力的なテクノロゞず蚀えたす。

業務甚AVB(オヌディオ/ビデオおよび攟送機噚)垂堎も䟋倖ではありたせん。この分野の䌁業ではすでに、MLによっおコスト削枛だけでなく新しい利甚モデルや収益源も生たれおいたす。

具䜓的に、業務甚AVB䌁業によるMLの応甚䟋を4぀玹介したす。

1. 関心領域(ROI)の゚ンコヌド

倧容量の動画ファむルやUHDコンテンツのストリヌミングやストレヌゞはコストがかさみやすいものです。関心領域(ROI:Region of Interest)の゚ンコヌドによっおコンテンツの党䜓的なビットレヌトを削枛し、自然ず目を匕く領域(特に顔や人物)に最高の動画品質(VQ)を適甚する䞀方、重芁性の䜎い領域(背景など)ではVQを䞋げれば、コストの問題を軜枛できたす。

普通に芖聎したずきの芋た目䞊の動画品質を維持したたた、゚ンコヌダヌの出力ビットレヌトを、たずえば5Mbpsから1.5Mbpsに削枛できたす。この70%のビットレヌト削枛は、そのたた70%のストリヌミングコスト削枛に倀したす。芖聎者10,000人に察する暙準的なストリヌムの堎合、1時間あたり700ドル超も削枛できるこずになりたす。

  • ROIの゚ンコヌド

メディアストレヌゞのコストにも同じこずが蚀えたす。クラりドで2TBの高スルヌプットドラむブを利甚しおいる堎合、1カ月あたりのコストは玄1,000ドルになりたす。ROIを利甚しお゚ンコヌダヌの出力ビットレヌトを70%削枛すれば、よりサむズが小さく䜎䟡栌のドラむブを利甚するか、同じドラむブに保存する動画コンテンツを増やすこずができたす。

ROIは、攟送局などの調敎宀向けアプリケヌションで最重芁領域の詳现デヌタを保存する際にも利甚できたす。たずえば、問題が発生し、それを倧型のビデオりォヌルでモニタヌしおいる堎合は、事埌調査で詳现を正確に把握でき、そこから誀りを孊習しお察応策を改善するためのトレヌニングに掻甚できるこずが重芁です。぀たり、ROI゚ンコヌドに静的座暙を、顔や人物にはMLベヌスの動的座暙を䜿甚しお、テキストオヌバヌレむ(時刻衚瀺など)の領域のVQを高く維持したす。

2. むンテリゞェント・デゞタル・サむネヌゞ

マヌケティング担圓者にずっお、タヌゲットを絞った広告を出すこずは非垞に重芁です。さたざたなMLモデルを甚いおデゞタルサむネヌゞの芖聎者を分析すれば、幎霢や性別などのメトリクスに基づいおより関連性の高いタヌゲットを絞った広告を出すこずができたす。

これによりサむネヌゞプロバむダヌは、より効果の高い広告や広告挔出に費甚をかけたい広告䞻にずっお魅力的な存圚になりたす。さらには、サヌビスの利甚向䞊に぀ながる重芁なデヌタ(芖聎者の関心など)を生成し、収益に぀ながるフィヌドバックを広告䞻のメヌカヌに提䟛するこずも可胜です。

たた、芖聎者には関連性の高い、よりパヌ゜ナラむズ化された広告、たずえば芖聎者が興味を持ちそうな商品やサヌビスの広告で、党䜓的なショッピング゚クスペリ゚ンスの向䞊をもたらすような広告が衚瀺されたす。代替MLモデルをむンタラクティブキオスクに導入すれば、埓来のタッチ画面に代わっおゞェスチャヌコントロヌルで次の広告に移動したり、商品を泚文したりできるようになりたす。ファストフヌドの泚文時に利甚されおいるタッチ画面の衛生状態の悪さはマスコミでも倧きく取り䞊げられおいるため、物理的に接觊するのではなくゞェスチャヌに切り替えるず、顧客にずっおはるかに枅朔で安党なサヌビスを提䟛できたす。

3. オブゞェクトトラッキングずりィンドりむング

MLを利甚した顔認識の応甚䟋はほかにもありたす。たずえば地方の倧孊で、ある芞術家の䜜品に関するパネル ディスカッションをラむブ配信するずしたす。䜎予算のむベントでオヌディ゚ンスも限られるため、制䜜コストをできるだけ抑える必芁がありたす。このような堎合は通垞、1台のカメラで党䜓を撮圱し、状況に応じおズヌムやパンを行いたす。

MLを利甚するず、4Kの固定カメラで党䜓を捉えながらも、䜎解像床のHDりィンドりに各パネリストの様子を自動的に出力し、䌚話を通しお远跡するこずができたす。぀たり、1台の4Kカメラから、4぀の異なるショット(広角のショットず3぀のクロヌズアップ)を出力し、ラむブ配信䞭に切り替えられたす。これならば芖芚効果が高たる䞊に、カメラ機材を増やす必芁がありたせん。カメラマンはビデオミキサヌになっお、配信するフレヌムを遞択するだけです。

さたざたなMLトラッキングモデルを䜿甚すれば、この手法をスポヌツ䞭継などの業務甚攟送アプリケヌションに応甚したり、コラボレヌション環境に応甚しお耇数のビデオ䌚議出垭者を自動远跡したりできたす。

4. 音声認識

MLの別の応甚䟋に目を向けるず、自然蚀語凊理(NLP)モデルを利甚した音声認識も可胜です。これはすでに家庭でも芋受けられたす。Google Alexaなどのスマヌトデバむスは、コマンドに応答しお情報やメディアを提䟛したり、家の䞭にあるさたざたなものを制埡したりできたす。デバむスに組み蟌たれたNLPを利甚すれば、同じ機胜を業務甚のメディアに応甚しお、機材をシンプルな手順で玠早くセットアップできたす。クラりド接続は䞍芁で、関連のサブスクリプションサヌビスを利甚しなくおも同じタスクを実行できたす。

さらに、音声テキスト倉換アルゎリズムず芁玄モデルを利甚しお、議事録を自動的に文字に起こすこずもできたす。たた、字幕をほがリアルタむムで任意の蚀語に翻蚳するこずも可胜です。この機胜もビデオ䌚議アプリケヌションに応甚したり、番組攟送や映画で埓来から利甚されおいるクロヌズドキャプションシステムに応甚したりできたす。

゚ッゞでのAIプロセッシングの実珟方法

ザむリンクスが提䟛する「Zynq UltraScale+ MPSoC プラットフォヌム」を始めずするデバむスでこれらのML機胜を掻甚するこずで、AI゚ッゞプロセッシングを実珟するこずができたす。

゚ッゞ偎で盎接凊理し、ネットワヌク接続の必芁がなくなるず、䜎レむテンシずいうメリットがあるだけでなく、クラりドでの識別メトリクスのプラむバシヌや保存に関するさたざたな問題の解消にも圹立぀可胜性がありたす。これらのML機胜をザむリンクスのこれらのプラットフォヌムに組み蟌むず、䌁業はアナリティクスを収益化し、ワヌクフロヌの効率性やナヌザビリティを向䞊できるようになりたす。最終的には、これらの統合型ML機胜によっお䌁業がむノベヌションを促進し、他瀟ずの差別化を図り、垂堎化の時間を短瞮するこずも可胜になりたす。

草野倚恵

著者プロフィヌル

ロバヌト・グリヌン(Robert Green)
Xilinx
業務甚AVB(オヌディオ/ビデオおよび攟送機噚)シニアマネヌゞャヌ

プログラマブルロゞック業界で25幎、ザむリンクスでは過去20幎間、業務甚AVBおよびコンシュヌマの垂盎垂堎に埓事。珟圚は、業務甚オヌディオ、AV over IP、ビデオ凊理など、さたざたなオヌディオおよびビデオ技術に関するザむリンクスのマヌケティングを支揎し、EMEA 地域における䞻芁な顧客のサポヌトしおいる。

テキサス・むンスツルメンツ瀟のデザむン・゚ンゞニアずしおキャリアをスタヌト。同瀟にお民生甚TVセット甚のNICAMステレオ・オヌディオASICを開発。その埌、英囜の代理店Macro ElectronicsでAMD/Vantis、Philips、Motorola、AT&T/Lucentのプログラマブルデバむスをサポヌトするフィヌルドアプリケヌション゚ンゞニア(FAE)を務めた埌、ザむリンクスに入瀟。

リバプヌル・ゞョンムヌア倧孊で電気電子工孊のBEng(Hons)孊䜍を取埗。