みずほ証券の株価騰落予測システム

みずほ証券の等々力昌彦氏は、コンピュータが株式を売買するアルゴ(Algorithmの略の業界用語)取引が、東証の取引の7割を占めると説明し、ディープラーニングを使うみずほ証券のシステムについて説明した。

ディープラーニングを使う株価の騰落予測システムについて発表するみずほ証券の等々力氏

このシステムはターゲット時刻に株価が上がるか下がるかを予測する。

1時間後に株価が0.5%以上上昇するか、0.5%以上下落するか、それとも-0.5%~+0.5%のレンジ内に収まるかを予測する

この予測を行うために7800入力のDBN(Deep Belief Network:DBNは教師なし学習のやり方の1つ)を使っている。

7800入力のDeep Belief Networkを使う

1つの万能な予測器を作ろうとすると良い結果は得られないとのことで、次の図のように予測時刻とどれだけ先を予測するか、変動の範囲ごとに専用のDBNを作っているという。

1つで万能の予測器をつくるのはうまくいかない。専用のDBNを作って個別に学習

入力としては、予測対象の個別株の直近の20個の4本値と出来高データ、直近の100個のクオートデータ、直近100tickの価格、約定数量など合計3900データ、日経225先物についても同様に3900データで、合計7800入力のネットワークとなっている。

これは株価や日経225先物の時系列の価格や板情報を入力していることになる。

入力は予測対象の株と日経225先物の価格や板情報、約定数量など。入力数は対象の株が3900データ、日経225先物が3900データとなっている

次のグラフは、株価がレンジ内にある確率とディープラーニングによる予測正解率を示したもので、ディープラーニングを使うことにより平均で+2.48%正解率が改善したという。ただし、これがファンドの運用成績をどの程度改善するのかについては言及されなかった。

ディープラーニングを使うことで、平均2.48%予測正解率が改善した

このシステムは4台のサーバにそれぞれ8台のTesla M40 GPUを接続し、もう1台のサーバをストレージサーバやフロントエンドサーバとして使っている。そして、これらのサーバを56GbpsのInfiniBandで接続し、学習を並列化している。

システムは、浮動小数点演算のピーク性能が224TFlopsとかなり強力なシステムであり、やはり、金融業界はスピードがお金に直結するという感じである。

Tesla M40 GPUを32台使い、224TFlopsという高性能システムを使っている

店舗運営を改善するABEJA

ABEJAは、現在は第1弾として、ディープラーニングを応用したインストアアナリティクスのビジネスを行っているという。

ディープラーニングを使うABEJAのビジネスについて発表する岡田陽介CEO

次の写真はデモの風景であるが、ABEJAのシステムはビデオに写っている人の性別と年齢をディープラーニングを使って識別する。写真の画像は、右の男性が0歳から数えて年齢が加算されていくように表示が変化しているところ、左の女性も同じく数えている最中で4歳になっており、最終結果までに時間がかかるように見えたが、実際には、リアルタイムで性別や年齢の判定を行っているものを、あえてデモということで、推定年齢や性別の表示に時間がかかるような表示方法を用いているとのことであった。

ABEJAのブースでのデモ風景。ビデオの人物の性別と年齢をディープラーニングを使って識別している

従来は店舗内で収集できる顧客情報は限られていたが、ABEJAのディープラーニングを使えば、年齢層別の来店人数、滞在時間、動態などの情報が得られる。そして、この情報を使って売り場位置の最適化を行なったり、店員の配置を最適化したりして、売り上げの増加やコストダウンを行うことができる。

また、これをPOSデータなどの従来の情報と組み合わせると新たな価値が生み出せるという。

このABEJAの技術はインストアアナリティクスだけでなく、広い範囲に適用できる可能性を持っている。

ABEJAの認識技術はインストアだけでなく、この図のように広い分野で役に立つ

例えば、渋谷のスクランブル交差点を通っている人の年齢層などを識別して、そこに居る人に向けた広告をビッグスクリーンで流すなど、東急電鉄とタイアップして、どのように使えるかという可能性を探るという。

東急電鉄(東急)とタイアップして、どのように使えるかという可能性を探る。中央が、東急の都市創造本部の加藤氏。右が岡田CEO、左端は、NVIDIAの平野氏

ディープラーニングは学習をすれば、何でも識別できるという魔法の杖ではないが、いろいろな分野で、従来はできなかった識別ができるようになってきている。そうなると、当然であるが、ビジネスに応用しようという動きが活発になってきている。しかし、識別を絶対に間違わないという訳ではなく、ある程度のエラーを許容して、どのように使うかが重要になると考えられる。このレポートでも内外の事例を紹介したが、どのようなビジネスにどう使うかというアイデアがキーポイントになりそうである。