みずほ証券の株価騰落予測システム
みずほ証券の等々力昌彦氏は、コンピュータが株式を売買するアルゴ(Algorithmの略の業界用語)取引が、東証の取引の7割を占めると説明し、ディープラーニングを使うみずほ証券のシステムについて説明した。
このシステムはターゲット時刻に株価が上がるか下がるかを予測する。
この予測を行うために7800入力のDBN(Deep Belief Network:DBNは教師なし学習のやり方の1つ)を使っている。
1つの万能な予測器を作ろうとすると良い結果は得られないとのことで、次の図のように予測時刻とどれだけ先を予測するか、変動の範囲ごとに専用のDBNを作っているという。
入力としては、予測対象の個別株の直近の20個の4本値と出来高データ、直近の100個のクオートデータ、直近100tickの価格、約定数量など合計3900データ、日経225先物についても同様に3900データで、合計7800入力のネットワークとなっている。
これは株価や日経225先物の時系列の価格や板情報を入力していることになる。
次のグラフは、株価がレンジ内にある確率とディープラーニングによる予測正解率を示したもので、ディープラーニングを使うことにより平均で+2.48%正解率が改善したという。ただし、これがファンドの運用成績をどの程度改善するのかについては言及されなかった。
このシステムは4台のサーバにそれぞれ8台のTesla M40 GPUを接続し、もう1台のサーバをストレージサーバやフロントエンドサーバとして使っている。そして、これらのサーバを56GbpsのInfiniBandで接続し、学習を並列化している。
システムは、浮動小数点演算のピーク性能が224TFlopsとかなり強力なシステムであり、やはり、金融業界はスピードがお金に直結するという感じである。
店舗運営を改善するABEJA
ABEJAは、現在は第1弾として、ディープラーニングを応用したインストアアナリティクスのビジネスを行っているという。
次の写真はデモの風景であるが、ABEJAのシステムはビデオに写っている人の性別と年齢をディープラーニングを使って識別する。写真の画像は、右の男性が0歳から数えて年齢が加算されていくように表示が変化しているところ、左の女性も同じく数えている最中で4歳になっており、最終結果までに時間がかかるように見えたが、実際には、リアルタイムで性別や年齢の判定を行っているものを、あえてデモということで、推定年齢や性別の表示に時間がかかるような表示方法を用いているとのことであった。
従来は店舗内で収集できる顧客情報は限られていたが、ABEJAのディープラーニングを使えば、年齢層別の来店人数、滞在時間、動態などの情報が得られる。そして、この情報を使って売り場位置の最適化を行なったり、店員の配置を最適化したりして、売り上げの増加やコストダウンを行うことができる。
また、これをPOSデータなどの従来の情報と組み合わせると新たな価値が生み出せるという。
このABEJAの技術はインストアアナリティクスだけでなく、広い範囲に適用できる可能性を持っている。
例えば、渋谷のスクランブル交差点を通っている人の年齢層などを識別して、そこに居る人に向けた広告をビッグスクリーンで流すなど、東急電鉄とタイアップして、どのように使えるかという可能性を探るという。
ディープラーニングは学習をすれば、何でも識別できるという魔法の杖ではないが、いろいろな分野で、従来はできなかった識別ができるようになってきている。そうなると、当然であるが、ビジネスに応用しようという動きが活発になってきている。しかし、識別を絶対に間違わないという訳ではなく、ある程度のエラーを許容して、どのように使うかが重要になると考えられる。このレポートでも内外の事例を紹介したが、どのようなビジネスにどう使うかというアイデアがキーポイントになりそうである。