金融業界に特化してデータマネジメントのナレッジやノウハウを共有する全6回シリーズのセミナー「金融業界のデータマネジメント最前線」(主催:TECH+、データ横丁)の最終回が、2月4日に開催された。登壇したのはSBI証券 データ戦略推進部 主任を務める谷岡直登氏。SBIグループにおけるデータやAIを活用するための取り組みを共有した。
「顧客中心主義の徹底」をデータで支援
谷岡氏はSBIホールディングスに社長室 ビックデータ担当として新卒で入社、事業会社の支援のため、2022年よりSBI証券 マーケティング部に兼務出向してデータ分析業務に携わった。2024年10月にデータ戦略推進部が新設されたことを契機に、社長室 ビックデータ担当に加え、ローカルCoE(Center of Excellence)としても活動し、SBI証券 リテール部門全体のデータ基盤の刷新やAI活用の推進を進めている。
SBIグループは金融サービス事業を中心に5つの事業を持つ。谷岡氏が所属した社長室 ビックデータ担当は、グループ横断的なデータ活用基盤の整備やAI活用推進をミッションとし、企画担当、データサイエンティスト、地銀からの出向者など約35人の体制だ。
生成AIについては、2023年7月に特化したCoE組織となるSBI 生成AI室を立ち上がった。これまでSBIホールディングス 社長室 ビックデータ担当が培った予測AIの経験などを取り込み、グループ横断で生成AI活用を推進、金融業界における生成AIの標準化の取り組みなどを進めているという。
データやAIの活用については、創業以来掲げている「顧客中心主義の徹底」の考えに沿うかたちで取り組んでいる。
データ活用においては、グループ横断的なデータ活用のために、「経営層」「データ活用担当者」「実務担当者」の三層にそれぞれのアプローチを実施。経営層には戦略的なコミットメントを確保するためのビッグデータ会議を開催し、データ活用担当者向けには月次でグループデータ活用推進会議を開き、事例共有を促進している。実務担当者には、データサイエンスのスキル向上を目的とした分科会を開催し、デジタル人材の育成に注力しているそうだ。
AI活用に関しては一定のフレームワークを導入し、AI勉強会とテーマ創出ワークショップの開催により、”やりたい”を引き出す。そのなかで出てきたアイデアにはデータサイエンティストが関わり、フィードバックを通じてアイデアを出した担当者にモデル運用のイメージや期待値をあらかじめ話すというかたちを採っている。これにより、プロジェクト頓挫のリスクを下げているそうだ。
全社的なナレッジの底上げを行う理由について谷岡氏は「データやAIを活用するためには、それぞれの担当者の協力が必要不可欠になる」と話す。
このような枠組みに加えて、AIレディな状態をつくるため、技術面では「クラウド・SaaS前提のセキュリティ」「データレイク・データウェアハウスの整備」「AIプラットフォームの導入」の3つに専念している。データ活用基盤は、Microsoft Entra IDによる認証システム、Snowflakeを中心としたデータ基盤、DataRobotによる分析基盤を整備。生成AIはローカルLLMを含めたマルチモデルなどを構築した。顧客のチャネルがAmazon Web Servicesをはじめとしたマルチクラウドのケースが多いことから、「Snowflakeによりマルチクラウド環境への対応を進めている」(谷岡氏)そうだ。
AIガバナンスの確立にも注力している。経済産業省の「AI事業者ガイドライン」など政府機関のガイドラインなどを基に、社内セミナーの開催や実務レベルでのチェックシート整備を通じて、安全かつ効果的なAI活用の体制を構築しているという。
データウェアハウス刷新、処理時間を最大1000分の1に短縮
講演の後半で谷岡氏は、データマネジメントについて、事業部側でこの取り組みがどのように浸透していったのかをSBI証券の立場として話した。
谷岡氏はSBI証券のデータ戦略推進部で、SBIホールディングスで培ったデータ活用のノウハウやセキュリティ、ガバナンスの知見をSBI証券内に展開する役割を担っている。
「事業会社特有の壁がなくならない限り、SBIホールディングスの取り組みがSBI証券にとって価値が最大化されないと感じていました。個別の事業会社としての課題を優先しつつグループで培ったノウハウがどのようなかたちで利用できるのかを日々試行錯誤しています」(谷岡氏)
具体的には、約10年前に構築したマーケティング分析用データウェアハウスを一次刷新した。SSDを搭載したサーバの導入やデータベースチューニングにより、処理時間を最大で1000分の1まで短縮。SQLベースのBIツールを導入し、データの可視化と分析効率も大幅に改善した。
人材育成面では、若手社員へのSQL個別指導から始まり、現在では人事部と連携した新入社員向けSQL研修プログラムを展開している。また、Microsoft Teamsでコミュニティをつくり、実践的な意見交換の場を提供するなどの仕掛けも用意した。
データへのアクセス性を改善
一次刷新後にデータ活用が進んだが、テーブルの項目数の増加とそれに伴う複雑化などの課題が出てきた。そこで取り組んだのが「データアクセシビリティ」の改善だ。具体的には、統一された定義でのデータの取得、SQLを知らないユーザーでもKPIの取得やさまざまな集計軸で分析できるといった項目を目標に、データマートの整備、KPI取得アプリの改善、データ地図の整備などの取り組みを進めた。
このようなデータアクセシビリティ改善の取り組みにより、データマップに対してKPI取得アプリを使って特定商品の「約定_月次」といった商品サービス、期間や集計軸などを指定したクエリを実行できるようになった。NISA口座の有無、取引経験の有無など共通集計軸を使ったクロス集計も可能になったという。
AI開発は、一次刷新した基盤を二次刷新でクラウド化した段階だ。AI開発環境としてDataRobotを活用、プライベートアクセス、教師データ、構築したモデル、作成したプロジェクトを自社のAmazon S3に保管するなど、セキュリティを考慮した運用を設計した。
これらの取り組みを通じて業務部門のデータ利活用は急増し、直近1年間でクエリ実行者数は211名(当初の3倍)、クエリ実行回数は24万回(当初の2.4倍)に増加し、119個のダッシュボードが構築されるなど、データ活用が広がっていることを実感しているそうだ。
Snowflakeをベースに分析基盤刷新へ
このような取り組みを説明した後、谷岡氏は「個社の課題改善を優先させながらグループで培ったノウハウを落とし込む準備が整ってきた」と話した。
今後はSnowflakeをベースに分析環境の刷新なども考えているという。狙うメリットは、先述のマルチクラウド対応、所有権と責任を分散し一部ユーザー向けに個別部署でビジネスドメインに基づくデータの作成や運用を可能にするデータメッシュ、SaaSツールとの接続などだ。
このような環境構築だけでなく、既存のデータから利用用途に応じたデータマートを作成する取り組みなども平行して進める計画だ。
講演の最後に谷岡氏は体制づくりについて、視聴者からの質問に答えるかたちで「ホールディングス側ではトップマネジメント層のコミットを得ながら進め、SBI証券ではボトムアップ型で進めた」と振り返った。
「ミニマムに実績をつくり上げ、それをマネジメント層に評価してもらうことで、データの取り組みの重要性を理解してもらったことが転換点になりました」(谷岡氏)