Google Cloudは11月27日、Geminiを活用したデータ分析の最新情報や、ユーザーによる導入事例を紹介するセミナー「Gemini at Work - Data for AI -」を開催した。本稿では、JMDC デジタル&データ新規事業本部 AIプロダクトマネージャー 山下久知氏のプレゼンテーションを紹介する。

  • JMDC デジタル&データ新規事業本部 AIプロダクトマネージャー 山下久知氏

    JMDC デジタル&データ新規事業本部 AIプロダクトマネージャー 山下久知氏

2040万人分のヘルスビッグデータを保有するJMDC

山下氏のプレゼンテーションは「ビッグデータを用いた『Gemini in Looker PoC PJ』について」と題されたものだ。

JMDCでは、ヘルスビッグデータの力で持続可能な国民医療を実現するために医療統計データサービスを提供。同社のビッグデータは病院などで患者がどのような病気で受診したか、どのような治療を受けたかという診療報酬の明細のデータである健康保険組合のレセプトデータに由来している。

山下氏は「これらのデータを保険者、保険会社、製薬会社、薬局、医療機関、医師、アカデミア、生活者が疾病発生率や動態分析、地域医療のネットワーク分析などに利活用している。疫学データとして、かなり意味があるものであり、そこからインサイト得られることが肝になっている」と話す。

  • JMDCの事業概要

    JMDCの事業概要

健康保険組合から受領したレセプト・健診データなどをもとに、日本で利用可能な最大規模の疫学データベースを保有し、取扱レセプトデータは10億8100万件、取扱健診データが4590万件、母集団は2040万人。山下氏はJMDCの強みについてヘルスケアビッグデータの質と量、企画・解析の専門人材、アプリ・サービスの開発力、ヘルスケアデータ領域の提供実績を挙げている。

  • JMDCの強み

    JMDCの強み

専門職以外でもLookerでの分析を容易に

JMDCでは2020年からLookerを採用し、匿名加工されたレセプト・健診などのビッグデータであるPHDB(Private Health Database)を生命保険会社や製薬などの企業に提供。フロントエンドであるLookerには最新のデータを毎月追加するとともに、レセプト分析に最適化されたメニューを整備。ユーザーはブラウザから比較的容易に分析が可能になっており、同社からも分析結果を共有している。

こうした現状ではあるものの、主要顧客である生命保険会社の商品開発部門や査定部門の分析を担うアクチュアリーやデータサイエンティストなど、専門職の担当者が中心のため利用が限定的となっていることが課題になっていた。

  • JMDCにおけるLookerの活用状況と課題

    JMDCにおけるLookerの活用状況と課題

山下氏は「従来のLookerにGeminiを与えることで、分析のハードルを下げて簡易的な分析がビジネス部門でも簡単にできる状況を構築したいと考えた。具体的にはセルフサービス型BI(ビジネスインテリジェンス)を目指した。また、当社の社員が分析を行う際に生成AI機能を利用することで業務効率化の可能性を検証した」と述べている。

実施した内容は、従来のLookerの環境と同じ検証用環境を用意し、バックエンドで利用していたデータ基盤のBigQueryに数億件のデータを投入して分析。分析チームは生成AI機能などの追加機能を生成AIのSDKやGoogle Cloudのサーバレスコンテナ「Cloud Run」をはじめ、さまざまな観点で利用・検証して意見を集約した。

  • プロジェクトの目的と実施内容

    プロジェクトの目的と実施内容

同氏によると、生成AIでどこまで精度が向上するのかまったく分からない状態だったことから、手探りで検討を開始し、想定した技術的タスクは、保険・製薬業界でよくある既存の問い(抽出条件)をトレーニングデータセット、テストデータセットを分けて作成し、トレーニングデータセットに関してはワンショットラーニングで作成。ゼロベースの精度と、少しずつ追加学習したものの精度を比較したという。

山下氏は「インストラクション(指示)の中でCoT(Chain of Thought:プロンプトとして事例を与える際に思考過程を同時に入力する手法)など、コンテキスト内学習のような部分を工夫した。実質的には、プロンプトを医学専門のMedPrompt風にすることで精度が向上し、LLM(大規模言語モデル)の新しい学習方式であるMany-Shot In-Context Learningで追加学習することでカバー範囲が拡大した。ただ、社内の専門用語や業界用語に特化したものは理解しきれていなかったことから、シノニム(同義語)なども組み合わせ、システムプロンプト自体が重厚長大になり、ざっくりとした問い合わせでも専門的な集計ができるようになった」と話す。

今後は新サービスの開発などを検討

実際に、プロンプト例から「新患期間中にがん罹患した者の手術率を集計してほしい」を選択して生成AIを備えたLookerで文章でのデータ集計を指示した。

このプロンプトは「健康保険組合加入者のうち、がん罹患者の手術の発生率・総点数・単価を観察年月、性別、到達年齢別に集計してほしい」といった意図があり、テンプレ化したものは文章でデータ集計指示がチャートで示すことを確認。

こうしたことが可能になったため、SQLが記述できなくても簡単に文章でJMDCのデータを活用・分析することができるようになり、ビジネスユーザーにも活用対象者を広げることで契約の継続性も高められる可能性があるという。

  • プロジェクトの結果、生成AIが組み込まれたLookerは活用対象者拡大の可能性が確認できた

    プロジェクトの結果、生成AIが組み込まれたLookerは活用対象者拡大の可能性が確認できた

今回の検証を通じて山下氏が得た知見としては、セルフサービス型BIのユースケースのビジネス的価値があることと、生成AIを使いこなすには複雑なプロンプトが必要であるという2点。ビジネス面では総じてベネフィットが確認された一方、技術面ではシードが多く発見されたとのことだ。

また、今後の展望としては生成AIを活用した新サービスの開発や、プロンプトエンジニアリングの深耕による精度向上で社内合理化を図ることを検討。新サービスについては分野を横断したユースケースなどを創出する一方で、社内合理化に関しては効率化できそうなポイントの特定、新たなパイロットプロジェクトの推進などを想定している。