Kaggle(カグル)公式サイト

機械学習やデータサイエンス分野で著名な競技プラットフォーム「Kaggle」。世界各地の企業のデータサイエンティストや研究者たちが公開されているデータセットやモデルを用いて特定のテーマの最適化で競い合う。数百万円から数千万円と賞金の規模も大きく、Kaggleを通してデータ分析やプログラミングの技術を磨く書籍なども多数発刊されている。

2024年11月から開始されたコンペティション「Santa 2024 - The Perplexity Permutation Puzzle」において、電気通信大学 柳井啓司研究室の山口廉斗さんを代表者とするチーム(原田 慧 教授(情報学専攻)、佐野 遼太郎 特任助教(データ教育センター)、卒業生でコニカミノルタのデータサイエンティストでもある山口 剛さん)が上位入賞者(13位/1514チーム中)に授与される金メダルを受賞した。

クリスマスに関連する最大100個の英単語からなる文章を並び替えて、大規模言語モデルにとって最も自然な文章を作る課題に対して、巡回セールスマン問題(Traveling Salesman Problem/複数の都市を一度だけ訪れてすべての都市の最小の総移動距離を探索する)を参考に、焼きなまし法(最適解を求めるために一定の確率で結果が悪くなる方向にも遷移するアルゴリズム)、遺伝的アルゴリズム(生物の進化に着想を得た最適化手法で選択、交叉、突然変異などの操作を行い最適化を目指すアルゴリズム)、反復局所探索法(局所的な最適解を導きつつ、近傍の解からさらに良い解を導くアルゴリズム)などを組み合わせて挑んでいる。

山口 剛さんが在籍するコニカミノルタでは、生産や間接業務の現場を良く知るエキスパートとデータサイエンティストがタッグを組んで課題起点のデータ活用を行っており、データ可視化から予測や最適化など100件以上のテーマに取り組む生産DXを推進している。コンペで採用した手法の一部は多様な制約を考慮した生産条件や物流ルートや生産計画の最適化にも役立っているという。