宇宙航空研究開発機構(JAXA)は1月30日、AIが月の模様をどのように見るのかのテストを行った結果、低緯度の月の模様ほど「うさぎ」に、高緯度の模様ほど「顔」に見える傾向があることを確認し、月の模様を「うさぎ」とする文化が低緯度地域に、「顔」とする文化が高緯度地域に発生したことと整合的だったと発表した。
同成果は、JAXA 宇宙科学研究所(ISAS) 月惑星探査データ解析グループの庄司大悟研究員によるもの。詳細は、AIと社会を主題に知識と文化とコミュニケーションを扱う学術誌「AI & Society」に掲載された。
日本を含めたアジアの国々では、月に“うさぎ”がいると考える文化がある。その一方で、欧州などでは、月の模様が“人”もしくは“人の顔”であるという文化が見られる。一般的に月とうさぎや顔が結びつくのは、月面の模様がうさぎや顔に似ているためとされる。また文化人類学では、月の満ち欠けとうさぎの繁殖性の高さにより、両者が共に豊穣のシンボルになったためという説明がなされることから、模様による結びつきは「形状」の類似、シンボルによる結びつきは「習性(動きのパターン)」や「機能(与える印象)」の類似といえる。庄司研究員は今回の研究で、前者を「静的類似性」、後者を「動的類似性」と命名。ただし人間には元々の文化的な偏りがあるため、月の模様とうさぎの形状の類似度を見積もるのは容易ではないとする。
-
月とうさぎが結びついた理由の概要図。月の海の模様がうさぎの形状と似ているからという考えと、定期的に現れるという両者の共通の習性によって、両者が共に豊穣のシンボルとなったためという考えが挙げられている(出所:ISAS Webサイト)
そこで庄司研究員は今回、OpenAIによって2021年に開発・公開されたAI「Contrastive Language-Image Pretraining(CLIP)」を用いて、異なる緯度で見た時の月の模様の向きが、“うさぎ”と“顔”のどちらに見えるかを判断させ分類を試み、月の模様の見え方と緯度との関係について考察したとする。なおCLIPは、未学習の物体カテゴリでも画像を判定できる特徴を持つAIだ。
月の見え方は、時刻や季節、見る場所の緯度によって変化する。これは、月を見る我々の視線の向きが変化するためだ。今回は、紀元前500年ごろの人々も、現代人と同じように夜の早い時間帯(午後8時)によく月を見ていたと仮定し、またうさぎの耳にあたる部分が低緯度地域において直立する1月の向きが用いられた。
-
1月と7月の異なる緯度と時刻における月の見え方。月のうさぎに関する最古の文献が編纂された時期である紀元前500年に合わせ、PC用オープンソースプラネタリウムソフト「Stellarium」を用いて作成されたもの。(c) NASA/JPL.(出所:ISAS Webサイト)
そして、海の領域やコントラストの異なるさまざまな画像を用いたテストの結果、低い緯度で観察される月の模様ほど“うさぎ”に、高い緯度での見え方ほど“顔”に見える傾向があることが判明。これは“月のうさぎ”に関する古い記録がインドや中国に、“月面に顔が見える”という古い記録が欧州に存在していることと整合的だという。またAIが月の模様を判断する際、模様の中心部分に注目する傾向があることも明らかにされた。
-
テストに用いた月の模様の画像。模様のパターンのみの影響を見るため(色の影響を除くため)、海領域やコントラストを変化させた白黒画像を使用。これらを1月の午後8時における各緯度の向きに回転させて、テストは実行された(出所:ISAS Webサイト)
-
異なる緯度における紀元前500年1月の午後8時における月の見え方と、CLIPによって判定された「うさぎ(rabbit)」と「顔(face)」の確率。色は確率が高い方を選んだ際にどこに注目したかが示されており、赤い領域ほど注目されている。月の向きはStellariumで計算された向きを参考に回転。色の図は、イスラエルのテルアビブ大学のhila-chefer大学院生らが開発したコードを使用して作成されたもの(出所:ISAS Webサイト)
次に、1000種類の物体を分類できるように訓練された公開データを用いて、月の模様がAIには何に見えるかの判定が行われた。上述のテストでCLIPが“うさぎ”と判定した画像に対し、今度はCLIPに加え、Microsoft Researchが開発した「Residual Network-50(ResNet-50)」、Google Researchが開発した「Vision Transformer(ViT)」と「Big Transfer(BiT)」と「Noisy Student」、Facebook AI Researchが開発した「Semi-Weakly Supervised Learning(SWSL)」と「ConvNeXt」の計7種類のAIが用いられた。すると、月の模様を“うさぎ”とみなす確率は、1000種類の中から選ばれた上位10種類の物体の確率と比べて非常に低く、基本的に月の模様はうさぎとみなされなかったという。ただし一部の画像に関しては、CLIPとConvNeXtが上位10種類に匹敵する確率で月を“うさぎ”と判断した。
-
CLIP(左)とConvNeXt(右)によって、比較的高い確率で「うさぎ」とみなされた月の画像と、1000種類のうち選ばれた上位10種類の物体およびその確率。各表の下にある「Rabbit」は月の画像を「うさぎ」とみなした確率。1000種類のカテゴリーはAIの物体認識のために準備された大規模画像セット「ImageNet-1K」で分類されたもの。「うさぎ」の確率はImageNet-1Kに含まれている「Angora」「hare」「wood_rabbit」という3種類のうさぎの確率を合計して計算された(出所:ISAS Webサイト)
庄司研究員はこの結果に対し、最新のAIであっても、月の模様のようなおぼろげなパターンの分類結果は、モデルによって変化することから、人間も月の模様をうさぎとみなしたのは、最初は一部の人だけだったのかもしれないとする。しかしAIと異なり、人間はコミュニケーションによって認識の伝達と変更が可能だ。AIでいえば、自分とは異なるモデルの結果を参考にして再学習を行うようなイメージであり、仮に最初は少数でも、“月のうさぎ”はコミュニケーションを通じて広まっていった可能性も考えられるという。もちろん、文化人類学でいわれているような両者の習性や機能、また他の要素(仏教の伝播など)も文化の形成には重要とした。また庄司研究員は、将来のAIは形状ではなく、動きや機能による分類が可能となるのか、さらにAIはシンボルを作れるのかということも提起している。