Meta(旧Facebook)がAIモデルのトレーニングに、FacebookやInstagramなど公開されている投稿を使用していたことを認めた。Metaは9月28日、生成AIベースのアシスタント「Meta AI」を発表した。Instagram、Messenger、WhatsAppなどの同社のサービスで実装され、ユーザーは対話形式で操作ができる。
Meta AIは、Metaがオープンソースとして公開するLLM(大規模言語モデル)「Llama 2」などをベースにしたカスタムモデルを採用しているほか、テキストから画像を生成できる「Emu」も利用する。
Meta AIのトレーニングに使われたデータについて、同社の国際問題担当プレジデント、Nick Clegg氏は、その多くは公開されている投稿を使用したとReutersにコメントしている。
データはテキストと写真の両方を含むという。プライバシーを尊重するため、非公開の投稿はトレーニングに用いなかったことも明かしている。また、個人情報が多いLinkedInについても、トレーニングのデータから除外したとのことだ。
このところ「ChatGPT」のOpenAI、Googleなどが情報の要約、イメージ生成のために膨大なデータをインターネットから収集して自分たちのAIモデルのトレーニングに利用していることが問題になっており、訴訟に発展しているものもある。
Clegg氏は、Meta AIが生成するコンテンツには安全上の制限を設けていることを強調している。