MetaのLLM(大規模言語モデル)「Llama」著作権訴訟で、トレーニングデータに海賊版の電子書籍や記事を使うことを、共同創業者兼CEOのMark Zuckerberg(マーク・ザッカーバーグ)氏が認めていたという。

LibGenの利用を承認か

1月8日付でカリフォルニア北部地区連邦地方裁判所に提出された書類から明らかになった。この訴訟は、Metaが著作権のある作品をトレーニングに利用していることは著作権侵害に当たるとして、2023年に作家らが同社を提訴したもの。

原告には、Sarah Silverman氏、Ta-Nehisi Coates氏らが名を連ねている。Metaはこの訴えに対し、フェアユースに当たると主張している。

新たな書類からは、ザッカーバーグ氏がLibGen(Library Genesis)を利用することを承認していたことが明らかになった。LibGenはMacmillan Learning、McGraw Hill、Pearson Educationなどの出版社の作品にアクセスできるサービス。LibGenは過去に数回提訴されており、著作権侵害の罰金と閉鎖を命じられている。

ザッカーバーグ氏は、LibGenの利用についてAIチームの幹部らの懸念の声があったにも関わらず、少なくとも1つのLlamaモデルのトレーニングに用いたという。

Metaの従業員は「海賊版データセット」と呼び、その使用が規制当局との交渉においてMetaの立場を損なう可能性があると警告していたという。