お知らせ: 酷似サイトにご注意ください

rinnaがQwenの日本語継続事前学習モデル「Nekomata」シリーズを公開

掲載日 2023/12/21 12:04

著者：熊谷知泰

生成AI
LLM

rinnaは12月21日、アリババが公開したQwen 7Bおよび14Bを用いた日本語継続事前学習モデル「Nekomata」シリーズを開発し、Tongyi Qianwen LICENSE AGREEMENTで公開したことを発表した。

Nekomata 7Bおよび14Bは、70億パラメータのQwen 7Bと140億パラメータのQwen 14Bに対して、日本語と英語の学習データを用いてそれぞれ300億または660億トークンで継続事前学習したモデル。

Qwenのパフォーマンスは日本語でも引き継いでおり、日本語のタスクにおいて高い性能を確認しているという。日本語言語モデルの性能を評価するためのベンチマークの一つである「Stability-AI / lm-evaluation-harness」の9タスク平均スコアは、Nekomata 7Bが58.69、Nekomata 14Bが67.38だった。

日本語テキストの1byteに対するトークン数はLlama2およびYouriが0.40であるのに対し、QwenおよびNekomataでは0.24であり、推論効率が高い。なお、モデル名の由来は妖怪の「猫又（ねこまた）」。

ベンチマークStability-AI/lm-evaluation-harnessのスコア

Members+ 会員限定記事

転職ノウハウ

もっと見る

アクセスランキング

ランキングをもっと見る

もっと見る

編集部が選ぶ関連記事

生成AI
LLM

関連リンク

※本記事は掲載時点の情報であり、最新のものとは異なる場合があります。予めご了承ください。

新着記事

こちらも注目

このカテゴリーについて

開発/エンジニアシステムやソフトウェアの開発に携わるエンジニアに向けた最新情報など仕事に役立つ話題などを提供していきます。