2023/11/14 13:13

言語情報アクセス技術チームが作成した「LLMのための⽇本語インストラクションデータ作成プロジェクト」のデータセットを使って学習した大規模言語モデル(LLM)がストックマーク株式会社より公開されました。

「LLMのための⽇本語インストラクションデータ作成プロジェクト」はLLMの開発に非常に重要な大規模・高品質な「インストラクションデータ」を作るプロジェクトで、複数の企業と共同研究を行なっています。共同研究企業の一つであるストックマーク社は、同社が開発した130億パラメータのLLM「Stockmark-13b」を本プロジェクトのデータセットで学習したモデルを作成し、評価を行ったところ、既存のデータセットを用いるよりも、本プロジェクトのデータセットを用いる方が性能が高くなることを示し、このモデルの公開を行いました。

詳細はストックマーク株式会社のウエブサイトをご確認ください。

関連研究室

last updated on 2023/11/10 14:04研究室