「LLMのための日本語インストラクションデータ作成プロジェクト」のデータセットで学習したモデルが公開されました（2023年11月10日） | 革新知能統合研究センター

single.php

TOP ニュース「LLMのための日本語インストラクションデータ作成プロジェクト」のデータセットで学習したモデルが公開されました（2023年11月10日）

ニュース

TOP ニュース「LLMのための日本語インストラクションデータ作成プロジェクト」のデータセットで学習したモデルが公開されました（2023年11月10日）

template-parts/content-post.php

「LLMのための日本語インストラクションデータ作成プロジェクト」のデータセットで学習したモデルが公開されました（2023年11月10日）

2023/11/14 13:13

言語情報アクセス技術チームが作成した「LLMのための⽇本語インストラクションデータ作成プロジェクト」のデータセットを使って学習した大規模言語モデル（LLM）がストックマーク株式会社より公開されました。

「LLMのための⽇本語インストラクションデータ作成プロジェクト」はLLMの開発に非常に重要な大規模・高品質な「インストラクションデータ」を作るプロジェクトで、複数の企業と共同研究を行なっています。共同研究企業の一つであるストックマーク社は、同社が開発した130億パラメータのLLM「Stockmark-13b」を本プロジェクトのデータセットで学習したモデルを作成し、評価を行ったところ、既存のデータセットを用いるよりも、本プロジェクトのデータセットを用いる方が性能が高くなることを示し、このモデルの公開を行いました。

詳細はストックマーク株式会社のウエブサイトをご確認ください。

関連研究室

last updated on 2025/6/19 14:23研究室

言語情報アクセス技術チーム (2017/5ー2025/3)

ページトップヘスクロール