2026/3/10 19:17
東京大学先端科学技術研究センター/理研AIP 医用機械知能チームの安道健一郎特別研究員、黒瀬優介客員研究員、原田達也チームディレクターらによる研究グループは、142億パラメータを持つオープンな日本語に特化した医療用マルチモーダルモデルを開発しました。
日本語医療マルチモーダルモデルの訓練には、大量の医療画像と日本語テキストのペアデータセットの構築が課題となります。本研究では、モデル構築における最大の障壁である訓練データ不足を補うため、英語データを加工して約1,200万件の日本語医療学習データを作成しました。さらに、性能向上のために思考連鎖形式のデータを導入し、推論過程を明示的に出力できるモデルを構築しました。
また、本研究で作成した合成データは、生成物の利用が制限されるChatGPT等の大規模言語モデルを用いていないため、本モデルはオープンに利用可能です。開発したモデルは、利用制限のあるデータを用いない既存モデルと比較して高い性能を示しており、本研究成果は今後、日本語を用いたマルチモーダル医療AIモデルの基盤として幅広く活用されることが期待されます。
詳細は東京大学 先端科学技術研究センターのホームページをご覧ください。

