[研究の概要]
異なる文化的背景を持つ人々は、それぞれ異なるレンズを通して、世界を認識しています。特に色に関してはそれが顕著です。例えば、エスキモーは100種類の雪を区別しますが、他の人々にとっては単に「白いもの」にしか見えないかもしれません。このような認識の多様性は、長年にわたり科学者たちの興味を引きつけてきました。認知科学から人類学に至るまで、さまざまな分野にまたがってこの現象が研究されています。
現在、理研AIP医用機械知能チームでは、この問題に対して「人工知能(AI)が人間のように色の認識を発達させることができるか」という新たな視点から課題に取り組んでいます。この研究では、AIが言葉や情報を処理する際に使う『トークン化』という手法に、進化の仕組みを取り入れました。この研究は、次世代の大規模言語モデル(LLM)を開発するための基礎となる研究です。
*本研究は、コンピュータビジョン分野のトップカンファレンスである「International Conference on Computer Vision (ICCV 2023)」で口頭発表(採択率1.8%)されました。
―――色名は時代の変化に適合して増える
効率的なコミュニケーションの必要性から、人間の言語は時とともに進化し、その中で新しい色名を含むようになります。図1に示すように、World Colour Survey(世界色彩調査)と呼ばれる研究では、世界中の110の異なる言語の話者からデータを収集しました。図1に見られるように、ガーナ北西部のナファンラ語では、1978年には3つだった色の語彙が、現代社会に対応して2018年には10に増えています。
―――AIも人間と同じように色の名前を独自に進化できるのか
AIも同様の進化を遂げることができるのでしょうか?医用機械知能チームは、その解明に乗り出しました。図2に示されているように、2563段階の色を、わずか数色に減らしつつ、正確に認識できる方法を開発しました。驚くべきことに、この方法を用いることで、わずか2色しか使わないにもかかわらず、CIFAR100というデータセットで50.6%という高い認識精度を達成しました。
このAIシステムで観察された複雑さと正確さのトレードオフは、言語学の研究で発見されたパターンと一致しました。図3に示されているように、AIの色カテゴリの進化(b)は、人間の言語(a)で観察されたものと類似しています。
このシステムを1978年のナファンラ語の3色システムに導入したところ、AIは自動的に4番目の色を生成しました。この色は黄緑に近く、言語の進化で観察される一般的なパターンに一致しました。BerlinとKayは、色の名前は文化の違いを超えた普遍的な制約があり、新しい基本的な色の名前は順序に従って獲得されると主張しました。例えば、ナファンラ語では、光を表す「fiNge」、暗さを表す「wOO」、そして暖かい色や赤みがかった色を表す「nyiE」という3つの色の言葉があります。BerlinとKayの研究によれば、次に進化して得られる色は、黄または緑であるべきであり、このAIシステムが導き出した結果(図3(e))と一致しています。
―――今後の展望
この問題を解明することは、現在、英語や日本語など特定の言語に依存している大規模言語モデル(LLM)にとって、興味深い可能性を秘めています。本システムを採用することで、AIは人間の言語に依存しない最適化された言語システムを開発することができる可能性があります。
この研究は単に色に関するものではなく、AIがどのように学び、人間の認知を反映する形で進化できるかを理解することに関するものであり、将来のより効果的で適応性の高い技術の開発につながるものです。
- 論文情報
ジャーナル名:Proceedings of IEEE/CVF International Conference on Computer Vision
論文名: Name Your Colour For the Task: Artificially Discover Colour Naming via Colour Quantisation Transformer
著者 Shenghan Su, Lin Gu(※責任著者)、Yue Yang, Zenghui Zhang、原田達也