LLMの「心の理論」能力を詳しく調べるベンチマーク『OpenToM』登場複数のLLMの評価結果も発表

LLMの「心の理論」能力を詳しく調べるベンチマーク『OpenToM』登場　複数のLLMの評価結果も発表

人間同士の円滑なコミュニケーションに不可欠なのが「相手の考えや心理状態を理解する」能力で、専門用語では「心の理論」と言います。そしてAIシステムが人と上手く関わるためには、この「心の理論」の能力が必要です。そこで研究者らは、高度な評価を可能にする指標「OpenToM」を開発しました。参照論文情報タイトル：OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models機関：King’s College London, Huawei…