LLMの「心の理論」能力を詳しく調べるベンチマーク『OpenToM』登場 複数のLLMの評価結果も発表

人間同士の円滑なコミュニケーションに不可欠なのが「相手の考えや心理状態を理解する」能力で、専門用語では「心の理論」と言います。そしてAIシステムが人と上手く関わるためには、この「心の理論」の能力が必要です。 そこで研究者らは、高度な評価を可能にする指標「OpenToM」を開発しました。 参照論文情報 タイトル:OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models機関:King’s College London, Huawei…