GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する

GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少　LLMは役割に応じて”正直さ”が変化する

本記事では、カーネギーメロン大学などの研究チームが開発した「AI-LIEDAR」というフレームワークを紹介します。 AI-LIEDARフレームワークは、LLMエージェントが目標達成と正直さの間でどのようにバランスを取るかを調査するために設計された手法です。研究チームは、60の現実的なシナリオ（正直であるべきか目標達成を優先すべきかのジレンマ）を作成し、複数のLLMを対象に実験を行いました。また、LLMエージェントの真実性を評価するための新しい手法も開発しました。参照論文情報タイトル：AI-LieDar: Examine the Trade-off Between Utility and …