OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果 

本記事では、OpenAIの新しい言語モデル「o3-mini」の安全性評価に関する研究を紹介します。 2025年初頭、OpenAIは一般公開に先立ち、o3-miniの安全性テストのための早期アクセスプログラムを実施しました。 今回スペインの研究チームによって実施された1万件を超えるテストの結果から、o3-miniの安全性能力や、実用化に向けた課題が明らかにされています。 発表者情報 研究者:Aitor Arrieta et al. 研究機関:モンドラゴン大学、セビリア大学 論文情報詳細は記事の下部に記載されています。 本記事の関連研究 LLMに対するオープンソース安全性評価ツールの比較 Open…