OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果

OpenAI o3-miniの安全機能に関する大規模検証　1万件超のテスト結果　

本記事では、OpenAIの新しい言語モデル「o3-mini」の安全性評価に関する研究を紹介します。 2025年初頭、OpenAIは一般公開に先立ち、o3-miniの安全性テストのための早期アクセスプログラムを実施しました。今回スペインの研究チームによって実施された1万件を超えるテストの結果から、o3-miniの安全性能力や、実用化に向けた課題が明らかにされています。発表者情報研究者：Aitor Arrieta et al. 研究機関：モンドラゴン大学、セビリア大学論文情報詳細は記事の下部に記載されています。本記事の関連研究 LLMに対するオープンソース安全性評価ツールの比較 Open…