ChatGPTで実際に行われた約151万件の対話を含むデータセット『WildChat』登場

2023.10.17
深堀り解説
深堀り解説

OpenAIのAPIを使用した毒性評価では、ユーザー発話の10.82%に毒性(程度はさまざま)が含まれていたとのことです。
なおユーザー数は約16.8万人と推定されています。

@ ICLR 2024 Submission authors, “(InThe)WildChat: 570K ChatGPT Interaction Logs In The Wild

ChatGPTが登場してから幾ばくかの年月が経過していますが、膨大な対話データを一括で分析するための基盤はまだ公開されておらず、登場が待たれています。

そこで研究者らは実際に行われた対話をデータセット『WildChat』として作成し、また毒性評価も行いました。

本稿は論文の簡単な紹介記事です。

データの収集方法

データの収集方法に関する特徴は以下の3つです。

PREMIUM

プレミアム会員限定の記事です

記事の購読には、アカウント作成後の決済が必要です。

  • ・全記事・論文コンテンツを無制限で閲覧可能
  • ・平日毎日更新、専門家による最新リサーチを配信

関連記事