コードの「読みやすさ(可読性)」、LLMで評価できる?

深堀り解説
深堀り解説

本記事では、LLMがコードの読みやすさをどの程度評価できるのかについて取り上げます。

開発の現場ではコードの品質を見極める基準として「読みやすさ」は重要です。ただし、その評価は人によってばらつきがあり、基準があいまいです。

そこで、LLMによって読みやすさの評価ができるのではないか、という点が浮上しています。果たしてどれほど人間らしく評価可能なのでしょうか?詳しく見ていきましょう。

背景

いま現場ではLLMが生成したコードをそのままプロダクトに使う機会が増えています。コードの自動生成や補完、ドキュメントやテストコードの作成など、開発のさまざまな作業を助けてくれます。

こうしたコードが増えると、「本当にこのコードの品質は大丈夫か?」という疑問が重要になります。中でも注目されているのが、コードの読みやすさ(可読性)です。

読みやすいコードは他の開発者が理解しやすく、保守やレビューも進めやすい。逆に読みにくいコードは、新しくチームに加わった人が理解しづらくなり、リファクタリングやバグ修正、チーム内でのやりとりに支障をきたします。

ただ、この「読みやすさ」は人によって感じ方が違い、客観的に評価するのが難しいのが実情です。

それなら、人が直感的にコードを評価すればよいのでは?と思うかもしれません。実際、開発者自身がコードを読んで判断する方法が最も信頼できるとされています。ただし、この方法には大きなコストがかかります。時間もかかりますし、疲れたときには判断がぶれたり、評価する人によって意見が食い違ったりすることもあります。

そこでLLMをコードの評価者としても使うことが選択肢にあがります。LLMは人間のようにコードを「読んで」評価できる可能性があります。ただ、LLMが本当に人間と同じような基準で読みやすさを判断できるのか、とくに構造が特殊なコードにも対応できるのかは、まだはっきりしていません。

そこで本記事では、LLMが読みやすさの観点でコードを評価することも可能なのか?という点を深堀していきます。

PREMIUM

プレミアム会員限定の記事です

記事の購読には、アカウント作成後の決済が必要です。

  • ・全記事・論文コンテンツを無制限で閲覧可能
  • ・平日毎日更新、専門家による最新リサーチを配信

関連記事