大規模言語モデル（LLM）のこれまでとこれから②　-モデル構築編-

2024.02.152025.03.08

深堀り解説

本記事では、LLM研究全体の背景と現状、そして将来展望を網羅的に整理する調査論文をもとに、LLMの基礎を振り返ります。前回は、代表的なモデルについて深掘りしました。

前回の記事：大規模言語モデル（LLM）のこれまでとこれから①　-代表的なモデル編-

今回は、モデルの構築について深掘りします。

参照論文情報

タイトル：Large Language Models: A Survey

著者：Shervin Minaee, Tomas Mikolov, Narjes Nikzad, Meysam Chenaghlu, Richard Socher, Xavier Amatriain, Jianfeng Gao

所属：論文には所属機関が示されていないため各機関から有志の研究グループが結成されたことが推測されます。

URL：https://doi.org/10.48550/arXiv.2402.06196

前回のおさらい

前回は、LLMの登場に至るまでの経緯と代表的なモデルについて触れました。主に以下のような内容です。

初期のニューラル言語モデルが現代の高度なモデル（GPT、LLaMA、PaLMなど）に進化した

トランスフォーマーモデルの採用が言語理解・生成能力の向上につながった

数十億のパラメータを持つモデルが出現し、精度が飛躍的に向上した

LLMにおいては事前学習、微調整、および人間のフィードバックによる強化方法が注目されている

大規模なモデルになったことで、新たなタスクへの適応能力や指示に従う能力など、旧来には見られない能力が発現した

オープンソースモデルが登場し、分野の進歩に貢献している

上記の続き（あるいは独立したコンテンツ）として、以下では「モデルの構築」に焦点を当てています。LLMに一般的に使用されている構造を再確認し、データ準備やトークン化、事前学習、命令文の調整、そしてアライメントまでのデータ処理やモデリング技術について説明します。フローで示すと、

PREMIUM

プレミアム会員限定の記事です

記事の購読には、アカウント作成後の決済が必要です。

・全記事・論文コンテンツを無制限で閲覧可能
・平日毎日更新、専門家による最新リサーチを配信

まずはアカウントを作成

ログイン

プレミアム会員について

関連記事

深堀り解説

MRIデータから音声を合成する手法　UCバークレーなどが開発

2023.07.182025.03.08

深堀り解説

タスクに応じてロールプレイさせるとChatGPTなどLLMの推論能力は普遍的に向上する

2023.08.182025.04.18

深堀り解説

LLMを「イノベーション」に活かす　応用可能性と戦略、倫理面

2025.11.212025.11.28

深堀り解説

「LLM活用で文書作成」社会でどこまで導入されている

2025.02.192025.03.08

深堀り解説

LLMによるプロンプトの書き直しは本当に実用的　実際の会話データ数百万件をもとに得られた7つの知見

2025.04.012025.04.02

深堀り解説

ファインチューニングがLLMの幻覚（ハルシネーション）に与える影響　Googleなどによる検証結果

2024.05.222025.03.08

Copyright © Parks, Inc. All rights reserved.