IBMから日本語対応の商用可能オープンソースLLM「GRANITE 3.0」公開 8Bから

2024.10.23
深堀り解説
深堀り解説

本記事では、IBMが新たに開発した軽量なLLM「Granite」について紹介します。近年、企業が自社サーバーで安全にLLMを運用したいというニーズが高まっていますが、データの透明性やライセンスの制約など、多くの課題が存在していました。Graniteは、これらの課題を解決しつつ、限られたコンピューターリソースでも動作する実用的なモデルとして注目を集める可能性が高いです。

参照論文情報

  • タイトル:GRANITE 3.0 LANGUAGE MODELS
  • 著者:Granite Team
  • 所属:IBM

背景

LLMは様々な用途で急速に普及しています。LLMの使い方としてはウェブサイトやAPIを通じて利用するのが最も一般的ですが、企業によっては自社のサーバー内で動かしたいというニーズがあります。

しかし、LLMを企業で利用するには大きく3つの課題があります。まず、小規模なハードウェアでも動作する軽量なモデルが必要です。

次に、企業利用の場合、学習に使用したデータの出所や処理方法が明確である必要があります。法的・コンプライアンス上の問題を避けるために重要な要素です。また、既存のモデルには特定の用途に使用できないなどのライセンス制約があることがあり、企業のユースケースによっては使用できない場合があります。

そこで、IBMはGraniteを開発しました。Graniteは複数の言語に対応し、優れたプログラミング能力や推論能力を持ちます。さらに、限られたコンピューターリソースでも動作するように設計されています。

また、すべてのモデルはApache 2.0ライセンスで公開されており、研究目的でも商用目的でも利用可能です。企業での利用を想定して、データのキュレーションや学習プロセスにも十分な配慮がなされています。

以下で詳しく紹介します。

PREMIUM

プレミアム会員限定の記事です

記事の購読には、アカウント作成後の決済が必要です。

  • ・全記事・論文コンテンツを無制限で閲覧可能
  • ・平日毎日更新、専門家による最新リサーチを配信

関連記事