TOP ナレッジ Meta社が開発した大規模言語モデル「Llama3」とは? 実際に使ってみた!

knowledgeナレッジ

Meta社が開発した大規模言語モデル「Llama3」とは? 実際に使ってみた!

May 02, 2024

  • AI
  • Share

Meta社は2024年4月18日、オープンソース大規模言語モデル「Llama」シリーズの最新版となる「Llama3」を発表しました。Llama3は「8B」と「70B」という2つのモデルが公開されており、70Bモデルは、ChatGPT-3.5やClaude 3 Sonnetを超える性能を有していることで話題です。

今回の記事ではLlama3の特徴や強みの紹介をしたあと、実際にテキストを生成してみました。ぜひ最後までご覧ください。

『Llama3』とは

Llama3には「8B」と「70B」というモデルが存在します。1つずつ特徴を見ていきましょう。

Llama3 8B

Llama3 8Bは、80億のパラメータを持つ比較的コンパクトなモデルです。パラメータとは、機械学習モデルの中で調整可能な変数のことを指します。パラメータの数が多いほど、言語モデルはより複雑な言語の特徴を学習できますが、同時に学習に必要な計算リソースも増大します。

Llama3 8Bは、限られたパラメータ数の中で効率的に言語の特徴を学習し「限られたパラメータ数の中で高い性能を実現している」という点が特徴的です。

Llama3 70B

Llama3 70Bは、700億のパラメータを持つ大規模言語モデルです。

引用元:https://ai.meta.com/blog/meta-llama-3/?utm_source=twitter&utm_medium=organic_social&utm_content=video&utm_campaign=llama3

上記の図を見ると、オープンソースのLLMでありながら、OpenAI社の「GPT-3.5」や、Anthropic社の「Claude Sonnet」よりも高い数値を出していることがわかります。

ちなみに「オープンソースのLLM」というのは、ソフトウェアの設計図にあたるソースコードを公開しているLLMのことです。LLMをオープンソース化するということは「レシピを公開するようなもの」で、そのレシピを使えば、誰でも同じような性能のLLMを作れます。さらに、レシピを工夫することで「オリジナルのLLM」を作ることもできるのです。

オープンソースのLLMは、企業や研究機関だけでなく、個人の開発者やスタートアップなども利用可能。オープンソースでありながら高性能を実現しているLlama3の登場は、LLM技術の普及を加速させ、新しいアイデアやイノベーションが生まれやすくなるでしょう。

Llama3の利用方法

Llama3は、Meta社が提供している「Meta AI」を介して利用できますが、現時点(2024年5月)ではアメリカのみでの提供となっています。ただ、Llama3はクラウドAIプラットフォームの「Groq」を通じて利用可能です。Groqは簡単なアカウント登録をするだけで無料で利用できます。

Groqに関して詳しく知りたい方は、こちらの記事をご覧ください。

Llama3で実際にテキストを生成してみた

GroqでLlama3を利用したい場合は、Groqにアカウント登録後、画面右上の言語モデル選択欄にて「Llama3-70b-8192」を選択してください。

引用元:https://groq.com/

言語モデル選択が終わったら「Message」欄にテキストを入力しましょう。ちなみにLlama3は、日本語でプロンプトを入力したとしても、英語で回答することが多いため「回答は必ず日本語でしてください」などと指示をするのがおすすめです。

では早速、下記プロンプトを入力してみました。

プロンプト「人工知能が社会に与える影響について、500字程度の小論文を書いてください」

回答は下記画像のとおりです。

おそらくLlama3は日本語に最適化されていないため、句読点が多すぎる点がやや気になります。ただ、回答の内容や指示どおりの文字数(回答は541文字)など、出力内容に大きな問題はないでしょう。

試しに無料版のChatGPTにも同じ質問を投げかけてみました。
回答は下記になります。

文章レベルは「Llama3と大差がない」という印象を受けました。ただ、文字数が「651文字」と、大きくオーバー。指示どおりの出力という点では、Llama3に軍配が上がるといえるでしょう

では次に、引っ掛け問題を出題してみます。入力するプロンプトは下記です。

プロンプト「あなたは徒競走のゴール直前で4位の人を追い抜きました。結果は何位ですか?」

Llama3の回答は下記になります。

「結果は3位」と回答していますが、正しくは4位ですので間違っています。無料版のChatGPTにも同じ質問を投げかけてみましょう。

ChatGPTも間違っています。人間も引っかかりやすい問題ではありますが、Llama3も無料版のChatGPTも1度の質問では理解できないようです。

ただ、この回答を受けて下記のプロンプトを入力してみたところ、興味深い回答が返ってきました。

プロンプト「その回答は間違っています。冷静に回答してみてください。」

Llama3の回答とChatGPTの回答は下記です。

Llama3の回答
ChatGPTの回答

追加で質問をしてみると、回答に明らかな差が出てしまいました。Llama3は正解を導き出したのに対して、ChatGPTは間違った回答をしています。

次にLlama3が本当に理解しているのか調べるために、追加で下記プロンプトを入力してみました。

プロンプト「4位を追い抜いたら結果は4位になった。理由を説明できますか?」

回答は下記になります。

しっかりと理由も回答してくれました。最初の回答では間違えたものの、追加の質問を行うことで正解を導き出せるようです。

筆者自身、上記のテスト以外でもいろいろ触ってみましたが、無料版のChatGPTよりもLlama3のほうが高性能だと感じました。オープンソースのLLMでこれだけの性能を誇るLlama3は、今後さまざまな企業に活用されるでしょう

今後のLlama3の進化に期待

今回の記事ではMeta社が発表したLlama3の特徴や、使用レビューなどを紹介しました。オープンソースの大規模言語モデルとしては、圧倒的な性能を誇るといえるのではないでしょうか?

ちなみにMeta社は「Llama3 400B」の公開を予定しています。下記図表を見ると、かなりの性能を有していることがわかります。

またLlama3 400Bモデルでは、マルチモーダル対応や多言語化など、さらなる進化が予定されているため、オープンソースLLMとしては革命的な性能になるでしょう。Meta社の今後に注目です。

株式会社ロゼッタではこの「Llama3」70B / 8B を搭載した専門文書AI「Metareal AI LLM 2」発表いたしました。ご興味のある方はぜひお問い合わせください。

AIメディアライター

製薬業界で生成AIを活用する「ラクヤクAI」
このように今後の活用が期待される生成AIですが、中でも注目を集めるのが製薬分野です。

「ラクヤクAI」は、治験関係書類や添付文書といった社内外の膨大なデータを活用し
製薬事業のあらゆるシーンを効率化する専門文書AIサービスです。
基礎研究から製造販売後調査まで、多岐に渡る製薬業務の中で取り扱われる
様々な文書の作成・チェック作業を自動化し、圧倒的な業務スピード改善を実現します。

「ラクヤクAI」ご活用シーン(例):
■ 治験関連文書やプロモーション資料の自動生成
■ 作成資料のクオリティチェックや、資料間の整合性チェック
■ 講演内容(資料・音声)の適用外表現モニタリング
■ 薬剤情報やナレッジの検索・調査
その他、個別カスタマイズが可能な生成AI環境で、
社内の知見を統合的に分析・集約したアウトプットをセキュアな環境をご提供します。

  • Share
一覧へ