TOP ナレッジ GPT-4oとClaude3 Opusを徹底比較!どちらを使うべき?

knowledgeナレッジ

GPT-4oとClaude3 Opusを徹底比較!どちらを使うべき?

June 17, 2024

  • AI
  • Share

2024年5月、OpenAI社がChatGPT最新モデルの「GPT-4o(オムニ)」を発表。従来のモデルよりも性能は向上し、全世界で話題となりました。

ただ、対話型生成AIはGPT-4oだけではありません。

「話題になっているけど、他のモデルと比較したらどうなの?」

上記の疑問をお持ちの方も多いでしょう。

今回の記事では、GPT-4oとClaude3 Opusを仕事でフル活用している筆者が徹底比較します。ぜひ最後まで記事をご覧ください。

GPT-4o・Claude3 Opusとは?

両者の性能比較の前に、GPT4oとClaude3 Opusの概要を解説します。

GPT-4oとは

GPT-4oは、OpenAIが開発した最先端の対話型AIモデルです。名称の「o」は「オムニ(Omni)」からきていて、テキスト・音声・画像・映像をシームレスに扱えることを意味しています。

GPT-4oは、従来のGPT-4モデルを基に、応答速度と精度を大幅に向上させたモデルです。複雑なタスクをより自然に処理し、多言語対応や感情理解などの機能が強化されています。

Claude3 Opusとは

Claude3 Opusとは、Anthropic社が2024年3月にサービスを開始したLLM(大規模言語モデル)「Claude3」シリーズの最上位モデルです。マルチモーダル入力に対応しており、テキストや画像など、異なるデータ入力を同時に使って情報処理できます。

Claude3 Opusの特徴はなんといっても日本語の生成能力。これまで生成AIで作成された文章は、どこか「AIっぽさ」が抜けなかったのですが、Claude3 Opusは自然な日本語を生成してくれます。

GPT-4o・Claude3 Opusの料金比較

現時点(2024年6月)の料金は、下記のとおりです。

GPT-4o無料プラン
Plusプラン:月額20ドル
Teamプラン:月額25ドル/人
Claude3 OpusProプラン:月額20ドル
Teamプラン:月額30ドル/人(最低でも5人以上の加入が必要)

両者ともにChatGPTとClaude3の最上位モデルです。Claude3 Opusは有料プランに加入しないと使用できないのですが(下位モデルは無料で使用可能)、GPT-4oは無料プランでも使用可能です。

コストパフォーマンスという点では、GPT-4oが優れているといえるでしょう。

ただ、ChatGPT無料プランでは、GPT-4oの使用回数の制限が厳しかったり、画像生成ができなかったり、制限は厳しくなります。
GPT-4oをフル活用するためには、有料プランに加入しないと難しいでしょう。

 GPT-4o・Claude3 Opusの性能を比較

ここではGPT-4oとClaude3 Opusの性能を、下記の項目で比較していきます。

  • 基本性能の比較
  • 学習期間の比較
  • テキスト生成の比較
  • 理解力の比較
  • 画像認識の比較

基本性能の比較

https://x.com/sama/status/1790066003113607626

上記の画像は「Chatbot Arena」という、生成AIモデルの出力比較をするサービスの比較結果です。

上記の表の一番左側がGPT-4oで、他の生成AIモデルと比べても明らかに性能が高いことがわかります。ちなみにClaude3 Opusは、左から5番目に位置しています。

また、ChatGPTは画像生成や動画生成、音声出入力が可能ですが、Claude3 Opusはいずれも非対応です。※画像生成や動画生成は、ChatGPT内でサードパーティ製の生成AIモデルを使う必要があります。

基本的な性能はGPT-4oが圧倒的といえるでしょう。

学習期間の比較

次に、学習期間の比較を行います。両モデルに下記の質問をしてみました。

あなたはいつまでの情報を学習していますか?

回答は下記のとおりです

GPT-4o2023年9月までの情報に基づいています。
Claude3 Opus私の知識ベースは2023年8月まで更新されています。

情報の鮮度はGPT-4oに軍配が上がりますが、ほとんど差はないといえるでしょう。

ちなみに、2023年の◯月までの情報を学習しているとはいっても、学習期間終盤の情報などは曖昧なことも多く、不正確な回答をすることが多々あります。情報の正誤は必ずチェックしましょう。

テキスト生成の比較

次にテキスト生成の比較を行います。両モデルに下記の質問をしてみました。

未来の都市を舞台にした短編小説の冒頭部分を250文字以上300文字以内で書いてください。

両者の回答結果は、下記の画像のとおりです。

GPT-4oの回答(332文字)
Claude3 Opusの回答(317文字)

両者の文章を見比べてみて、あなたはどう感じましたか?

筆者の個人的な感想ですが、Claude3 Opusが作成した物語のほうが文章としては整っていて、ストーリーも引き込まれました。ちなみに“250文字以上、300文字以内で”と指示したにも関わらず、 どちらも文字数をオーバーしていました。

筆者はプロのライターとして活動していますが、両モデルを仕事でフル活用しています。ただ、文章としてより違和感が少ないClaude3 Opusを利用する頻度が高いです。

また、文字数の指定などもGPT-4oは少なく見積もることが多いです。例えば「3,000文字以上で執筆してください」と頼んでも、1,700文字程度と少なく出力されることが多々あります。

テキスト生成にかかる時間も両モデルで大差はなく、テキスト生成という点ではClaude3 Opusに軍配が上がるといえるでしょう。

理解力の比較

次に理解力の比較を行います。生成AIモデルは「引っかけ問題」などに引っかかりやすい傾向があり、性能が低くなればなるほどその傾向は顕著になります。

ここでは両モデルに下記の質問をしてみました。

あなたは徒競走で4位の人を抜いた直後にゴールしました。結果、あなたは何位でしたか?

ちなみに上記の問題の正解は「4位」です。(4位の人を追い抜かして自らが4位になった状態でゴールしたことになるため。)

両モデルの解答は下記になります。

GPT-4o
Claude3 Opus

GPT-4oは的確に正解を言い当てていますが、Claude3 Opusは間違った解答をしています。

上記の例のほかにも、筆者が仕事で両モデルを使っているとき、GPT-4oよりもClaude3 Opusのほうが理解力は低く感じます。

日本語の理解力という点では、GPT-4oに軍配が上がるといえるでしょう。

画像認識の比較

次に画像認識の比較です。両モデルに下記画像を添付し、下記プロンプトを入力しました。

引用元:いらすとや

このイラスト内では、誰が何をしていますか?文章で説明してください。

両モデルの回答は下記のとおりです。

GPT-4o
Claude3 Opus

非常に興味深い回答結果がでました。GPT-4oは動物を正確に言い当て、正確に描写を説明しています。おそらくネコが手に持っているのはパーティホーンではなくグラスでしょうが、それ以外はかなり正確です。

一方で、Claude3 Opusは大きな間違いがいくつもあります。4匹の動物を3匹といったり、いるはずのないウサギを言い当てたり、正確性には乏しいといえます。

画像認識の正確さではGPT-4oが圧倒的といえるでしょう。

まとめ

今回の記事では、GPT-4oとClaude3 Opusの違いや機能を徹底比較しました。

ほとんどの性能でがClaude3 Opusを上回っているという結果がわかったと思います。

ただ、生成AIモデルには得意、不得意があります。実際に、テキスト生成においてはClaude3 Opusのほうが使い勝手がよく、筆者が仕事で使うことが多いのもClaude3 Opusです。

近年、生成AIモデルのレベルはかなり向上しています。日常生活やビジネスで実際に使ってみて初めて「自分に合った生成AIモデル」がわかることも多いでしょう。

ぜひ両モデルを実際に試してみてくださいね!

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

専門文書 AIソリューション「ドキュサポ AI-4OO」
このように今後の活用が期待される生成AIを使って、
御社専用の文書の自動作成・チェックできるシステムが構築可能です。

「ドキュサポ AI-4OO」は、御社内のあらゆる文書やデータ、社外の業界の専門文書などを取り込み
文書の自動作成、文書チェック、ナレッジの検索などを可能にする御社専用の生成AIシステムです。
御社の文書の特徴や専門用語などを元に構築するため、高精度のアウトプットを実現します。

「ドキュサポ AI-4OO」ご活用シーン(例):
■ 社内で必要な文書や資料の自動生成
■ 作成資料のクオリティチェックや、資料間の整合性チェック
■ 社内外の情報やナレッジの検索・調査
その他、個別カスタマイズが可能な生成AI環境で、
社内の知見を統合的に分析・集約したアウトプットをセキュアな環境をご提供します。

  • Share
一覧へ