2024年5月、OpenAI社がChatGPT最新モデルの「GPT-4o(オムニ)」を発表。従来のモデルよりも性能は向上し、全世界で話題となりました。
ただ、対話型生成AIはGPT-4oだけではありません。
「話題になっているけど、他のモデルと比較したらどうなの?」
上記の疑問をお持ちの方も多いでしょう。
今回の記事では、GPT-4oとClaude3 Opusを仕事でフル活用している筆者が徹底比較します。ぜひ最後まで記事をご覧ください。
GPT-4o・Claude3 Opusとは?
両者の性能比較の前に、GPT4oとClaude3 Opusの概要を解説します。
GPT-4oとは
GPT-4oは、OpenAIが開発した最先端の対話型AIモデルです。名称の「o」は「オムニ(Omni)」からきていて、テキスト・音声・画像・映像をシームレスに扱えることを意味しています。
GPT-4oは、従来のGPT-4モデルを基に、応答速度と精度を大幅に向上させたモデルです。複雑なタスクをより自然に処理し、多言語対応や感情理解などの機能が強化されています。
Claude3 Opusとは
Claude3 Opusとは、Anthropic社が2024年3月にサービスを開始したLLM(大規模言語モデル)「Claude3」シリーズの最上位モデルです。マルチモーダル入力に対応しており、テキストや画像など、異なるデータ入力を同時に使って情報処理できます。
Claude3 Opusの特徴はなんといっても日本語の生成能力。これまで生成AIで作成された文章は、どこか「AIっぽさ」が抜けなかったのですが、Claude3 Opusは自然な日本語を生成してくれます。
GPT-4o・Claude3 Opusの料金比較
現時点(2024年6月)の料金は、下記のとおりです。
GPT-4o | 無料プラン Plusプラン:月額20ドル Teamプラン:月額25ドル/人 |
Claude3 Opus | Proプラン:月額20ドル Teamプラン:月額30ドル/人(最低でも5人以上の加入が必要) |
両者ともにChatGPTとClaude3の最上位モデルです。Claude3 Opusは有料プランに加入しないと使用できないのですが(下位モデルは無料で使用可能)、GPT-4oは無料プランでも使用可能です。
コストパフォーマンスという点では、GPT-4oが優れているといえるでしょう。
ただ、ChatGPT無料プランでは、GPT-4oの使用回数の制限が厳しかったり、画像生成ができなかったり、制限は厳しくなります。
GPT-4oをフル活用するためには、有料プランに加入しないと難しいでしょう。
GPT-4o・Claude3 Opusの性能を比較
ここではGPT-4oとClaude3 Opusの性能を、下記の項目で比較していきます。
- 基本性能の比較
- 学習期間の比較
- テキスト生成の比較
- 理解力の比較
- 画像認識の比較
基本性能の比較
https://x.com/sama/status/1790066003113607626
上記の画像は「Chatbot Arena」という、生成AIモデルの出力比較をするサービスの比較結果です。
上記の表の一番左側がGPT-4oで、他の生成AIモデルと比べても明らかに性能が高いことがわかります。ちなみにClaude3 Opusは、左から5番目に位置しています。
また、ChatGPTは画像生成や動画生成、音声出入力が可能ですが、Claude3 Opusはいずれも非対応です。※画像生成や動画生成は、ChatGPT内でサードパーティ製の生成AIモデルを使う必要があります。
基本的な性能はGPT-4oが圧倒的といえるでしょう。
学習期間の比較
次に、学習期間の比較を行います。両モデルに下記の質問をしてみました。
あなたはいつまでの情報を学習していますか?
回答は下記のとおりです
GPT-4o | 2023年9月までの情報に基づいています。 |
Claude3 Opus | 私の知識ベースは2023年8月まで更新されています。 |
情報の鮮度はGPT-4oに軍配が上がりますが、ほとんど差はないといえるでしょう。
ちなみに、2023年の◯月までの情報を学習しているとはいっても、学習期間終盤の情報などは曖昧なことも多く、不正確な回答をすることが多々あります。情報の正誤は必ずチェックしましょう。
テキスト生成の比較
次にテキスト生成の比較を行います。両モデルに下記の質問をしてみました。
未来の都市を舞台にした短編小説の冒頭部分を250文字以上300文字以内で書いてください。
両者の回答結果は、下記の画像のとおりです。
両者の文章を見比べてみて、あなたはどう感じましたか?
筆者の個人的な感想ですが、Claude3 Opusが作成した物語のほうが文章としては整っていて、ストーリーも引き込まれました。ちなみに“250文字以上、300文字以内で”と指示したにも関わらず、 どちらも文字数をオーバーしていました。
筆者はプロのライターとして活動していますが、両モデルを仕事でフル活用しています。ただ、文章としてより違和感が少ないClaude3 Opusを利用する頻度が高いです。
また、文字数の指定などもGPT-4oは少なく見積もることが多いです。例えば「3,000文字以上で執筆してください」と頼んでも、1,700文字程度と少なく出力されることが多々あります。
テキスト生成にかかる時間も両モデルで大差はなく、テキスト生成という点ではClaude3 Opusに軍配が上がるといえるでしょう。
理解力の比較
次に理解力の比較を行います。生成AIモデルは「引っかけ問題」などに引っかかりやすい傾向があり、性能が低くなればなるほどその傾向は顕著になります。
ここでは両モデルに下記の質問をしてみました。
あなたは徒競走で4位の人を抜いた直後にゴールしました。結果、あなたは何位でしたか?
ちなみに上記の問題の正解は「4位」です。(4位の人を追い抜かして自らが4位になった状態でゴールしたことになるため。)
両モデルの解答は下記になります。
GPT-4oは的確に正解を言い当てていますが、Claude3 Opusは間違った解答をしています。
上記の例のほかにも、筆者が仕事で両モデルを使っているとき、GPT-4oよりもClaude3 Opusのほうが理解力は低く感じます。
日本語の理解力という点では、GPT-4oに軍配が上がるといえるでしょう。
画像認識の比較
次に画像認識の比較です。両モデルに下記画像を添付し、下記プロンプトを入力しました。
このイラスト内では、誰が何をしていますか?文章で説明してください。
両モデルの回答は下記のとおりです。
非常に興味深い回答結果がでました。GPT-4oは動物を正確に言い当て、正確に描写を説明しています。おそらくネコが手に持っているのはパーティホーンではなくグラスでしょうが、それ以外はかなり正確です。
一方で、Claude3 Opusは大きな間違いがいくつもあります。4匹の動物を3匹といったり、いるはずのないウサギを言い当てたり、正確性には乏しいといえます。
画像認識の正確さではGPT-4oが圧倒的といえるでしょう。
まとめ
今回の記事では、GPT-4oとClaude3 Opusの違いや機能を徹底比較しました。
ほとんどの性能でがClaude3 Opusを上回っているという結果がわかったと思います。
ただ、生成AIモデルには得意、不得意があります。実際に、テキスト生成においてはClaude3 Opusのほうが使い勝手がよく、筆者が仕事で使うことが多いのもClaude3 Opusです。
近年、生成AIモデルのレベルはかなり向上しています。日常生活やビジネスで実際に使ってみて初めて「自分に合った生成AIモデル」がわかることも多いでしょう。
ぜひ両モデルを実際に試してみてくださいね!
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。