TOP ナレッジ 【OpenAI】「GPT-4o」 と「o1」モデルを徹底比較! プロンプトのコツや注意点も解説

knowledgeナレッジ

【OpenAI】「GPT-4o」 と「o1」モデルを徹底比較! プロンプトのコツや注意点も解説

October 09, 2024

  • AI
  • Share

2024年9月12日、OpenAIの新モデル「o1」が登場しました。o1モデルの登場で、さらなる可能性が広がったといえるでしょう。ただ、既存のGPT-4oとの違いや使い分けに悩む方も多いのではないでしょうか。

この記事では、o1とGPT-4oの特徴を比較し、適切な使い分け方やプロンプトのコツを解説します。AIモデルの選択に迷っている方や、より効果的な活用法を探している方には参考になると思いますので、ぜひ最後まで記事をご覧ください。

「o1」とは

OpenAIが2024年9月12日に発表した「o1」は、従来のGPT-4oを超える推論能力を持つAIモデルです。o1は、応答前により多くの時間を「考える」ように設計されており、科学やコーディング、数学などの複雑な問題解決に特化しています。

o1シリーズには、高性能な「o1-preview」と、効率重視の「o1-mini」の2種類があります。o1-previewは難解な課題に適しており、o1-miniは推論能力は多少劣るものの、高速な処理が可能です。両モデルとも、内部で多段階の推論プロセスを経て回答を生成するため、従来モデルよりも推論能力が向上しています。

o1とGPT-4oの違い

o1とGPT-4oの主な違いは、推論能力と機能の多様性です。o1は複雑な問題解決に優れ、特に数学や科学の分野で高い正確性を誇ります。その証拠に、米数学オリンピック予選(AIME)問題の正答率は、従来のGPT-4oモデルの13%を大きく上回る83%という結果でした。

“数学や科学の分野”と聞くと「専門家にしか需要がないのか」と思ってしまうかもしれませんが、あらゆる質問に対しての回答の正確性も増しています。

一方でGPT-4oは、マルチモーダル入力やウェブ検索、画像生成が可能な点など、幅広い機能を持っており、日常的なタスクに適しています。o1は現時点でこれらの機能を持たないため、汎用性ではGPT-4oに劣るといえるでしょう。また、処理速度の面でも、GPT-4oのほうが早いケースが多いです。

例えるならば、o1は「深く考える専門家」で、GPT-4oは「素早く対応する万能選手」。用途に応じて使い分けが必要になるでしょう。

o1モデルの利用方法

o1-previewとo1-miniは、ChatGPT PlusおよびTeamユーザーが利用可能です(無料ユーザーは利用不可)。また、API開発者向けにも提供が開始されています。

o1-previewとo1-miniの利用方法は簡単です。

ChatGPTのTOP画面から、左上のモデル選択欄をクリックしましょう。o1-previewとo1-miniモデルが表示されるので、該当モデルを選択するだけです。

引用元:https://chatgpt.com/

o1-previewとo1-miniモデルは、有料プランに加入しているユーザーであっても利用が制限されています。ただし、2024年9月17日に制限内容が緩和されました。9月17日以前と以降で情報が異なるので、しっかりと確認しておきましょう。

  • o1-preview
    2024年9月17日以前: 週30回の使用制限
    2024年9月17日以降: 週50回まで使用可能
  • o1-mini
    2024年9月17日以前: 週50回の使用制限
    2024年9月17日以降: 1日50回まで使用可能

GPT-4oとo1の比較

ここではGPT-4oとo1-previewに同じプロンプトを入力し「推論能力」と「プログラミング能力」を比較します。

推論能力

まずは推論能力を比較してみましょう。ちなみに推論能力とは、与えられた情報や知識を基に、論理的に考え、新たな結論や解決策を導き出す能力のことです。

新しい思考プロセスで推論能力が向上したo1-preview。GPT-4oと比較してどのような違いがあるのでしょうか。従来モデルが苦手としていた質問をして、性能を比較します。

まずは両モデルに「なぞなぞ」を出題します。従来の生成AIモデルは「人間的思考」が重要であるなぞなぞの回答をするのが苦手でした。

試しに下記のプロンプトを入力してみます。

プロンプト:
「あなたになぞなぞを出題します。風邪をひいた貝が出だしてくる料理はなーんだ?」

ちなみに上記のなぞなぞはネットで検索したらヒットしたもので、答えは「懐石料理(貝が咳をする)」です。

両者の回答内容は下記のとおり

GPT-4o

o1-preview

o1-previewは正しい回答をしていますが、GPT-4oはトンチンカンな回答をしています。また、GPT-4oの回答に関しては「風邪をひいたときに『おみそしる』を飲むことがある」という、ほとんどの日本人には当てはまらない習慣を作りあげています。

ちなみに、o1-previewの興味深い特徴として、思考のプロセスを公開している点が挙げられます。o1-previewの回答欄上部「思考時間:15秒」という部分の逆三角形マークをクリックすると、以下のような思考プロセスを閲覧できます。

回答結果だけでなく「なぜその回答に至ったか」というプロセスを知るのは、理解度を深めるために重要です。さまざまな活用法がありそうですね。

では次に生成AIが苦手とする質問をしてみましょう。プロンプトは下記です。

プロンプト:
「I live in Mississippi.←この英文に「i」は何文字使用されていますか?」

ちなみに答えは、大文字の「I」を入れた場合は7文字で、小文字だけカウントした場合は6文字。両AIモデルの回答結果は下記になります。

GPT-4o

o1-preview

GPT-4oは7文字とも6文字とも答えず「5文字」という間違えた回答をしているのに対し、o1-previewは完璧な回答結果です。

一見簡単そうに思える上記の質問ですが、生成AIは文字数のカウントなどが苦手です。その理由は「生成AIがテキストを処理する際の手法」に起因します。

AIモデルはテキストを処理する際に「トークン化」という方法を使います。トークンとは、AIモデルがテキストデータを処理するときに扱う最小単位のことです。トークンは必ずしも、一文字や一単語というくくりではなく、複数の文字や部分的な単語を含むことがあるため、AIモデルが文字単位で正確にカウントするのは難しいのです。

例えば「I love AI.」という文章を生成AIに入力した場合、下記のようなトークンに切り分けられることがあります。

パターン1:「I」「love」「AI」「.」(単語ごと)

パターン2:「I」「lo」「ve」「AI」「.」(サブワードごと)

※サブワード=単語をさらに細かく分割した単位のこと

生成AIのなかでの最小単位は1トークンであるため「トークン内の詳細」は分析しにくいのです。

上記の点などを踏まえると「o1-previewの推論能力」は、GPT-4oに比べても飛躍的に向上しているといえるでしょう。

プログラミング能力

次はプログラミングの能力を比較してみましょう。今回の比較では、Googleのスプレッドシートなどで使われる「GASコード」を生成してもらいます。

下記のプロンプトを入力してもらいました。

プロンプト:
「スプレッドシートのA列を縦軸、B列を横軸としたグラフを、スプレッドシート上に表示させたいです。必要なソースコードをGASコードで正確に書き出してください」

回答されたソースコードをそのままコピペした結果、下記のようになりました。

GPT-4o

o1-preview

どちらもグラフは完成したものの、GPT-4oのグラフは横軸と縦軸が逆になっています。また「A列vs B列」という余計なグラフタイトルまで付けられていますね。一方でo1-previewのグラフは正確なものでした。

プログラミングという分野でも、GPT-4oよりo1-previewのほうが高い性能だということがわかります。

o1とGPT-4oの使い分け方

o1とGPT-4oの使い分けは、タスクの性質と求める結果によって決まります。o1は、数学の証明や複雑なプログラミング、科学的な分析など、深い思考と正確性が求められる場面で有効です。例えば、研究論文の理論的な部分の検証や、高度なアルゴリズムの設計に適しています。

一方でGPT-4oは、日常的な質問応答や文章作成、画像生成や簡単な情報検索など、幅広いタスクに対応可能です。また、画像認識や外部ツールとの連携が必要な場合もGPT-4oが適しています。

専門的で時間のかかる思考が必要な場合はo1を、即時性や多機能性が重要な場合はGPT-4oを選択するとよいでしょう。

o1モデルを利用する際のプロンプトの書き方

o1モデルのリリースと同時に、OpenAI社公式が「プロンプトに関するアドバイス」を公開しました(下記画像参照)。

引用元:https://platform.openai.com/docs/guides/reasoning

OpenAIの公式見解によると「複雑なプロンプトは必ずしも効果的ではなく、場合によってはパフォーマンスを低下させる可能性がある」とのことです。

以下に、o1モデルのプロンプトに関するアドバイスをまとめました。

  • プロンプトは簡潔で直接的に
    詳細なガイダンスなしで、短く明確な指示を与えるだけで十分です。
  • 思考プロセスの指示は避ける
    o1は内部で推論を行うため「ステップバイステップで考えて」や「理由を説明して」といった指示は不要です。
  • 区切り記号を使用する
    トリプルクォーテーション(“””)、XMLタグ、またはセクションタイトルなどを使用して、入力の異なる部分を明確に区別します。これにより、モデルが各セクションを適切に解釈しやすくなります。
  • 追加コンテキストは最小限に
    文書や追加情報を提供する場合、最も関連性の高い情報のみを含めます。これにより、モデルが回答を過度に複雑にすることを防ぎます。

上記のアドバイスに従うことで、o1モデルの高度な推論能力を最大限に引き出し、より効果的な回答を得られるでしょう。

まとめ

今回の記事では、OpenAIの新モデル「o1」と既存モデルの「GPT-4o」の特徴や、使い分けについて解説しました。両モデルの特性を理解し、適切に使い分けることで、AIの活用範囲が大きく広がるでしょう。

昨今、生成AIモデルの性能は凄まじいスピードで向上しています。ビジネスや私生活で生成AIを効果的に活用できるとさまざまな恩恵を受けられますので、興味を持った方は試してみてください。

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

  • Share
一覧へ