TOP ナレッジ 【GPT-4o超える?】DeepSeek V3とは?基本的な概要や使い方、利用料金等を徹底解説! 

knowledgeナレッジ

【GPT-4o超える?】DeepSeek V3とは?基本的な概要や使い方、利用料金等を徹底解説! 

January 27, 2025

  • AI
  • Share
【GPT-4o超え?】DeepSeek V3とは?

2024年12月26日、中国のDeepSeek社から新たな大規模言語モデル「DeepSeek V3」が発表されました。6,710億という過去最大規模のパラメータを持ち「OpenAI社のGPT-4oを凌ぐ性能を発揮する」と話題になっています。また、驚くべきことにDeepSeek V3はオープンソースモデルで、低コストで商用利用可能です。 

本記事では、今話題のDeepSeek V3の概要や料金体系、使い方などを解説します。ぜひ最後まで記事をごらんください。 

DeepSeek V3とは

引用元:https://www.deepseek.com/ 

DeepSeek V3は、中国のDeepSeek社が開発した大規模言語モデルで、Mixture-of-Experts(MoE)というアーキテクチャ(基本構造)を採用して開発されています。 

MoEは、複数の専門家AIを組み合わせて効率的に処理を行う仕組みです。全体で6,710億のパラメータを持ちながら、実際の処理では約370億パラメータのみを使用します。つまり、MoEは「必要なときに必要な分だけのリソースを使う」という効率的な仕組みにより、“高性能なAIを低コストで実現できる”という利点があります。 

さらに、最大128,000トークン(約10万文字相当)という長い文章を一度に処理できる能力を持ち、毎秒60トークンという高速な生成が可能です。14.8兆トークンという膨大なデータで学習を行い、特に数学やプログラミング分野で高い性能を発揮します。 

DeepSeek V3の性能

引用元:https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf 

DeepSeek V3の性能を、主要なベンチマークテストの結果から見ていきましょう。上記のグラフからは、多くの評価指標でDeepSeek V3(斜線が引いてある青いグラフ)が他のモデルを上回る性能を示していることが分かります。 

具体的な数値を見ると、MMLU-Pro(AIの総合的な知識と理解力を測定するテスト)では75.9%のスコアを達成し、GPT-4o(71.4%)を上回っています。また、数学の問題解決能力を測るMATH 500テストでは90.2%という驚異的な正答率を記録し、GPT-4o(74.6%)やClaude 3.5(78.3%)を大きく引き離しています。 

特筆すべきは、GPT-4oやClaude 3.5 Sonnetといった非公開モデルと互角以上の性能を持ちながら、DeepSeek V3がオープンソースとして公開されている点です。企業や開発者が自由に利用・改変できるモデルでありながら、最高峰の性能を実現しているため、今後のAI関連テクノロジーが大きく進歩する可能性があります。 

DeepSeek V3の主な特徴 

効率的な処理システム

DeepSeek V3は、Multi-head Latent Attentionという技術により、メモリ使用量を削減しながら高速な処理を実現します。通常のAIモデルは、大量の情報を一度に保存しながら処理を行うため、多くのコンピュータリソースを必要とします。一方、Multi-head Latent Attentionでは、情報を効率的に圧縮して処理を行います。 

わかりやすく説明すると、以下のようなプロセスを内部で行っています。 

  1. 大量の文書を処理する際に、各文書の「エッセンス」や「キーポイント」を抽出し、それらを短い要約として保存 
  2. 必要に応じて、この圧縮された要約を使って文書間の関連性を素早く判断 
  3. 詳細な情報が必要な場合のみ、元の文書の該当部分を参照 

このような効率的な処理により、DeepSeek V3は高い性能を維持しながら、処理速度の向上とコストの削減を実現しています。 

効率的な文章予測能力

DeepSeek V3は、Multi-Token Prediction(MTP)と呼ばれる技術を採用することで、高速かつ自然な文章予測を実現しています。 

一般的なAIモデルは文章を単語やトークンごとに順番に予測しますが、MTPでは以下のようなプロセスを同時に行うのが特長です。 

  1. 複数の単語や文を一度に予測 
    • 部分的に読み取った文章に対して、先を見越した複数の候補を一括で生成します。 
  2. 最適な文章の流れを選択 
    • 予測結果の中から、文脈に最も適した選択肢を絞り込みます。 

このアプローチによって、DeepSeek V3は従来モデル(DeepSeek V2)と比べて最大3倍の速度で文章を生成可能です。 

DeepSeek V3の料金体系

DeepSeek V3には2つの利用方法があります。1つは無料で使えるWebサイト上のチャットサービス、もう1つはプログラムに組み込んで使用できる有料のAPIです。 

チャット版は個人利用であれば無料で利用可能です。一方でAPIを利用する場合は、入力が0.14ドル、出力が0.28ドル(100万トークンあたり)の従量課金制となっています。なお、2025年2月8日までは割引価格が適用され、入力料金は100万トークンあたり0.014ドルとなっています。 

GPT-4などの競合サービスと比較すると、約10分の1という破格の料金設定となっており、開発者や企業にとって導入のハードルが低いのが特徴です。 

DeepSeek V3の始め方

DeepSeek V3のチャット版は、無料で誰でも利用可能です。また、始め方も簡単です。 

まず、公式サイト(https://www.deepseek.com/)にアクセスして「Start Now」をクリックします。 

引用元:https://www.deepseek.com/ 

遷移した画面で、Googleアカウントまたは、電話番号orメールアドレスでアカウントを開設し、ログインしましょう。 

ログインが完了すると、チャット欄が表示されます。ChatGPTなどを利用する時と同様、プロンプトを入力すれば利用できます。 

API利用したい方は、アカウント作成後に「Get DeepSeek App」というボタンをクリックし、APIキーを取得しましょう。 

ちなみにDeepSeekのAPIは、OpenAI互換APIのため、既存のGPTアプリケーションからの移行も容易です。 

DeepSeek V3を実際に使ってみた

ここでは実際にDeepSeek V3にプロンプトを入力し、性能を検証したいと思います。 

試しに以下のプロンプトを入力しました。 

プロンプト:「来週の火曜日あたりに、取引先企業へ訪問したいです。都合の良い時間などを尋ねつつ、アポイントメントのメールを作成してください。」 

回答結果は以下のとおりです。 

なかなか良い文章が生成されたと感じます。特に指示をしたわけではないのですが「火曜日が難しい場合」に備えて、“日程の調整が可能なこと“なども伝えています。 

上記のようなビジネスメールなどは、各国の商習慣が如実に反映される文章です。日本の商習慣をしっかりと理解し、文章を生成していることがわかります。 

では、次に推論能力を試してみましょう。推論能力とは、既存の情報やデータから新たな結論や答えを導き出す力のことです。 

試しに以下のプロンプトを入力してみました。 

プロンプト:「『800mlの容量がある真空断熱マグカップ』を販売したいです。300文字以内で魅力的なセールスコピーを考えてください」 

回答は以下のとおりです。 

あえて簡素なプロンプトを入力しましたが、悪くないと思います。「オフィスでもアウトドアでも」という箇所や「朝の目覚めの一杯から、午後のリフレッシュまで」など、魅力を伝える努力が伝わってきますね。 

ちなみに、Claude 3.5 SonnetとGPT-4oでも同様のプロンプト入力してみました。回答結果は以下のとおりです。 

GPT-4o 

Claude 3.5 Sonnet 

三者三様の表現ですが、明らかにGPT-4oのセールスコピーは質が低いと感じます。一方で、Claude 3.5 Sonnetは「広い飲み口で、お手入れもラクラク」「結露知らずのボディは、大切な書類も濡らしません」など、DeepSeek V3よりも魅力的に感じました。 

ただ、Claude 3.5 SonnetやGPT-4oを利用するためには有料プランへの加入が必要ですが、DeepSeek V3は完全無料で利用できます。無料で利用できる大規模言語モデルとしては、かなり性能が高いことがわかりますね。 

DeepSeek V3は商用利用できる?注意点は?

DeepSeek V3は、MITライセンスのもとで提供されているため、商用利用が可能です。企業のシステムへの組み込みや、独自のAIサービス開発など、幅広い用途で活用できます。 

ただし、利用規約には中国の法律が適用され、データは中国国内のサーバーで保管されることに注意が必要です。また、中国の規制により、特定の政治的トピックへの応答が制限される可能性があります。商用利用を検討する際は、データのプライバシーやセキュリティ面での確認が重要です。 

また、DeepSeek V3をベースに独自の製品やサービスを作って公開する場合は、元の著作権表示とライセンスの全文を記載する必要があります。企業での利用前に、法務部門との相談や、データ保護に関する対策を十分に検討しましょう。 

まとめ

本記事では、DeepSeek V3の基本的な概要や使い方、料金体系について解説しました。DeepSeek V3は、6,710億という巨大なパラメータ数を持ちながら、効率的な処理と低コストを実現した革新的なAIモデルです。 

特に、競合モデルよりも高い性能を持ち、商用利用可能なオープンソースという特徴は、多くの企業や開発者にとって魅力的な選択肢となるでしょう。ぜひDeepSeek V3を実際に試してみて、ビジネスや開発プロジェクトでの活用を検討してみてください。 

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

T-4OOの詳細を確認す

  • Share
一覧へ