Googleが新たに発表した「Gemini」は、ChatGPTを超える機能を持つ生成AIとして注目されています。この記事ではGeminiの概要や特徴、ChatGPTとの違いまでわかりやすく説明していきます。
Gemini とは
Geminiは、Google が開発したマルチモーダル生成AIです。
マルチモーダルとは、複数の情報処理を組み合わせる技術で、Geminiはテキストだけでなく、画像や音声、動画などの情報を理解することで、より豊かな表現や正確な回答を実現します。
たとえば、
- 画像を見て、その内容を説明する
- 音声で指示を出して、文章を作成する
- 動画の内容を理解して、字幕を自動生成する
などの処理が可能で、幅広い分野での活躍を期待されています。
ちなみに、英語的な発音は「ジェミナイ」ですが、日本語では「ジェミニ」と呼んでも問題ないようです。
バージョンの違い
Geminiは、利用者のニーズに合わせて3つのバージョンが提供されています。個人利用からビジネス向けでの利用まで、幅広いユーザーが自分に合った形でGeminiを利用できるでしょう。
バージョンは下記3つです。
- Gemini Nano
- Gemini Pro
- Gemini Ultra
以下、詳しく説明します。
Gemini Nano
Gemini Nanoモデルは、スマートフォン(現在はGoogle Pixel 8 Proに搭載)での利用を前提に設計されているモデルです。外部サーバーへの接続なしに、デバイス上で効率良くAIを動作可能。情報のリサーチやテキストの要約といったタスクを迅速に実行できます。
Gemini Pro
Gemini Proは、3つのバージョンの中位モデルにあたります。今までGoogleが提供していたAIサービスの『Bard』から『Gemini』という名称に変更され、高性能なマルチモーダル生成AIを無料で利用できます。
無料版のGeminiという位置づけといえるでしょう。
Gemini Ultra
最上位モデルであるGemini Ultraは、Gemini Proよりも性能が高く、有料版でのみ提供されています。Gemini Ultraは、大規模言語モデル(LLM)の研究や開発において使用される性能比較32項目の中、30項目においてChatGPTの最高位モデルである「GPT-4」を上回ったとされています。
Geminiの利用方法
Gemini Nano とGemini Proは無料で利用できます。
現時点 (2024年2月時点) では、Gemini NanoはGoogle Pixel8 Proに搭載されており、デバイス上で利用可能です。
Gemini Proは、Googleのテキスト生成AIサービス『Bard』が名称変更され、『Gemini』としてウェブ上で無料公開されています。Gemini Proはマルチモーダル生成AIなので、無料版のChatGPT(無料版はテキスト生成AI)よりも性能が高いといえます。
一方で、最高性能を持つ『Gemini Ultra』の利用は有料となっており、“Google One”というサービスの「AI Premiumプラン」に登録することで利用可能です。
AI Premiumプランは月額2,900円(税込)で、2TBのストレージ容量があったり、GmailやGoogleドキュメントがAIと連携できたりなど、さまざまな特典も付随しています。
現在(2024年2月時点)は、2ヶ月無料プランも提供されているため、お試しで登録してみるのもよいでしょう。
GeminiとChatGPTとの違い
GeminiとChatGPTはどちらもマルチモーダル生成AIで、テキストの生成や画像の生成が可能です。筆者が利用した限り、両者ともに似たような性能を持っていました。
ただ、Geminiはすべてのバージョンでマルチモーダルに対応していますが、ChatGPTは有料版である「GPT-4」でしかマルチモーダルに対応していません。
また、GeminiはGoogleの検索エンジンと連携しているため、リアルタイムの情報も回答してくれますが、ChatGPTは基本的に2023年4月時点までの情報しか知らないため、リアルタイムの情報は回答してくれません。
無料版で利用したい場合や、リアルタイムのデータ情報が知りたい場合は、Geminiの方が高性能といえるでしょう。
また、Googleが公式で出している性能テストでは、GPT-4を上回るスコアを獲得したとのこと。
引用元:https://japan.googleblog.com/2023/12/gemini.html
現時点では、拡張性や使い勝手の良さなど、ChatGPT有料版に軍配が上がる印象ですが、Geminiの今後にも期待できます。
まとめ
今回のコンテンツではGoogleが提供している「Gemini」について紹介しました。
Geminiは膨大な学習データを保持しているGoogleが開発した生成AIなので、今後もさらに性能や使える機能が強化されていくことが予想されます。
今後はGoogleの各サービスとGeminiの連携も進んでいくでしょう。
生成AIの世界はどんどん進化しているので、今後が楽しみです。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。