TOP ナレッジ Gemini 2.0 Flash Thinkingとは?特徴や利用方法、性能面などを徹底解説! 

knowledgeナレッジ

Gemini 2.0 Flash Thinkingとは?特徴や利用方法、性能面などを徹底解説! 

December 31, 2024

  • AI
  • Share

Googleは2024年12月19日「Gemini 2.0 Flash Thinking」をリリースしました。OpenAIがリリースしている「ChatGPT o1」モデルのように、AIがじっくりと思考し、推論能力を向上させたモデルです。AIの思考過程を人間にもわかりやすく表示できる画期的な機能を搭載し、高い評価を得ています。 

本記事では、新たに登場したGemini 2.0 Flash Thinkingの特徴や使い方、実際の性能について詳しく解説します。 

Gemini 2.0 Flash Thinkingとは

Gemini 2.0 Flash Thinkingは、Googleが開発した最新の生成AIモデルです。12月初旬に発表されたGemini 2.0 Flashをベースに、AIの思考プロセスを可視化する機能を追加しました。 

人間の思考に近い形で問題解決を行うことができ、Google CEOのスンダー・ピチャイ氏は「Google史上、最も思慮深いモデル」と評価しています。後述しますが、人間でも難しい発想の転換などを行い、なぞなぞにも近い問題を解いているデモ動画が公開され、話題となりました。 

<h2>Gemini 2.0 Flash Thinkingの特徴</h2> 

思考プロセスの可視化

最大の特徴は「Thoughts」機能です。AIが問題を解決する際の思考過程を段階的に表示し、まるで人間が考えているかのように推論を進めていく様子を確認できます。 

マルチモーダル対応

テキストと画像を同時に分析できる機能を備えています。画像の内容を理解し、テキストと組み合わせた複雑な問題解決が可能です。 

現時点での制限事項

Gemini 2.0 Flash Thinkingは現在試験運用版モデルです。現時点(2024年12月)で、以下のような制限があります。 

  • 入力:テキストと画像のみ(上限32,000トークン) 
  • 出力:テキストのみ(上限8,000トークン) 
  • 検索やコード実行などの組み込みツール利用不可 

Gemini 2.0 Flash Thinkingの利用方法

現在(2024年12月時点)、Google AI Studioから無料で利用できます。利用方法は簡単で、以下の手順で利用可能です。 

  1. Google AI Studioにアクセス(https://aistudio.google.com/prompts/new_chat)して、 Googleアカウントでログイン 
  2. 右側のモデル選択から「Gemini 2.0 Flash Thinking」を選択 

引用元:https://aistudio.google.com/prompts/new_chat 

モデルの選択が終わったら、画面中央下部の検索バーにプロンプトを入力するだけです。無料で試せるので、ぜひ利用してみてください。  

Gemini 2.0 Flash Thinkingの性能

ここでは、Google AI Studioのリーダーであるローガン・キルパトリック氏のデモ動画をもとに、Gemini 2.0 Flash Thinkingの性能を解説します。 

デモ動画はこちら

デモ動画内では、ビリヤードのボールが4つ並んでいる画像をGemini 2.0 Flash Thinkingに見せながら、「4つの数字(7, 9, 11, 13)を使って、3つの数字の合計を30にする方法を考えてください」という質問をしています。 

Gemini 2.0 Flash Thinkingは、最初に通常の数値計算による解決を試みましたが、使用可能な数字の組み合わせでは合計30という数値にはなりません。しかし、行き詰まりを感じたAIは発想を転換します。 

「ビリヤードのボールに書かれた数字」という視覚的な特徴に着目し、新たな解決策を模索し始め、ボールに印刷された「9」を上下反転させると「6」として読めることに気づきました。 

結果として、反転させた「6」と残りの「11」「13」を組み合わせることで、合計30という目標値にたどり着いたのです。 

人間でも難しい問題を解いてしまうGemini 2.0 Flash Thinkingもすごいですが、興味深いのが「数字の見え方を変えられないだろうか…」などとAIが考えている様子が可視化されていることです。 

ここまでの推論能力を実現できているのであれば、人間が想像もできないようなアイデアをAIが提案してくれる日も近そうです。Gemini 2.0 Flash Thinkingは無料で利用できるので、ぜひ試してみてください。 

まとめ

今回の記事ではGemini 2.0 Flash Thinkingについて、概要や機能、利用方法等をまとめました。筆者自身、さまざまなAIモデルを利用していますが「Gemini 2.0 Flash Thinkingが一番賢いのでは?」と思うほどの性能です。 

現時点(2024年12月)では試験運用版モデルではありますが、今後のアップデートでさらなる機能追加や性能向上が予想されるため、非常に楽しみです。 

今後もGoogleのGemini 2.0 Flash Thinkingに注目していきましょう。 

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

T-4OOの詳細を確認す

  • Share
一覧へ