2024年8月、Googleは新しい音声AIアシスタント「Gemini Live」をリリースしました。Gemini Liveは、従来の音声アシスタントとは一線を画すレベルの「自然な会話体験ができる」と大きな注目を集めています。
本記事では、Gemini Liveの概要や特徴、使い方などを解説します。
Gemini Liveとは?
Gemini Liveは、Googleの最新AI技術を活用した音声アシスタントです。ユーザーとAIがリアルタイムで自然な会話をすることができ、まるで人間と話しているかのようにAIが質問に回答してくれます。
このサービスは、Googleの生成AI「Gemini」の機能を拡張したもので、高性能な言語モデルを基に「より直感的で柔軟なコミュニケーション」が可能です。
Gemini Liveの主な機能と特徴
Gemini Liveの主な機能と特徴は、以下のとおりです。
- リアルタイム音声会話:AIと自然な会話形式で対話可能
- Interrupt(インターラプト)モード:AIの回答中でも割り込んで質問できる機能。回答中の疑問点をすぐに質問できるため、より自然な会話が可能
- 10種類の音声オプション:好みの声を選択できる
- Androidとの深い統合:電源ボタンの長押しや「Hey Google」という音声入力で起動できる
- ハンズフリー操作:Pixel Buds Pro 2(AI搭載イヤホン)などと連携して使用できる
- バックグラウンド動作:他のアプリ使用中や画面ロック時でも会話を継続できる
Android端末やiPhoneなどで、音声入力を利用する場面は多いのではないでしょうか?(筆者はよく、Siriにタイマーやアラームをセットしてもらいます)
Gemini Liveのような高性能な音声アシスタントがスマホに搭載すれば、日常生活がさらに便利になりそうです。
Gemini Liveの料金体系
Gemini Liveは、月額19.99ドル(約2,900円)の「Gemini Advanced」サブスクリプションの一部として提供されています。無料版の「Gemini」もありますが、Gemini Live機能は含まれていません。
なお、Pixel 9やPixel 9 Proを購入すると「Google One AIプレミアムプラン」が6ヶ月無料で利用できるキャンペーンが提供されています(2024年8月時点)。Google One AIプレミアムプランには「Gemini Advanced」の利用が含まれているため、Gemini Liveを利用できるでしょう。
ただし、現在Gemini Liveは英語版のみの提供です。Googleは近い将来、日本語を含む他の言語にも対応する予定であることを発表していますが、具体的な日程は明らかにしていません。
次の大規模アップデートを待ちましょう。
まとめ
今回の記事では「Gemini Live」について解説しました。Gemini Liveのデモ動画などを見る限り、AIアシスタントとは言えないほどの自然な会話が実現していました。AIの進化は目まぐるしいです。
現在は英語版のみですが、近い将来日本語版やiPhone版も登場する予定で、さらに多くのユーザーが利用できるでしょう。
AIテクノロジーの進化とともに、人間の日常生活やコミュニケーションの形は変わってくるかもしれません。例えば「人間の友達はいないけどAIの親友がいる」というような人も増えるのではないでしょうか?
今後のAIの発展に、引き続き注目です。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
専門文書 AIソリューション「ドキュサポ AI-4OO」
このように今後の活用が期待される生成AIを使って、
御社専用の文書の自動作成・チェックできるシステムが構築可能です。
「ドキュサポ AI-4OO」は、御社内のあらゆる文書やデータ、社外の業界の専門文書などを取り込み
文書の自動作成、文書チェック、ナレッジの検索などを可能にする御社専用の生成AIシステムです。
御社の文書の特徴や専門用語などを元に構築するため、高精度のアウトプットを実現します。
「ドキュサポ AI-4OO」ご活用シーン(例):
■ 社内で必要な文書や資料の自動生成
■ 作成資料のクオリティチェックや、資料間の整合性チェック
■ 社内外の情報やナレッジの検索・調査
その他、個別カスタマイズが可能な生成AI環境で、
社内の知見を統合的に分析・集約したアウトプットをセキュアな環境をご提供します。