2024年8月、Googleは新しい音声AIアシスタント「Gemini Live」をリリースしました。Gemini Liveは、従来の音声アシスタントとは一線を画すレベルの「自然な会話体験ができる」と大きな注目を集めています。
本記事では、Gemini Liveの概要や特徴、使い方などを解説します。
Gemini Liveとは?
Gemini Liveは、Googleの最新AI技術を活用した音声アシスタントです。ユーザーとAIがリアルタイムで自然な会話をすることができ、まるで人間と話しているかのようにAIが質問に回答してくれます。
このサービスは、Googleの生成AI「Gemini」の機能を拡張したもので、高性能な言語モデルを基に「より直感的で柔軟なコミュニケーション」が可能です。
Gemini Liveの主な機能と特徴
Gemini Liveの主な機能と特徴は、以下のとおりです。
- リアルタイム音声会話:AIと自然な会話形式で対話可能
- Interrupt(インターラプト)モード:AIの回答中でも割り込んで質問できる機能。回答中の疑問点をすぐに質問できるため、より自然な会話が可能
- 10種類の音声オプション:好みの声を選択できる
- Androidとの深い統合:電源ボタンの長押しや「Hey Google」という音声入力で起動できる
- ハンズフリー操作:Pixel Buds Pro 2(AI搭載イヤホン)などと連携して使用できる
- バックグラウンド動作:他のアプリ使用中や画面ロック時でも会話を継続できる
Android端末やiPhoneなどで、音声入力を利用する場面は多いのではないでしょうか?(筆者はよく、Siriにタイマーやアラームをセットしてもらいます)
Gemini Liveのような高性能な音声アシスタントがスマホに搭載すれば、日常生活がさらに便利になりそうです。
Gemini Liveの料金体系
Gemini Liveは、月額19.99ドル(約2,900円)の「Gemini Advanced」サブスクリプションの一部として提供されています。無料版の「Gemini」もありますが、Gemini Live機能は含まれていません。
なお、Pixel 9やPixel 9 Proを購入すると「Google One AIプレミアムプラン」が6ヶ月無料で利用できるキャンペーンが提供されています(2024年8月時点)。Google One AIプレミアムプランには「Gemini Advanced」の利用が含まれているため、Gemini Liveを利用できるでしょう。
ただし、現在Gemini Liveは英語版のみの提供です。Googleは近い将来、日本語を含む他の言語にも対応する予定であることを発表していますが、具体的な日程は明らかにしていません。
次の大規模アップデートを待ちましょう。
まとめ
今回の記事では「Gemini Live」について解説しました。Gemini Liveのデモ動画などを見る限り、AIアシスタントとは言えないほどの自然な会話が実現していました。AIの進化は目まぐるしいです。
現在は英語版のみですが、近い将来日本語版やiPhone版も登場する予定で、さらに多くのユーザーが利用できるでしょう。
AIテクノロジーの進化とともに、人間の日常生活やコミュニケーションの形は変わってくるかもしれません。例えば「人間の友達はいないけどAIの親友がいる」というような人も増えるのではないでしょうか?
今後のAIの発展に、引き続き注目です。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。