TOP ナレッジ Googleが動画生成モデル「Veo 2」を発表!「Veo 2」の概要や利用開始時期を解説 

knowledgeナレッジ

Googleが動画生成モデル「Veo 2」を発表!「Veo 2」の概要や利用開始時期を解説 

December 30, 2024

  • AI
  • Share

人工知能(AI)による動画生成技術が急速に進化を遂げるなか、Googleは2024年12月16日に新たな動画生成AI「Veo 2」を発表しました。最大4K解像度での動画生成が可能な点や、映画制作で使用される専門的な表現にも対応できる機能を備えています。 

本記事では動画生成AI「Veo 2」について、概要や利用方法、利用料金などを詳しく解説します。ぜひ最後まで記事をご覧ください。 

Veo 2の概要

引用元:https://deepmind.google/technologies/veo/veo-2/ 

Veo 2は、GoogleのAI研究部門であるDeepMindが開発した最新の動画生成AIモデルです。テキストによる指示をするだけで、高画質で自然な動きを表現した動画を生成できます。 

最大の特徴は、物理法則に基づいた自然な動きの表現や、人間の表情・動作を精密に再現する能力を持つ点です。 

従来の動画生成AIでは、不自然な動きや予期せぬ物体が表示される「ハルシネーション」と呼ばれる現象が課題でしたが、Veo 2ではその発生を大幅に抑制することに成功しています。また、生成された動画には目に見えない電子透かし「SynthID」が埋め込まれ、AI生成コンテンツの識別や不正利用の防止に活用可能です。 

Veo 2の主要機能と特徴

ここではVeo 2の主要機能と特徴を詳しく解説します。 

高品質な動画生成

Veo 2の動画生成の品質は、以下のような特徴があります。 

  • 最大4K解像度での動画出力 

スマートフォンの画面からテレビ画面まで、さまざまな画面サイズで美しく表示できる高解像度での動画生成が可能です。従来のAI動画生成では1080p(フルHD)が限界でしたが、Veo 2では4倍の解像度を実現しました。 

  • 数分間の長尺動画の生成 

多くの動画生成AIが数秒~数十秒程度の短い動画しか作れない中、Veo 2では数分間の動画生成に対応。商品紹介やプロモーション動画など、より実用的な用途に活用できます。 

  • 自然な物理演算による動きの表現 

Veo 2は、水の流れや物体の落下など、現実世界の物理法則に基づいた自然な動きを再現しています(以下動画参照)。まるで実際に撮影したかのような動画表現ができるため、さまざまな場面で実用化できるでしょう。 

  • カメラアングルやレンズの指定が可能 

「18mmレンズで撮影」「ローアングルから見上げる」といった映像制作の専門的な指示に対応。プロの映像制作者が求める細かな表現にも応えられます。 

  • 被写界深度(ピントの範囲)の調整 

背景をぼかして被写体を際立たせるなど、一眼レフカメラのような本格的な撮影効果を再現できます(以下動画参照)。 

安全性への配慮

Veo 2は、以下のような「安全性への配慮」もされています。 

  • SynthID透かしによるAI生成コンテンツの識別 

生成された動画には目に見えない電子透かしが埋め込まれ、AI生成コンテンツであることを識別できます。フェイクニュースなどの不正利用を防ぐ重要な機能です。 

  • 不適切なコンテンツの生成を防ぐ安全機能 

有害な内容や著作権を侵害する可能性のある動画の生成を防ぐフィルタリング機能を搭載。企業でも安全に利用できる工夫がされています。 

Veo 2を利用するには?

Veo 2は現在利用できませんが(2024年12月時点)、ウェイティングリストに登録することで、後日利用可能になります。公式サイト(https://labs.google/fx/ja/tools/video-fx)から簡単に登録できますので、ぜひ試してみてください。 

引用元:https://labs.google/fx/ja/tools/video-fx 

Veo 2の利用料金は?

Veo 2は現在、実験的な提供段階のため無料で提供予定です。ただし、1日あたりの生成可能な動画数には制限がかけられるでしょう。 

また、将来的な料金体系については未発表です。 

競合製品との比較

引用元:https://deepmind.google/technologies/veo/veo-2/ 

Veo 2は、Metaが実施したベンチマークテスト「MovieGenBench」で、競合製品と比較して優れた性能を示しました。上記図表のベンチマークテストでは、1003件のテキスト指示(プロンプト)に基づいて各AIが生成した動画を、人間の評価者が直接比較・評価しています。 

評価は2つの基準で行われました。 

総合的な好み(Overall preference:上記図表左側) 

動画の品質や自然さなど、見た目の印象を総合的に評価する基準です。緑色の部分がVeo 2が好ましいと評価された割合を示しており、灰色の部分は両者同等と評価された割合、ピンク部分は対象のモデルが優れていると評価された割合です。 

プロンプト忠実度(Prompt Adherence:上記図表右側) 

テキスト指示の内容をどれだけ正確に動画化できているかを評価する基準です。緑色の部分がVeo 2が好ましいと評価された割合を示しており、灰色の部分は両者同等と評価された割合、ピンク部分は対象のモデルが優れていると評価された割合です。 

比較したモデルの中には、2024年12月に発表されて話題になったOpenAIの「Sora Turbo」も含まれていますが、Veo 2が高評価を得ています。 

筆者はもちろんウェイティングリストに登録しましたが、利用開始がとても楽しみです。 

まとめ 

本記事では、Googleが発表した最新の動画生成AI「Veo 2」について解説しました。 

Veo 2は4K解像度対応や数分間の長尺動画生成、映画制作レベルの表現力を備え、ベンチマークテストでも競合製品を上回る性能を示しています。公式YouTube動画を確認する限り、想像以上の品質で感動しました。 

動画制作に携わる方やSNSでの発信をしている方などは、ウェイティングリストへの登録を行い、提供開始と同時に利用できるように準備しておきましょう。 

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

T-4OOの詳細を確認す

  • Share
一覧へ