OpenAIが2024年12月、かねてから注目されていた動画生成AI「Sora Turbo」を一般公開しました。数行の文章から最大20秒の高品質な動画を生成できる画期的なツールとして注目されています。
2024年2月に「Sora」が発表されてから10ヶ月が経過し、他にも高品質な動画生成AIがリリースされる中、一般公開された「Sora Turbo」の実力はどうなのでしょうか?
本記事では、Sora Turboの機能や利用料金、利用方法などについて解説します。記事の後半では実際にSora Turboで動画を生成していますので、ぜひ最後までご覧ください。
Sora Turboとは
Sora Turboは、OpenAIが開発した動画生成AIです。もともと2024年2月に発表された動画生成AIでしたが、約10ヶ月の開発期間を経て一般公開されました。テキストから動画を生成する基本機能に加え、画像から動画を作成する機能や、複数の動画を組み合わせて動画生成することも可能です。
また、処理速度の大幅な向上や革新的なユーザーインターフェース、さらに編集機能が加わったことにより、直感的な操作で動画生成が可能になりました。
Sora Turboに実装された機能
Sora Turboにはさまざまな機能が実装されています。以下に、Sora Turboの機能をまとめました。
- Remix機能:既存動画内の要素を変更できる機能
- Re-cut機能:既存動画の前後に新しいシーンを追加できる機能
- Storyboard機能:タイムライン上で動画のシーケンスを整理・編集できる機能
- Loop機能:シームレスな繰り返し動画を作成できる機能
- Blend機能:2つの異なる動画を1つに結合する機能
従来の動画生成AIでは「一回の出力で完璧な動画を生成しなくてはいけない」などの制約があり、動画編集の現場で活用しづらい現状がありました。ただ、Sora Turboはクリエイティブな微調整ができる新機能が多く加わっています。
より業務に活用しやすくなったといえるでしょう。
<h2>Sora Turboの利用料金</h2>
Sora Turboは、ChatGPT PlusとProの2つのプランで利用可能です。プランによる特徴は、以下のとおりです。
【ChatGPT Plus(月額20ドル)】
- 720p解像度まで
- 最大5秒の動画
- 月50本まで生成可能
- ウォーターマーク付き(生成されたことを示す透かしマーク)
【ChatGPT Pro(月額200ドル)】
- 1080p解像度まで
- 最大20秒の動画
- 月500本まで生成可能
- ウォーターマークなし
- 同時に5本まで生成可能
ChatGPT Plusプランでも利用できるSora Turboですが、個人的に「結構制限が多いな…」という印象でした。「720pの解像度まで」という制限や、有料プランに加入しているのに「ウォーターマーク付き」というのは、なかなか実用化が厳しいような気がします。
最大限Sora Turboを活用したい方は、ChatGPT Proプランに加入することを検討するとよいでしょう。
Sora Turboの使い方
先述したとおり、Sora TurboはChatGPT PlusとProの2つのプランで利用可能です。アカウントを所持している方は、Soraの公式サイトにアクセスしましょう。https://sora.com/
公式サイトにアクセスすると、右上に「Log in」ボタンがあるので、クリックしログインします。
ログイン後、画面中央下部にプロンプトを入力する場所が表示されるので、任意のプロンプトを入力し、右側の矢印(↑)をクリックすると動画が生成されます。
必要に応じて画質やアスペクト比を設定できますので、試してみてください。
ちなみに、日本語での入力も可能ですが、より精度の高い結果を得るには英語での入力をおすすめします。一度日本語で入力して、翻訳アプリなどを活用しながらプロンプトを入力するとよいでしょう。
Sora Turboを実際に使ってみた
それでは早速Sora Turboを実際に使ってみましょう。まず「不自然な動画ができないかどうか」を試すために、動きが激しい動画を生成してみます。
プロンプトは以下のとおりです。
プロンプト:「野球の試合の様子を臨場感あふれる動画にしてください。(英語に翻訳して入力します)」
1分ほどで2つの動画が生成されました。生成された動画は以下のとおりです。
見てのとおり、人間の動きではありませんね…。2024年2月にSoraが発表されて、一般公開を10ヶ月も心待ちにしていた分、正直期待外れでした。
ただ、上記の動画のプロンプトはかなりシンプルなものだったので、うまくいかなかった可能性もあります。もう少し細かく指示してみましょう。
プロンプト:「初夏の穏やかな日差しが差し込む小さな庭で、1匹のゴールデンレトリーバーが明るい緑の芝生の上を走る。 犬は大きく尻尾を振りながら、飼い主に向かって短距離を駆け寄り、最後にちょこんとお座りをしてカメラを見上げる。 背景には低い垣根や淡いピンク色の花が揺れ、爽やかな朝の光が全体をやわらかく包んでいる。 カメラはやや低めの位置から犬をフォローし、犬がお座りする瞬間に軽くズームインして映像が終わる。(英語に翻訳して入力します)」
生成された動画は以下のとおりです。
かわいい犬はリアルに表現されていますが、リードの挙動がおかしかったり「1匹のゴールデンレトリーバーが」と指示しているのに2匹出てきたりなど、不自然な点が多々あります。動きが多い動画だと、高品質な動画の生成はなかなか難しいのかもしれません。
筆者はライティングの仕事とは別で、動画編集の仕事もしています。Soraの一般公開はかなり楽しみにしていたのですが、まだまだ実用化は難しそうです…。今後のアップデートに期待しようと思います。
まとめ
今回の記事では、2024年12月に一般公開されたSora Turboについて、概要や機能、利用料金などをまとめました。テキストから動画を生成できる機能はもちろん、Remix、Re-cut、Blendといった編集機能は、大きなアップデートといえます。ただし、肝心の動画生成のクオリティはまだまだ満足いくものではありませんでした。
とはいえ、昨今の生成AI業界の進化は目まぐるしく、高品質な動画が生成できる新たなツールや、Soraのアップデートがあるかもしれません。今後のアップデートによる品質向上や、より実用的なツールの登場に注目していきましょう。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。