「生成AI」についての理解を深め、私生活やビジネスで活用することを目的とした今シリーズ。
今回の記事は、前記事「生成AIが生成してくれるもの」のPart2です。ぜひ前回の記事を読んでからご覧ください。
AIはどんなものを生成できるの?
現代の生成AIは主に下記4つの分野に優れています。
- テキスト生成
- 画像生成
- 動画生成
- 音声生成
今回の記事では「動画生成」と「音声生成」について解説します。
動画生成
動画生成は文字通り動画を生成してくれるAIです。動画生成AIとしはRunway社の「Gen-2」が有名ですが、個人的に注目しているのは「HeyGen」という動画生成AI。
ChatGPTと連携しているので、ChatGPTにHeyGenのプラグインをインストールし、ChatGPT上で動画を作成できます。動画を作成する際に入力する指示は以下のとおりです。
- アバターに喋らせる台本
- アバターの性別
- アバターの肌の色
上記の条件を指示すれば、リアルなアバターが台本を実際に喋っているかのような動画を作成できます。試しにかんたんなテキストを入力して下記動画を作成してみました。
※実際に動画を作成しました。リンク切れの可能性もあるので、YouTubeなどにアップしてブログに埋め込んでいただくといいと思います。
https://app.heygen.com/share/bac5805a282749919059b2d826450472?sid=openai-plugin
上記の動画では外国人風の男性ですが、アジア風などの指定もできます。また、注目すべきは口の動きで、よく見ると入力したテキストに沿った口の動きをしています(完璧ではありませんが)。日本語にも対応しているので、すぐにでも活用できそうですね。
HeyGenは自分の顔を学習させることも可能なので、一度自分の顔を学習させて台本を入力すれば、その台本のセリフをあたかも「本人が喋っているかのような動画」として作成できます。
本人が撮影しなくても、簡単に動画を作成できるため、スピーチ動画やハウツー動画など、今後さまざまな分野で活躍するでしょう。
音声生成
音声生成AIは、テキストを音声などに変換してくれるAIです。音声読み上げ機能など、音声を生成してくれるコンピューターに触れる機会は多かったと思いますが、現在では特定の人の声を再現する音声生成AIもあります。
たとえば、Microsoftが開発した「VALL-E」は、3秒ほどのサンプル音声があれば、本人そっくりの音声を生成します。
実際に本人が録音することなく、テキストを入力するだけで音声コンテンツが作成できるようになるので、ラジオや音声での放送など、今後さまざまなジャンルで活用されるでしょう。
まとめ
今回の記事では生成AIの「生成AIが生成してくれるもの」について解説しました。
筆者は動画編集などを経験しているので、動画生成AIなどは衝撃的であり、今後の技術革新に注目しています。生成AIがもっと高機能になれば、多くの人の仕事が無くなっていくと予想されますね…。
ということで、次の記事では「生成AIに奪われる仕事」について解説します!お楽しみに!
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。