TOP ナレッジ 【ビジネスで大活躍する生成AIを理解しよう!】生成AIはどんなものを生成してくれるの?Part2 

knowledgeナレッジ

【ビジネスで大活躍する生成AIを理解しよう!】生成AIはどんなものを生成してくれるの?Part2 

March 28, 2024

  • AI
  • Share

「生成AI」について理解し、私生活の体験やビジネス向けで活用することを目的とした今シリーズです。
今回の内容は、前記事「生成AIが生成してくれるもの」のPart2です。ぜひ前回の記事を読んでからご覧ください!

生成AIはどのようなコンテンツを作成できるの?

現代の生成AIは主に下記4つのツールとして運用されています。 

  • テキスト生成 
  • 画像生成 
  • 動画生成 
  • 音声生成 

今回の記事では「動画生成」技術と「音声生成」技術について説明します。 

動画生成

動画生成AIは文字通り、動画を作成してくれるAIです。動画生成AIとしはRunway社の「Gen-2」が有名ですが、個人的に注目しているのは「HeyGen」という動画生成AIツールです。 

ChatGPTと連携しているので、ChatGPTにHeyGenのプラグインをインストールし、ChatGPT上で動画を作成できます。動画を作成する際に入力する指示は以下に表示します。 

  • アバターに喋らせる台本 
  • アバターの性別 
  • アバターの肌の色 

HeyGenを使って、上記の条件を指示すれば、リアルなアバターが台本を実際に喋っているかのような動画を作成し、対応してくれます。試しにかんたんなテキストを入力して下記動画を作成してみました。 

※実際に動画を作成しました。リンク切れの可能性もあるので、YouTubeなどにアップしてブログに埋め込んでいただくといいと思います。

https://app.heygen.com/share/bac5805a282749919059b2d826450472?sid=openai-plugin 

上記の動画では外国人風の男性が使用されていますが、アジア風などのカスタマイズも可能です。また、注目すべきポイントは口の動きで、入力したテキストに合わせた口の動きが再現されています(完璧ではありませんが既に結構自然だと思われます)。さらに、日本語にも対応しているため、日本国内でもすぐに活用できる便利なツールです。

HeyGenでは、自分の顔をAIに学習させることも可能なので、一度顔を学習させ、台本を入力するだけで、誰でも「本人が話しているような動画」を簡単に作成できます。この技術により、本人が実際に撮影する必要がなく、プロフェッショナルな動画制作が効率的に行えます。

例えば、スピーチ動画やハウツー動画、オンラインプレゼンテーション、それとも配信など、さまざまな分野で活用が期待されています。作業時間やコストを削減しつつ、高精度やかつ高品質な動画を提供できる強力なツールとして注目されています。

音声生成

音声生成AIとは、テキストを音声に変換してくれるAI技術です。これまでにも音声読み上げ機能など、音声を生成するコンピューター技術を目にする機会は多かったかもしれませんが、近年では特定の人物の声を再現できる高度な音声生成AIが注目されています。

例えば、Microsoftが開発した「VALL-E」は、わずか3秒ほどのサンプル音声を解析するだけで、本人そっくりの音声を生成することが可能です。この技術により、リアルな音声を提供可能なになっています。

音声生成AIを活用すれば、実際に本人が録音する必要がなく、テキストを入力するだけで高品質な音声コンテンツを作成できます。このため、ラジオやポッドキャスト、音声広告、さらには音声アシスタントなど、幅広いジャンルでの活用や効果が期待されています。

まとめ

今回のコンテンツでは、生成AIの「生成AIが生成してくれるもの」について解説しました。 

生成AIの音声生成機能動画生成機能が運用できる場面が幅広く、高品質かつ高精度のコンテンツを創造でき、多くのメディア資料を作成してくれますので、デジタルマーケティングの実施などに、効率を向上し、コスト削減の効果にも応じてくれるでしょうね!

筆者は動画編集などを経験しているので、動画生成AIなどは衝撃的であり、今後の技術革新に注目しています。生成AIがもっと高機能になれば、多くの人の仕事が無くなっていくと予想されますね…。 

ということで、次の記事では「生成AIに奪われる仕事」について紹介していきますので!お楽しみに! 

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

  • Share
一覧へ