TOP ナレッジ OpenAIが公開した音声生成AI「Voice Engine」とは?音声サンプルからリアルな音声を生成可能に? 

knowledgeナレッジ

OpenAIが公開した音声生成AI「Voice Engine」とは?音声サンプルからリアルな音声を生成可能に? 

May 16, 2024

  • AI
  • Share
引用元:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices 

OpenAI社は2024年3月、人間のリアルな声を生成できる音声生成AIモデル「Voice Engine」を発表。悪用の可能性などを鑑みて、リリースに慎重な姿勢を見せていますが、現時点でのプレビュー結果や知見を公表しました。 

『Voice Engine』とは?

「Voice Engine」は15秒の音声サンプルとテキストなどを入力するだけで、サンプルに沿った自然な音声を生成できるAIモデルです。OpenAI社が公開しているサンプルを聞く限り、感情を込めたリアルな音声であることがわかります。 

サンプル音声 

生成された音声 

「Voice Engine」の活用法は多岐にわたります。たとえば、目が不自由で本が読めない人への読書支援や、病気で喋れない人への発話支援などが実現できるでしょう。 

安全面への懸念も

一方で「Voice Engine」は安全面への懸念も指摘されています。 

OpenAI社も「人の声の音声生成には重大なリスクがあり、特に選挙の際は最優先事項であることを認識しています」というコメントをしており、悪用の危険性から一般公開の予定は未定のようです。 

まとめ

OpenAI社はChatGPTをはじめ、動画生成AIモデルの「Sora」や音声生成AI「Voice Engine」など、多くの生成AIモデルを発表しています。 

動画生成AIモデル「Sora」についてはこちらの記事をご覧ください。 

今後、OpenAIの各生成AIモデルがさまざま場面で活用されるでしょう。私生活やビジネスシーンで活用できるように、いまのうちから生成AIの知識を深めておくことをおすすめします。 

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

T-4OOの詳細を確認す

  • Share
一覧へ