昨今、生成AI関連ニュースの動きは激しく、2024年10月も生成AI関連の大きなニュースが相次ぎました。
今回の記事では、10月に起こった生成AI関連のニュースを10個ピックアップして要約します。最新のAI動向を見逃さないよう、ぜひ記事を最後までご覧ください。
海外の生成AI関連ニュース
Windows 11がAI機能を大幅強化、新たな音声アシスタントも実装へ
2024年10月1日、MicrosoftはWindows 11に搭載する新たなAI機能とCopilot関連の機能を複数発表しました。特に注目を集めているのが「Copilot Voice」と「Copilot Daily」という2つの音声機能です。
Copilot Voiceは、OpenAIのChatGPT向け「Advanced Voice Mode」に似た音声機能です。AIとの会話を重ねることで「ユーザーに合わせてカスタマイズされる」という特徴があります。一方、Copilot Dailyは、毎朝のニュースや天気の概要などを設定した声で読み上げ、リマインダーも提供する機能となっています。
さらに、写真の高解像度化やペイントアプリでの「生成塗りつぶし」「生成消去」機能など、日常的な作業をAIでサポートする機能も追加されました。これらの機能は、40+TOPS NPUの能力により、オフラインでも高速に処理可能です。
さまざまな生成AI技術が、PCにも組み込まれるのが当たり前の時代になってきました。最先端の生成AI技術を駆使すれば、作業効率を大幅に向上させられるでしょう。https://www.itmedia.co.jp/news/articles/2410/02/news089.html
OpenAI、音声対話機能をAPI化、企業での音声AI実装が容易に
2024年10月1日、OpenAIは企業向けに音声対話機能「Realtime API」の提供を開始しました。これにより、企業は自社のサービスやアプリに、高性能な音声AIを取り入れることが可能になります。
具体的な活用法としては、語学学習アプリに会話の練習相手となるAIを組み込んだり、お客様サポートで24時間対応可能な音声AIアシスタントを導入したり、幅広い活用が可能です。
料金は、音声入力が1分あたり約0.06ドル、音声出力が1分あたり約0.24ドルに設定されています。現在は試験的な提供となっていますが、今後さらに機能が追加される予定です。
引用元:https://weel.co.jp/media/innovator/realtime-api/
OpenAI、過去最大規模の資金調達で企業価値23兆円に到達
2024年10月2日、OpenAIは66億ドル(約9670億円)の新たな資金調達ラウンドを終え、評価額が1570億ドル(約23兆円)となったことを発表しました。この評価額は、2月時点の約800億ドルからわずか8ヶ月で約2倍に上昇しており、AI業界における同社の急成長は凄まじいです。
この巨額の資金調達には、スライブ・キャピタル、ソフトバンク、エヌビディアなどの新規投資家に加え、以前からの支援者であるマイクロソフトも参加。マイクロソフトは約10億ドルを出資したとされています。マイクロソフトは2019年以降、少なくとも130億ドルをOpenAIに投資しており、継続的な支援を行っているようです。
この資金調達により、OpenAIはAI研究やプロダクト、サービスおよびコンピューティング能力の強化に注力できる体制を整えました。AIブームの最前線に立つOpenAIの今後に注目です。
引用元:https://forbesjapan.com/articles/detail/74095
ChatGPT-4o with canvas登場、AIとのリアルタイム共同編集が可能に
2024年10月3日、OpenAIはChatGPTの新機能「ChatGPT-4o with canvas」の提供を開始しました。この新機能は、AIとリアルタイムで文章やコードの共同編集が可能となる画期的なツールとして注目を集めています。
従来のChatGPTでは、生成された文章やコードを修正する際に全文を再生成する必要がありました。canvas機能を使えば、文章の一部を選択して修正指示を出したり、編集履歴を保存して過去のバージョンに戻したり、文章やコーディングの編集作業をより柔軟に行えます。
ChatGPT-4o with canvasは現在、ChatGPT Plus(月額20ドル)やTeam、Enterprise、Eduプランのユーザーを対象にベータ版として提供されており、今後順次利用可能なユーザーを拡大していく予定です。文章作成やプログラミングの効率を大幅に向上させる新機能として、ChatGPTがさらに使いやすくなりました。
Meta、高品質動画生成AI「Movie Gen」を発表。音声・BGM機能も搭載
2024年10月4日、Metaは次世代の動画生成AI「Movie Gen」を発表しました。Movie Genは、単なるテキストからの動画生成にとどまらず「写真で指定した人物が出演する動画をAIが自動生成」「既存の動画の編集」「動画にBGMや効果音を付与」といった高度な機能を備えています。
特筆すべきは、人物の写真を入力して登場人物として指定できる機能です。この機能により、特定の人物が演じるシーンを生成することが可能になり、より活用の幅が広がりました。また、BGMや効果音の付与機能では、動画の内容に合わせて自動でタイミングが調整される仕組みが実装されています。
文書作成やコーディングなどと比べて、まだまだクオリティを担保するのが難しい動画生成技術。「Movie Gen」の登場で動画クリエイターの働き方が大きく変わるかもしれません。
引用元:https://gigazine.net/news/20241007-meta-movie-gen/
完全自律型タクシー「サイバーキャブ」登場、テスラが新時代の移動手段を提案
2024年10月10日、テスラはロサンゼルス近郊で開催したイベント「WE,ROBOT」において、完全自動運転のEVタクシー「サイバーキャブ」を発表しました。
価格は2万5000ドル(約375万円)に設定され、ハンドルもペダルもない2人乗り車両。車内には大型ディスプレイと高音質サウンドシステムを搭載しており、非接触式充電器による充電が可能です。
発売時期については、2025年にテキサス州とカリフォルニア州で規制承認を取得し、2026年から量産を開始する計画です。
自動運転の安全な運行には、生成AIの技術が必要不可欠。イーロン・マスクCEOは「人間の運転よりも10倍安全な自動運転技術を実現する」と語っており、自動運転技術の実用化に向けた新たな一歩として注目されています。
Claude 3.5 Sonnetが画期的な進化「Computer Use」機能でPCの自律操作が可能に
2024年10月22日、AnthropicはClaude 3.5 Sonnetを更新し、「Computer Use」という画期的な新機能をβ版として追加したと発表しました。この機能により、AIアシスタントの活用範囲が大きく広がることが期待されています。
Computer UseはClaudeにPCの操作能力を付与する機能で、画面を”見て”、カーソルを移動したり、ボタンをクリックしたり、テキストを入力したりと、人間と同じようにPCを操作できます。
ただし、現時点ではβ版であるため、人間が直接PCを操作するよりも処理が遅くなるケースや、特定の座標を出力する際のミス、”幻覚”の発生、スクロールの信頼性が低いなど、いくつかの課題も指摘されています。
ただ、Computer Useの技術が当たり前になれば、PCを人間が操作する時代は終わってしまうかもしれません。Anthropic社の今後に注目です。
引用元:https://rozetta-square.jp/knowledge/8970/
Stability AI、Stable Diffusion最新版である「Stable Diffusion 3.5」をリリース
2024年10月22日、Stability AIは画像生成AIモデルの新バージョン「Stable Diffusion 3.5」を発表しました。
Stable Diffusion 3.5の特徴は、モデルのトレーニングプロセスの改善とファインチューニング・開発の簡素化にあります。複雑な指示を必要とせず、3D、写真、絵画、線画など多彩なスタイルで精細なグラフィックを生成可能。また、一般ユーザー向けの標準的なPCで、高負荷をかけずに実行できるように最適化されています。
今回のリリースでは、3つの異なるモデルが同時に提供され、用途に応じて選択できるようになりました。基本モデルのLargeは80億のパラメータ数を持ち、はるかに大きなパラメータ数を持つ競合モデルに並ぶ画像品質を実現しています。
また、非営利もしくは年間収益100万USドル未満の企業/個人による商用利用は無料となっており、幅広い層での活用が可能です。
引用元:https://gihyo.jp/article/2024/10/stable-diffusion-3-5
国内の生成AI関連ニュース
「NOMORE無断生成AI」26名の声優による異例の共同声明
2024年10月15日、中尾隆聖、山寺宏一ら有志で集まった26名の声優たちによる、無断生成AIによる被害や弊害を訴える啓発活動「NOMORE無断生成AI」が始動しました。この活動は、声優の声を無断でAI生成することに対する重要な問題提起として注目を集めています。
日本俳優連合(日俳連)の調査によると、昨年12月から今年2月にかけて、アニメやゲームなど少なくとも46作品、267人の声優の声が無断で生成AIコンテンツに利用され、特にTikTokなどで確認されているとのことです。
国内外で度々問題となる生成AIの著作権などの問題は、現時点では法整備などが整っていない状況。今後、どのような対策をすべきか、生成AIを利用するユーザーも考えなければなりません。
AI研究分野におけるニュース
現代AI技術の基礎を築いた2名の研究者がノーベル物理学賞を受賞
2024年10月8日、アメリカのプリンストン大学ジョン・ホップフィールド教授と、カナダのトロント大学ジェフリー・ヒントン教授の2人が、2024年のノーベル物理学賞を受賞しました。これは、AI技術の基礎研究が物理学の分野で高く評価された画期的な出来事として注目を集めています。
ホップフィールド教授は人間の神経回路を模倣した「人工ニューラルネットワーク」を使って、物理学の理論から画像やパターンなどのデータを保存し、再構成できる「連想記憶」と呼ばれる手法を開発。この手法により、不完全なデータから元のデータを再現することが可能となりました。
一方、ヒントン教授は連想記憶を統計物理学の理論などを使って発展させ、学習した画像などの大量データを元に、未知のデータを導き出すアルゴリズムを開発。
2人の研究は、現在のAI技術の中核を担う「機械学習」の基礎となり、その後「ディープ・ラーニング」など、新たなAI技術モデルの確立につながりました。
引用元:https://www3.nhk.or.jp/news/special/nobelprize/2024/physics/article_01.html
まとめ
今回の記事では2024年10月の生成AI関連ニュース10選を紹介しました。10月は、OpenAIの大型資金調達やテスラの完全自動運転EVタクシーの発表など、AIの実用化に向けた動きが加速した月となりました。また、機械学習の基礎を築いた研究者たちがノーベル物理学賞を受賞したことは、AIが科学技術の発展に大きく貢献していることを示す象徴的な出来事といえます。
昨今、生成AI業界の発展は凄まじいです。11月以降も最新動向をしっかりとチェックしながら、生成AIをどんどん活用していきましょう。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。