昨今、生成AI関連ニュースの動きは激しいですが、2024年9月も生成AI関連の大きなニュースが相次ぎました。
今回の記事では、9月に起こった生成AI関連のニュースを10個ピックアップして要約します。最新のAI動向を見逃さないよう、しっかりチェックしてください。
海外の生成AI関連ニュース
Apple、生成AI搭載のiPhone 16シリーズを発表
2024年9月10日、Appleが待望の新型iPhone「iPhone 16」シリーズを発表しました。今回の目玉は、独自の生成AI「Apple Intelligence」の搭載です。
iPhone 16シリーズは、標準モデルの「iPhone 16」と大画面の「iPhone 16 Plus」、高性能モデルの「iPhone 16 Pro」と「iPhone 16 Pro Max」の4機種で構成されています。
また、AppleはOpenAIとの提携も発表し、SiriなどにChatGPTの機能を導入して音声アシスタントの機能を強化。新機能の「Apple Intelligence」は、メールの文章添削や校正、長文の要約、文章のトーン変換など、さまざまな場面でユーザーの生活をサポートします。
価格は前モデルから据え置きとなり、日本での価格は以下のとおりです。
- iPhone 16:124,800円〜
- iPhone 16 Plus:139,800円〜
- iPhone 16 Pro:159,800円〜
- iPhone 16 Pro Max:189,800円〜
なお、「Apple Intelligence」の日本語版は2025年以降に対応予定とのことです。
Google、Geminiのカスタム機能「Gems」を発表
2024年9月6日、Googleは生成AIモデル「Gemini」に新機能「Gems」を追加し、ユーザーが“自分専用のAIアシスタント”を作成できるようになったことを発表しました。Gemsは、Gemini Advanced、Business、Enterpriseユーザー向けに提供されています。
GemsはChatGPTのGPTsに似た機能で、ユーザーは特定の指示をGeminiに与え、独自のAIアシスタントを作成可能です。例えば、プロジェクトのブレインストーミングやキャリアアドバイス、SNSの投稿文作成など、さまざまな用途に対応可能なAIモデルをGemsとして設定し、繰り返し利用することができます。
さらに、Googleはあらかじめ設定された「プリセットGems」も提供しており「学習コーチ」「キャリアガイド」「ブレインストーマー」「ライティングエディター」「コーディングパートナー」などが用意されています。
Gemsは、OpenAIのGPTsに対抗する動きとも見られており、AIアシスタントのカスタマイズ競争が激化しそうです。
引用元:https://miralab.co.jp/media/google_gems_release/
OpenAI、新AIモデル「o1」と「o1-mini」を発表
2024年9月12日、OpenAIが新しいAIモデル「o1」とその小型版「o1-mini」を発表しました。o1は、人間のように複雑な問題を推論する能力を持ち、従来のモデルよりも複雑な問題を解決する能力が優れています。
特にコーディングや数学などの複雑な問題に対応する能力が向上しており、米数学オリンピック予選(AIME)問題の正答率は、従来のGPT-4oモデルの13%を大きく上回る83%という結果でした。
「o1」と「o1-mini」は、ChatGPTの有料プランであるPlus、Team、Enterprise、Eduユーザーが利用可能です。
引用元:https://www.multifverse.com/blog-posts/openai-strawberry-o1-release
Google、ハルシネーション対策モデル「DataGemma」を発表
2024年9月12日にGoogleは、AIのハルシネーションに対応するために開発された初のオープンモデル「DataGemma」を発表しました。DataGemmaは、Googleの軽量版LLM「Gemma」を基盤に「Data Commons」という信頼性の高いデータを活用して回答するモデルです。
DataGemmaは、RIG(Retrieval-Interleaved Generation)とRAG(Retrieval-Augmented Generation)という2つのアプローチを利用し、LLMの事実性と推論を強化しています。これにより、ハルシネーションのリスクが最小限に抑えられ、応答の精度が向上するのです。
DataGemmaの登場は、生成AI業界におけるハルシネーション問題への取り組みの一例として注目されています。この技術が進展し、他の企業も同様の取り組みを行うことで、将来的にハルシネーション問題が軽減される可能性があるでしょう。
引用元:https://aismiley.co.jp/ai_news/datagemma-google-data-commons-llm-ai/
Google、音声AIアシスタント「Gemini Live」を無料提供開始
2024年9月12日にGoogleは、AI音声アシスタント「Gemini Live」の無料提供を、Android版アプリで開始しました。現在は英語版のみの提供ですが、Androidユーザーはスマートフォンの言語設定を英語にすれば日本でも利用可能です。これまで有料プラン限定だった機能が、今回から無料ユーザーにも開放されました。
Gemini Liveは自然な会話でユーザーをアシストする次世代AI機能で、10種類の音声パターンから選択できます。今後数週間以内に他のAndroidデバイスやiOS、さらには他言語にも対応が拡大される予定です。
後述するChatGPTも「Advanced Voice Mode(高度な音声モード)」に力を入れており、AI音声アシスタントサービスの競争が激化しそうです。
引用元:https://aismiley.co.jp/ai_news/rollout-geminilive/
ChatGPT「Advanced Voice Mode(高度な音声モード)」をPlusプランに提供開始
2024年9月20日、OpenAIはChatGPTの有料プラン(Plus、Team)のユーザーに向けて「Advanced Voice Mode(高度な音声モード)」の提供を開始しました。従来の音声入力よりもレスポンスが高速になったことにより、テンポのよい会話が可能です。
また「カスタム指示」や「メモリ」機能も使用可能になり、ChatGPTとのやりとりをより自然かつ効率的にできます。各国の言語へリアルタイム翻訳も可能なので、さまざまな活用法がありそうです。
Googleの「Gemini Live」と同じような機能性をもっているため、どちらのAIアシスタントが高機能なのか気になるところです。
引用元:https://news.mynavi.jp/article/20240925-3031680/
Meta、マルチモーダル対応の「Llama 3.2」を発表
2024年9月25日、Metaは「Meta Connect 2024」にて、大規模言語モデル(LLM)「Llama 3.2」を正式に発表しました。新モデルはテキストだけでなく、画像や音声、動画などを処理できる「マルチモーダル対応」が最大の特徴です。
Llama 3.2は、特に画像や動画を用いた視覚的なデータ解析に強みを持ち、企業や開発者は、複雑なビジュアルを含むタスクにも対応するAIシステムを構築できます。
MetaはLlama 3.2を「AIのLinux」と位置付け、オープンソースとして広く公開しています。オープンソースとして公開されているため、開発者はモデルを自由にカスタマイズし、クラウドやオンプレミス環境で実際に運用・展開することが可能です。
また、Llama 3.2は1Bや3Bといった「小規模モデル」も提供しており、スマートフォンなどの利用に最適化されています。デバイス内で処理が完結し、ユーザーデータが外部に送信されることなく、高速かつプライバシー保護された応答が可能となるのです。
オープンソースでありながら高機能なLlama 3.2。さまざまな開発者がLlama 3.2を利用したツールやサービスを開発し、世界中に普及していくでしょう。
引用元:https://ledge.ai/articles/meta_llama-3-2_meta_connect2024
国内の生成AI関連ニュース
SakanaAI、総額200億円規模の資金調達を実施
2024年9月4日、国内で大注目されているAI技術企業SakanaAIは、総額200億円規模の資金調達を発表しました。NVIDIAが数十億円を出資し、他にも米ベンチャーキャピタルのニュー・エンタープライズ・アソシエイツ(NEA)、コースラ・ベンチャーズ、ラックス・キャピタルが名を連ねています。
今回の資金調達により、SakanaAIの企業価値は11億ドル(約1600億円)を超え、日本発のスタートアップとして最速でユニコーン企業の仲間入り。NVIDIAとの協力関係により、研究開発や日本におけるAI人材育成が大きく推進すると予想されています。
また、NVIDIAのGPUとSakanaAIの技術を組み合わせ、効率的なAI開発環境の実現も期待されています。
生成AIをめぐる議論・提言など
NVIDIAの独占禁止法違反疑惑、司法省からの召喚状をめぐり混乱
2024年9月4日、AIチップ市場で強大な支配力を持つNVIDIAに対し、アメリカ司法省(DOJ)が独占禁止法に基づく召喚状を送ったことが報じられました。しかし、その後NVIDIAは「召喚状は受け取っていない」と報道を否定しました。
NVIDIAによると、DOJから正式な召喚状は発行されていないものの、これまでに情報提供の要求や民事調査要求(CID)は受け取っているとのことです。
NVIDIAは「AIコンピューティング市場における同社の優位性は、優れた製品に由来するものです」との声明を出していますが、DOJの調査の行方に注目が集まっています。
引用元:https://gigazine.net/news/20240905-nvidia-didnt-antitrust-subpoena/
OpenAI CEOのサム・アルトマン氏、AIの未来を語るメモを公開
2024年9月23日、OpenAIのCEOであるサム・アルトマン氏が自身のWebサイトで「知性の時代(The Intelligence Age)」という“AI主導の未来”について、詳細なビジョンを示すメモを公開しました。
アルトマン氏は、ディープラーニングの可能性を強調し「気候問題の解決、宇宙植民地の確立、そして全ての物理法則の発見」などの難題を解決できるようになると述べています。
また、特に注目を集めているのは、スーパーインテリジェンス(超知能)が「数千日以内に」実現する可能性があるという発言です。これは多くの専門家が予測する「5年」よりもかなり早い予想であり、業界内外から大きな注目を集めています。
アルトマン氏はAIが近い将来「全ての人が多くのことを成し遂げられるようにする」と述べていますが、同時にAIによる仕事の喪失や、計算コストの問題、高度なチップの入手など、課題にも言及しています。
まとめ
今回の記事では2024年9月の生成AI関連ニュース10選を紹介しました。新製品の発売や、新しいAIモデルの発表など、9月も活発な月だったといえますね。
サム・アルトマン氏も言及していたとおり、AIが全人類の知能を超越する日も近いと思います。10月以降も引き続き生成AI関連のニュースに注目し、最新の動向を把握しておきましょう。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。