TOP ナレッジ 2024年12月の生成AI関連ニュースまとめ10選!

knowledgeナレッジ

2024年12月の生成AI関連ニュースまとめ10選!

January 06, 2025

  • AI
  • Share

2024年12月の生成AI業界は、OpenAIによる12日連続の新機能発表や、各社の新モデル発表により、年末に向けて大きな盛り上がりを見せました。 

本記事では、12月に起こった生成AI関連の重要なニュース10個をピックアップして要約します。最新のAI動向を見逃さないよう、ぜひ最後まで記事をご覧ください。 

海外の生成AI関連ニュース

Amazon、低コスト・高性能な基盤モデル「Nova」を発表

Amazonは12月4日、米ラスベガスで開催された「AWS re:Invent 2024」にて、新しい基盤モデル「Amazon Nova」を発表しました。クラウドコンピューティングサービス「AWS(Amazon Web Services)」上で提供される基盤モデルは、複数の異なる性能・用途のモデルで構成されています。 

基本モデルとして、テキスト処理に特化した「Nova Micro」、マルチモーダル処理が可能な「Nova Lite」「Nova Pro」が提供されます。また、画像生成向けの「Nova Canvas」と動画生成向けの「Nova Reel」も同時に発表されました。Amazon CEOのアンディ・ジャシー氏によると、同等クラスのモデルと比較して75%のコスト削減を実現したとのことです。 

さらに、Amazonは2025年も新モデルの提供を予定しています。第1四半期には、最も複雑な推論が可能な「Nova Premier」と、音声対話に特化した「Nova Speech-to-Speech」が登場予定。さらに2025年半ばには、テキスト・音声・画像・動画など、あらゆる形式の入出力に対応する「Nova Any-to-Any」の提供も予定されています。 

引用元:https://www.publickey1.jp/blog/24/amazonamazon_nova.htmlhttps://www.publickey1.jp/blog/24/amazonamazon_nova.html

OpenAI、12日間連続で新機能・サービス発表「12 Days of OpenAI」を開催

OpenAIは2024年12月6日から、12営業日連続で新機能や新製品を発表する「12 Days of OpenAI」を開催しました。クリスマスソング「12 Days of Christmas」にちなんで名付けられ、CEOのサム・アルトマン氏やOpenAIの社員らがライブ配信で新機能を紹介するイベントです。 

o1モデル&ChatGPT Proプランのリリースから始まり、動画生成AI「Sora」の一般提供やCanvas機能の全ユーザー開放など、大小さまざまな発表を実施。さらに、最終日となる12月21日には次世代モデル「o3」が発表され、2024年の年末を大いに盛り上げてくれました。 

OpenAI、月額200ドルの最上位プラン「ChatGPT Pro」を発表

OpenAIは12月6日、最上位有料プラン「ChatGPT Pro」を発表しました。月額200ドル(約30,000円)という高額な料金設定ながら、OpenAIの最新モデルすべてに無制限でアクセスできます。 

ChatGPT Proプランの目玉は「o1 pro mode」という最上位プラン専用モデルです。一般的なo1モデルと比較して、より多くの計算リソースを活用し、深い思考と高精度な回答を実現します。アメリカ数学オリンピックの予選問題では86%の正解率を達成し、通常のo1モデルの78%を上回りました。 

プログラミングコンテストでも高い性能を発揮し、複雑な数式や論理的思考を要する問題に強みを見せています。 

OpenAI、待望の動画生成AI「Sora Turbo」を一般提供開始

OpenAIは12月10日、動画生成AI「Sora Turbo」の一般提供を開始しました。テキストから最長20秒のHD動画を生成でき、1080pの高画質出力に対応します。 

新機能として「Remix」「Re-cut」「Storyboard」「Loop」「Blend」などの編集機能が追加され、クリエイティブな調整が可能になりました。生成速度も従来比で3倍に向上し、480p動画なら約5秒で生成が完了します。 

生成された動画には、AIによって作られたことを証明する電子署名と透かしが自動的に付与され、フェイク動画対策にも配慮しています。ChatGPT PlusとProユーザーは追加料金なしで利用可能です。 

Google、史上最速・高性能な「Gemini 2.0 Flash」をリリース

Googleは12月11日、最新AIモデル「Gemini 2.0 Flash」を発表しました。従来モデルの2倍の処理速度を実現し、画像認識から音声応答まで、さまざまな入出力に対応します。 

特筆すべき機能は「ビデオ認識」です。PC画面をAIが認識してくれるので、PCゲームをしながら「攻略方法を教えて」と質問したり、PC内蔵カメラを通じて電子機器を見せながら「操作手順を説明して」などと音声で指示したり、より人間に近いアシストが可能になりました。 

有料プラン「Gemini Advanced」では、複数の情報源から必要なデータを自動で収集・分析する「Deep Research」機能も利用可能です。Google AI Studioから無料版を利用できるため、ぜひ利用してみてください。 

Google、4K解像度対応の動画生成AI「Veo 2」を発表

GoogleのAI研究部門DeepMindは12月16日、動画生成AI「Veo 2」を発表しました。AIによる動画生成では業界最高水準となる4K解像度での動画生成を実現し、数分間の長尺動画にも対応します。 

また、映画制作で使用される専門的な表現にも対応し「18mmレンズで撮影」「ローアングルから見上げる」といった細かな指示が可能です。さらに、水の流れや物体の落下など、現実世界の物理法則に基づいた自然な動きを、高い精度で再現できます。 

生成された動画には目に見えない電子透かし「SynthID」が埋め込まれ、AI生成コンテンツの識別や不正利用の防止に活用できます。現在はウェイティングリストへの登録を受け付けており、実験的な提供段階として無料での提供が予定されています。 

Google DeepMind、3D仮想世界生成AI「Genie 2」を発表 

Google DeepMindは12月17日、テキストや画像から3D仮想世界を生成するAI「Genie 2」を発表しました。キーボードとマウスで操作可能な3D環境を生成し、人間やAIエージェントがプレイできる空間を作り出します。 

Genie 2の特徴は、リアルな物理法則に基づいた環境の生成です。ユーザーの視点変更にも自然に対応し、視界外の情報も矛盾なく再現します。現在は1分間の環境生成に限定されていますが、将来的にはゲーム開発やバーチャル空間の制作に活用される技術といえるでしょう。

引用元:https://aismiley.co.jp/ai_news/genie-2-llm-google-deepmind/

OpenAI、AGI実現に最も近いモデル「o3」「o3-mini」を発表

OpenAIは12月21日、「12 Days of OpenAI」の最終日に次世代モデル「o3」「o3-mini」を発表しました。o3は数学やプログラミングで人間の専門家を上回る性能を示し、AGI(人間のように多様な問題を解決できる汎用人工知能)の実現に最も近づいたモデルとして注目を集めています。 

競技プログラミングサイト「Codeforces」で2727 Eloというトッププログラマーを超えるスコアを達成し、未発表の数学問題で構成された「Frontier Math」では25.2%という驚異的な正答率を記録しました。 

また、o3-miniは大・中・小3段階の「思考時間」設定を備え、最短の「小」設定でもo1-miniを上回る性能を発揮します。両モデルとも2025年1月末から提供開始予定です。 

生成AIをめぐる議論・提言

生成AI主要6社の安全性評価で全社「C以下」、メタは最低評価「F」

米国の非営利団体「フューチャー・オブ・ライフ・インスティテュート」は12月14日、生成AI開発主要6社の安全対策を評価する報告書を発表しました。評価対象はOpenAI、Google DeepMind、Meta、Anthropic、xAI、ZhipuAIの6社です。 

評価はA~Fの6段階で行われ、最高評価のAやBに該当する企業はありませんでした。Anthropicが6社の中で最高評価のC、Meta(旧Facebook)が最低評価のFとなり、その他の企業はD評価でした。 

報告書では著作権侵害や誤情報の拡散など、AIの不正利用を防ぐ対策が不十分だと指摘し、外部有識者による検証の必要性を訴えています。 

引用元:https://www.yomiuri.co.jp/economy/20241213-OYT1T50249

OpenAI、非営利から営利主導へ-巨額資金調達を視野に経営体制を変更

OpenAIは12月28日、新たな営利企業が経営を主導する体制に変更する方針を発表しました。 

OpenAIは従来、非営利法人が営利部門を監督する体制でしたが、以下の2つの組織に役割を分けることを発表しました。 

  • 非営利法人:医療・教育・科学分野での慈善活動に特化 
  • 新設の営利企業:事業戦略の決定と資金調達を担当 

営利企業主導の新体制により、MicrosoftなどのIT企業と同様の大規模な資金調達が可能になります。OpenAIは「公益性を保ちながら、より積極的な事業展開を目指す」としています。 

引用元:https://news.goo.ne.jp/article/ntv_news24/business/ntv_news24-2024122801848838.html

まとめ

2024年12月は、OpenAIの「12 Days of OpenAI」を皮切りに、各社から画期的な新モデルや新機能が発表されました。特に動画生成AIの分野では、OpenAIの「Sora Turbo」やGoogleの「Veo 2」など、高品質な動画生成を実現するモデルが登場。2025年の動画生成AIの精度向上に期待できます。 

一方で、安全性への懸念も浮き彫りとなり、業界全体での対策強化が求められています。2025年は競争がさらに激化し、より高度なAIモデルの登場が予想されますが、生成AI業界がどのように発展していくのか、引き続き注目しましょう。 

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

T-4OOの詳細を確認す

  • Share
一覧へ