TOP ナレッジ Googleのハルシネーションを軽減できるAI「DataGemma」 とは?概要や今後の展望を解説!

knowledgeナレッジ

Googleのハルシネーションを軽減できるAI「DataGemma」 とは?概要や今後の展望を解説!

October 24, 2024

  • AI
  • Share

近年、AI技術の進歩により、多くの人が生成AIを活用しています。ただ、生成AIが不正確な情報を生成してしまう「ハルシネーション」に悩まされていませんか?

2024年9月12日に、そんな悩みを解決する新たなAIモデル「DataGemma」がGoogleから発表されました。DataGemmaは、ハルシネーション(幻覚)リスクを軽減し、他モデルよりも正確な情報を提供してくれるAIモデルです。

本記事では、DataGemmaの概要や今後の展望について詳しく解説します。

そもそもハルシネーションとは?

ハルシネーション(hallucination)は、AIにおける「誤った情報を生成する現象」を指します。特に自然言語処理の分野で使われ、AIモデルが実際には存在しない事実や、根拠に基づかない情報を生成するのです。

例えば、架空の人物や出来事を実在するかのように説明したり、誤った統計データを提示したりすることがあります。ハルシネーションは、AIが学習データの断片を不適切に組み合わせてしまうことで発生する現象です。

AIがハルシネーションを起こしてしまうと、特に重要な意思決定や正確性が求められる場面では深刻な問題を引き起こす可能性があります。

ハルシネーションに関して詳しく知りたい方は、下記の記事をご覧ください。

【生成AIをビジネスや実生活で活用しよう!】生成AI活用におけるリスク…Part1

DataGemmaの概要

DataGemmaは、Googleが開発した新しいAIモデルで、ハルシネーション問題に取り組むために設計されました。このモデルの特徴は、Googleが構築した「Data Commons」という膨大なデータセットを活用している点です。

DataGemmaは、Data Commonsのデータを基に、RIG(Retrieval Interleaved Generation)とRAG(Retrieval Augmented Generation)という2つの革新的な手法を用いてより正確な情報生成を実現しています。

RIG(Retrieval Interleaved Generation)

RIGは、AIの回答を「信頼できるデータと照らし合わせて確認する」というプロセスが加えられた手法です。AIが情報を生成する過程で、Data Commonsのデータを参照し、正確性を高めています。

 RAG(Retrieval Augmented Generation)

RAGは、AIが回答を生成する前に「関連する情報を事前に集めておく」という方法で、ハルシネーションを抑えています。AIが質問に答える前に、Data Commonsから関連情報を取得し、それを基に回答を組み立てるのです。

DataGemmaの今後の展望

近年、急成長している生成AIサービスですが、使用するうえでハルシネーションというリスクはつきものでした。ただ、DataGemmaの登場により、ハルシネーションを軽減する技術が広まれば、生成AIへの信頼性が向上すると期待されています。

Googleの初期テストでは、従来のモデルと比較して大幅な精度向上が確認されました。特にRIGアプローチを用いた場合、正確性が約58%まで向上したとされています。

今後、Googleはこれらの手法をさらに洗練させ、より大規模なテストを行う計画です。最終的には、DataGemmaの技術をGemmaとGeminiの両モデルに統合し、ハルシネーションが起こらない生成AIを誕生させるでしょう。

ハルシネーションが起こらない生成AIが実現すれば、AIが提供する情報の信頼性が飛躍的に向上し、研究やビジネスなど、幅広い分野での活用が期待できます。

まとめ

本記事では、GoogleのDataGemmaについて解説しました。生成AIを扱ううえで、ハルシネーションは常に問題視されていましたが、DataGemmaがハルシネーション論争に終止符を打つかもしれません。

また、今後さらなる研究開発により、各社生成AIがより正確で信頼できる情報を提供できるようになる可能性もあります。DataGemmaの進化に注目しつつ、競合他社の動向にも注目しましょう。

AIメディアライター植田遊馬

Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。

生成AIによる専門文書の精密な翻訳ソリューション

T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。

細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴

  • 専門2000分野・100言語をカバー
  • スキャン画像PDFも丸ごと翻訳
  • 社内・業界フレーズを自動学習
  • Web上でラクラク訳文編集
  • その場で解決 電話でサポート

単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。

  • Share
一覧へ