
近年、AI技術の進歩により、多くの人が生成AIを使っています。ただ、生成AIが不正確な情報を作成してしまう「ハルシネーション」問題に対して、悩むことありませんでしょうか?
2024年9月12日に、そんな悩みを解決する新たなAIモデル「DataGemma」が、Googleから発表されました。DataGemmaは、ハルシネーション(幻覚)リスクを軽減し、他モデルよりも正確な情報を提供してくれるAIモデルです。
本記事の内容は、DataGemmaの概要や今後の展望について詳しく解説します。
そもそもハルシネーションとは?
ハルシネーション(hallucination)は、AIにおける「誤った情報を生成する現象」を指します。特に自然言語処理の分野で使われ、AIモデルが実際には存在しない事実や、根拠に基づかない情報を生成するのです。
例えば、架空の人物や出来事を実在するかのように説明したり、誤った統計データ情報を提示したりすることがあります。ハルシネーションは、AIが学習データの断片を不適切に組み合わせてしまうことで発生する現象です。
AIがハルシネーションを起こしてしまうと、特に重要な意思決定や正確性が求められる場面では、深刻な問題を引き起こす可能性があります。
ハルシネーションに関する詳細を知りたい方は、下記の文章をご覧ください。
【生成AIをビジネスや実生活で活用しよう!】生成AI活用におけるリスク…Part1
DataGemmaの概要
DataGemmaは、Googleが開発した新しいAIモデルで、ハルシネーション問題に取り組むために設計されました。このモデルの特徴は、Googleが構築した「Data Commons」という膨大なデータセットを運用している点です。
DataGemmaは、Data Commonsのデータを基に、RIG(Retrieval Interleaved Generation)とRAG(Retrieval Augmented Generation)という、2つの革新的な手法を用いて、より正確な情報生成を実現しています。
RIG(Retrieval Interleaved Generation)
RIGは、AIの回答を「信頼できるデータと照らし合わせて確認する」というプロセスが加えられた手法です。AIが情報を生成する過程で、Data Commonsのデータ情報を参照し、正確性を高めています。
RAG(Retrieval Augmented Generation)
RAGは、AIが質問に応じた回答を作成する前に、「関連する情報を事前に集めておく」という方法で、ハルシネーションを抑えています。AIが質問に答える前に、Data Commonsから関連情報を取得し、それを基に回答を組み立てるのです。
DataGemmaの今後の展望
近年、急成長している生成AIサービスですが、使用するうえでハルシネーションというリスクはつきものでした。ただ、DataGemmaの登場により、ハルシネーションを軽減する技術が広まれば、生成AIへの信頼性が向上すると期待されています。
Googleの初期テストでは、従来のモデルと比較して、大幅な精度向上が確認されました。特にRIGアプローチを使った場合、正確性が約58%まで向上したとされています。
今後、Googleはこれらの手法をさらに洗練させ、より大規模なテストを行う計画です。最終的には、DataGemmaの技術をGemmaとGeminiの両モデルに統合し、ハルシネーションが起こらない生成AIを生み出させるでしょう。
ハルシネーションが起こらない生成AIが実現すれば、AIが提供する情報の信頼性が飛躍的に向上し、生成AIの導入が現在より必要になるかもしれません。研究やビジネスなど、幅広い業界や分野で効率なツールとしての利用も期待できます。
まとめ
本記事のコンテンツでは、GoogleのDataGemmaについて紹介しました。生成AIを扱ううえで、ハルシネーションは常に問題視されていましたが、DataGemmaがハルシネーション論争に終止符を打つかもしれません。
また、今後さらなる研究開発により、各社生成AIがより正確で信頼できる情報を提供できるようになる可能性もあります。結果として、利用する際にもより安心・安全と感じるでしょう。DataGemmaの進化に注目しつつ、競合他社の動向にも注目しましょう。

AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。

「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。