近年、人工知能(AI)技術の急速な発展により、さまざまな分野で生成AIの活用が進んでいます。しかし、主要の生成AI(ChatGPTやGeminiなど)は英語を中心に開発されており、多言語対応はしているものの、日本語の表現力は完璧とはいえません。
そこで注目されているのが「日本語に特化した生成AI」の開発です。本記事では、日本語特化の生成AIの必要性や、政府と企業の取り組みを解説します。また、記事の後半ではChatGPT、Gemini、Claudeの日本語力比較も行いますので、ぜひ最後までご覧ください。
日本語特化の生成AIの必要性
現時点でも日本語に対応している主要生成AIですが、そもそも日本語特化の生成AIは必要なのでしょうか?ここでは、日本語に特化した生成AIが必要とされる理由を解説します。
言語の複雑性
日本語は文法構造や表現方法が英語とは大きく異なり、独特の複雑さを持っています。学習データが英語である一般的な生成AIでは、この複雑さに十分に対応できないケースが多々あります。
例えば下記の例文のように「いいです」という表現は状況によって肯定とも否定ともとれます。
肯定:「〇〇と△△はどちらがいいですか?」「〇〇がいいです。」
否定:「お手伝いしましょうか?」「いいです。」
生成AIに日本語の文章を生成してもらう際、複雑な言語である日本語は、完璧に表現できないことも多々あるのです。
文化的背景
言語には文化的な要素が深く関わっています。例えば日本で「桜」と聞くと春を連想し、「蝉」と聞くと夏を連想する方が多いでしょう。ただ、天候や文化が全く異なる国の言語で学習したAIは、微妙なニュアンスを表現するのがむずかしいのです。
日本語特化の生成AIができれば、日本の文化や慣習を理解したうえで、より適切な表現や回答を生成できる可能性があるといえるでしょう。
総務省とKDDIが共同研究
日本語特化型AIの開発を加速させるため、総務省とKDDIが共同研究を開始しました。
具体的には、総務省傘下の情報通信研究機構(NICT)が、9TBに及ぶ日本語学習データを提供し、高性能な生成AIを開発中とのことです。9 TB というデータは、GPT-3の2倍以上の規模であり、日本語処理の精度向上に大きく貢献すると期待されています。
また、KDDI側はAIの誤った解答(ハルシネーション)を抑える技術や、マルチモーダル技術を提供し、AIの信頼性やさまざまな情報処理能力を高める一助を担います。NICTの膨大なデータとKDDIの先進技術を組み合わせることで、より高性能な日本語特化型の大規模言語モデル(LLM)の開発が期待できるでしょう。
また、総務省とKDDIの共同研究の成果は、実生活での活躍も期待されています。
例えば、地図情報を活用した正確な観光ルートの作成や、防災面での活用など、具体的な応用が見込まれているのです。さらに、研究成果を他のAI開発企業や研究機関、大学にも展開する計画があり、日本全体のAI技術の底上げにつながることが期待されています。
AIという分野では世界に遅れを取っているという印象の日本。総務省とKDDIが共同研究は、日本のAI技術の発展に大きく寄与するものと考えられています。
主要生成AIの日本語力は?
現時点(2024年7月)での生成AIの日本語力は、どのようなものでしょうか?下記3つの生成AIに同様のプロンプトを入力し、比較します。
- ChatGPT(GPT4o)
- Gemini(Gemini Pro)
- Claude3(Claude3.5 Sonnet)
※上記のモデルはいずれも無料で利用できます。
実験1:小説の執筆
まずはシンプルに下記の質問をしてみました。
プロンプト「小説の導入文を300文字以内で生成して下さい。舞台は近未来の日本です。」
各生成AIの回答は以下のとおりです。
それぞれ似たような物語ではありますが、短い文章の中でも興味深いストーリーを生成してくれました。ただ、文字数の「300文字以内」という指示に従ったのはChatGPTとClaudeだけで、Geminiは文字数がオーバーしています。
また、Claudeは「この導入文は273文字です」と言っていますが、カウントしたら202文字でした。筆者は仕事で各種生成AIをフル活用していますが、文字数のカウントはどの生成AIも苦手な印象です。
また、日本語力という観点でいうと、ChatGPTの文章は句読点の場所に違和感がありますし、Claudeは誰の冒険が始まるのかがイマイチわかりません・・・
ただ、第170回芥川賞を受賞した「東京都同情塔」を執筆した九段理江さんは「作中の5%ほどは生成AIの文章をそのまま使っている」という発言をしており、細かい修正指示などを出せば十分に実用的な性能なのかもしれません。
実験2:なぞかけ
次に、日本独特の文化である「なぞかけ」に関する質問をしてみます。
プロンプト「日本独特の文化である『なぞかけ』を1つ考えてください。」
各生成AIの回答は以下のとおりです。
クオリティは一回置いておいて、ChatGPTとClaudeは「なぞかけ」という概念を理解できていました。ただ、Geminiが生成したのは「なぞなぞのような何か」なので「なぞかけ」の概念をまったく理解していないことがわかります。
個人的に「なぞかけ」に関する生成AIへの質問は興味深いものがありました。「うまい!」とはならないものの形にはなっており、いつかプロの芸人さんレベルの回答をするAIも登場するかもしれません。
ここまで3つの生成AIで日本語の比較をしてきました。ただ、現在ChatGPTとClaudeは最高性能であるモデルが無料で利用できますが、Geminiは最高性能モデルを利用するために有料プランに加入しなければなりません。
もしもGeminiの有料プランに加入している方は、最高性能モデルに同じ質問をして、再度比較をしてみてください。
また、各種生成AIを詳しく比較した記事もありますので、よければご覧ください。
まとめ
主要な生成AIの日本語力には改善の余地があり、日本語に特化したAIの開発は重要な課題となっています。総務省とKDDIの共同研究をはじめとする取り組みは、日本のAI技術の発展に大きく貢献するでしょう。
ChatGPTやGeminiなどの既存AIモデルの進化と並行して、日本語に特化したAIの開発が進むことで、より豊かな表現力が整備されるはずです。日本語特化の生成AIの発展に注目していきましょう。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。