ソフトバンクは2024年11月8日、日本語に特化した大規模言語モデル「Sarashina2-8x70B」を公開しました。グループ会社のSB Intuitionsが開発を担当し、Meta社の『Llama 3』と同等の4600億という大規模なパラメータ数を実現。宮川潤一CEOは「日本でも大規模なAIを作れると証明した」と語り、日本企業のAI開発力の高さを示しました。
今回の記事では、SB Intuitionsが開発した「Sarashina 2-8x70B」の概要や、今後の展望などを解説します。
Sarashina2-8x70Bとは?
Sarashina2-8x70Bは、ソフトバンクのグループ会社であるSB Intuitionsが開発した、日本語に特化した大規模言語モデル(LLM)です。複数の専門家モデルを組み合わせるMixture of Expertsという手法を採用した大規模言語モデルで、高度な推論能力が可能になります。
Mixture of Experts とは、複数の異なる専門モデルが連携して高度な言語処理を実現する手法です。例えば、数学の質問には数学に強いモデルが回答し、医学に関する質問には医療分野に強いモデルが回答するなど、複数の専門モデルが協力して解答をしてくれます。
ちなみにSarashina2-8x70Bは、8個の異なる専門モデルが連携して高度な処理を実現します。
また、Sarashina2-8x70Bは処理能力の基盤として、NVIDIA社の最新GPU「H100」を約6000台導入。1台で一般的なパソコンの数百倍以上の演算能力を持つH100を6000台集約することで、数万台のパソコンに匹敵する超大規模な計算基盤を実現しています。
2025年度上半期には1万台まで増強する計画も発表されており、世界最大級のAI開発基盤となりそうです。
Sarashina2-8x70Bはいつから使えるの?
現在のSarashina2-8x70Bは、研究開発目的のみで公開されている段階です。一般のユーザーがすぐに利用できる状態ではありません。その理由は、現在のモデルが「指示チューニング」と呼ばれる重要な調整を行っていないためです。
指示チューニングとは、人間の意図を正確に理解し、適切な応答ができるように調整する工程です。膨大な単語や文法を知っている大規模言語モデルでも、実際のコミュニケーションに必要な“文脈理解”や“適切な返答の仕方”を学んでいく必要があります。
ソフトバンクは2025年度の商用サービス開始を目標に開発を進めています。共同通信社との提携により、質の高いニュースコンテンツを活用した学習を進行中です。また、GPUの増強によって学習速度を高め、早期の実用化に向けて取り組んでいます。
利用開始時期は2025年度を予定していますが、具体的なサービス内容や料金体系などの詳細はわかっていません。ソフトバンクの今後の発表を待ちましょう。
Sarashina2-8x70Bの今後の展望
宮川CEOは、現在の4600億パラメータの倍以上である「1兆パラメータモデル」への挑戦も表明。パラメータ数の増加により、より複雑な言語理解や多様なタスクへの対応が可能になると期待されています。
※パラメータ=モデルの「知識」や「経験」を数値化したもの。OpenAIが開発したGPT-3は約1750億パラメータ
また、活用分野も広がりを見せる見込みです。医療分野での診断支援システムや教育現場での個別指導プログラム、行政サービスの自動化など、日本特有の社会課題解決に向けた具体的な応用が検討されています。さらに、企業の業務効率化や新サービス開発など、産業界での活用も期待されています。
まとめ
今回の記事では、ソフトバンクが開発した日本語特化型大規模言語モデル「Sarashina2-8x70B」について解説しました。4600億という膨大なパラメータ数と独自の技術開発により、日本企業のAI開発力の高さを示す画期的な大規模言語モデル登場といえるでしょう。
Sarashina2-8x70Bは、医療や教育、行政など、さまざまな分野での活用が期待されています。今後の展開に注目していきましょう。
AIメディアライター・植田遊馬
Webライター歴4年目。ChatGPTの登場で生成AIの可能性に衝撃を受け「生成AIオタク」に。さまざまな生成AIを駆使しながらライター業を営む傍ら「多くの人に生成AIの魅力を伝えたい!」という想いで、生成AI系メディアでの記事執筆を行っている。
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。