いまや、日常生活のみならずビジネス活用も珍しくなくなった「AI」。
ChatGPTは仕事の便利ツールの代表格になり、画像生成や動画生成も含め毎週のようにAI搭載サービスのローンチやアップデートがニュースになる。この1年でいくつ「時代を変える神ツール」が出ただろう。そして、どれだけ私たちが使いこなせているのだろうか……。
そこでRozetta Square編集部では、AIを主軸にサービスを生み出す業界のリーダーの座談会を開催。
テーマは社会を成り立たせるもっとも基本的な要素である「コミュニケーション」。
AIによって、私たちのコミュニケーションはどう変わろうとしているのか? 人間とAIはコミュニケーションできるのか? ビジネスになるAIの共通点は? かつてトレンドだった「AI脅威論」は、結局どうだったのか? 私たちとAIの関係性について、いま改めて語り合った。
プロフィール
株式会社NTTドコモ・R&D戦略部担当部長・吉田 直政 様
NTTドコモでインフラ開発、サービス開発、新規事業創出に従事。オープンイノベーションをリードする新規事業創出プログラム「39works」「トップガン」の企画・設計・実行を担当し、7年間で40以上のプロジェクト事業化挑戦に寄与。さらに技術を核にサービス企画、事業創出に携わり社内外のメンバーと20以上のプロジェクトを社会実装するなど、社内外を巻き込んだ革新的な新規事業を生み出す仕掛け人。
株式会社Visionary Engine・CEO・小栗 伸 様
NTTドコモでは新規事業プロデューサーとしてAIプロジェクトを製品化・事業化した経験から、新規事業の立ち上げや事業創出の仕組み化を得意とする。世界で最も権威あるIFデザインアワードGoldをはじめ、グッドデザイン賞・日本財団ソーシャルイノベーションアワードなど、国内外のアワード18件受賞。経済産業省主催「始動Next Innovator 2021」採択。
株式会社ロゼッタ・取締役・古谷祐一
2007年にGMOインターネットの連結子会社であるGMOスピード翻訳株式会社の代表取締役社長を経てロゼッタの連結会社Xtra株式会社の代表取締役に就任(退任)。
現在は取締役としてロゼッタの営業部門を統括。AI翻訳の限りない可能性を世の中に広めるべく精力的に活動している。
2012年より一般社団法人日本翻訳連盟理事(10年従事し退任)、2014年よりアジア太平洋機械翻訳協会(AAMT)監事を務める(現任)。
人類はAIに「慣れてしまった」?
ーー まず、みなさんは現在のAIの状況をどう見ていますか。正直ツールが多すぎてついていけてません。
NTT DOCOMO・吉田 みんなAIとの対話に「慣れてしまった」という感じがしていますね。仕事でもLLM(大規模言語モデル)を使うことは珍しくはなくなって、「プロンプトを打つのがめんどくさい」とか言い出している(笑)。
Visionary Engine・小栗 たしかに。AIプロダクトを開発してきた私たちからすれば、ものすごい時代になっているんですけどね。
ロゼッタ・古谷 そうですね。チャットボットなどでごく普通にAIとコミュニケーションをとっていますが、たった2年前には想像できなかった状況です。
古谷 AIの歴史をごく簡単に振り返ると、1980年代にすでにニューラルネットワークは理論化されていたようです。しかし当時はCPUやサーバーの性能に限界があって実現はできなかった。その後のひとつの転換点は、2016年にGoogleが発明した大規模言語モデル基盤「Transformer」で、これをもとに多くのGPT(Generative Pretrained Transformer=言語モデル)が開発される基礎ができました。ロゼッタでも機械翻訳にTransformerを活用しはじめ、その流れで技術が蓄積したことで、現在のように翻訳以外のAIプロダクトも開発できています。
ーー 吉田さんと小栗さんがドコモで対話型のAIプロダクトを開発しはじめたのもこの時期ですか?
小栗 ドコモでは、2010年頃から『しゃべってコンシェル』など、対話型のプロダクト開発を行っていました。2019年に提供を開始した「おしゃべり案内板®」もそうですね。キャラクターと対話しながら案内を受けるもので、外国語にも対応してインバウンドへの観光案内などにも使えるものです。
古谷 ヴィジュアルつきのAIチャットボットですね。
小栗 ええ。ただ、あの時代は特定のシーンに対してしっかり返答させることで精一杯だったんです。現在は幅広いタスクでコミュニケーションの応用がきく。ChatGPT以降、大きく変わりました。
古谷 2022年11月のChatGPT3.5の登場が契機ですね。私は25年ほど自動翻訳・機械翻訳の事業に携わってきましたが、あれほどの衝撃はなかなかなかった。
吉田 古谷さんの専門の「翻訳」の視点ではどうでしたか。
古谷 もっとも大きいのは関係代名詞の理解です。それまでのGPTはセンテンスの意味は理解できても、話者が「彼」「彼女」「彼ら」なのかがわからなかった。ChatGPT3.5は文章の文脈を解釈できることで、コミュニケーションの質が上がりました。
吉田 明らかに一段高くなりましたよね。はじめてチューリングテストを超える感覚がありました。
古谷 これを契機に「生成AI」という言葉が一般のビジネスパーソンにも浸透し、さまざまな生活やビジネスのシーンでAIが活用されていきます。翻訳だけでなくビジネスへの活用範囲も広がり、現在に至ります。
小栗 そして、もう慣れちゃった(笑)。
吉田 そう、マインドが変わっていくのが人間の面白いところですよね。では今後はどんなどんなコミュニケーションが求められていくのか? 私は昨今のLLMの本質は「あいまいさ」にあると思うんですよ。
正確性/納得性のテクノロジー
ーー 「あいまいさ」とは?
吉田 いままでの対話型AIはナレッジをいかに効率よく正確に提供するか、という活用法でしたが、私たち人間がコミュニケーションをとるとき、「正しさ」にはもっと複雑な要素がありますよね。この人が言うことなら聞いてみよう、とか。「インフォメーションを間違いなく伝える」だけではない「心地よく理解させる」という意味での「正しさ」があると思います。納得性と言ったらいいのかな。
小栗 私も、AIチャットボットの課題はそこにあると思います。私たちの会話ってただ質問に答えるだけではなくて、あえて聞かれたことに答えなかったり、別のことを答えたり、逆に聞き返してきたりしますよね。それが自然なコミュニケーションで、このあいまいさがないとコミュニケーションをとっていてつらくなる。
ーー テキトーなことも言っちゃうAIを作るということですか?
古谷 辞書のように正確な答えを返すだけではなく、ということですよね。
吉田 そう。そこが今後のAIのコミュニケーションのカギになるような気がしているんですよ。「あいまいに、しかも自信をもって答える」というような強さは、現在のAIはまだ持っていない。
小栗 例えばこういうプロダクトはどうですか? 実在のアイドルから作ったAIです。
小栗 私が開発に関わった「AI am:和田まあや」というプロダクトです。ファンミーティングなどでもアイドルと1対1で話す機会はなかなかないですよね。そこでタレントのデータを学習させて、24時間、365日会話ができるチャットボットを提供しようと。
小栗 タレントとの会話で重要なのは、正確性より「その人らしさ」です。会話のなかで“ファンの情報”もAIに学習されて、話せば話すほど自然な会話が成り立っていく。よりそのタレントを知りたくなるし、もっと推したくなるというフックになるのではないかと。
吉田 面白い。コミュニケーションで「相手のことを知っている」という要素は強力ですね。「Character.AI」というサービスはどうでしょうか。キャラクターとパーソナライズされた会話ができるチャットサービスで、「スターウォーズ」やアインシュタインなどの歴史上の人物を模したキャラもいる。ある意味で、AIに人格を持たせる試みと言えます。しかもこの「Character.AI」は、可処分時間の占有データがTiktok並みという調査データ記事を見ました。
ーー え、そんなに!?
吉田 『her/世界でひとつの彼女』という、AIが自分の彼女になる設定の映画があります。AIがチューリングテストを超えて恋人にまで昇格しているわけです。
音声AIと人間の恋愛ドラマ。自然な会話によって、主人公とAIの距離が縮まり、恋に発展していく。スカーレット・ヨハンソンがAIの声を担当 ©ワーナーブラザーズ
吉田 この映画が撮られたのは2013年ですが、すでにAIとの会話がコンテンツではなく日常の一部になる時代が来ています。
小栗 その先には購買体験もつながっていますから、ユーザーと企業の間にAIエージェントが入る世界はすぐ来る。「この人から商品を買いたい」という印象をAIにも持たせられるのか、そのとき企業はどのように顧客接点を持つのかも面白いテーマです。GAFAのようなプラットフォーマーになるのか。企業単体でAIエージェントを設計するのか。
AIというコミュニケーションツール
ーー AIは、不特定多数のデータを学習したものだと思っていました。和田まあやさんのように「実在する人」を材料にAIを設計することもあるんですね。
小栗 他にもありますよ。私は、株式会社THAで中小企業の社長からAIを作る取り組みもしています。
小栗 「AI社長」というサービス。10人ほどの中小企業の社長の持つ情報をRAG技術でインストールしたチャットボットです。
編集部注:RAG技術 Retrieval-Augmented Generation。大規模言語モデル(LLM)によるテキスト生成に、外部情報(この場合は社長の知識情報)の検索を組み合わせることで、回答の最新性や信頼性を向上させる技術 |
ーー アイドルに続いて社長までAIに……。勝手に経営判断してくれる、みたいなことですか?
小栗 ソリューションとしてはその逆で、社長しかできない仕事に集中するために、AIが代替できる作業は代替していく、という発想ですね。中小企業の社長様は、「俺があと5人いれば……。」って言われる方が多いんです。経営だけでなく、営業、人事、経理、人材育成。そして日々の業務の相談など、中小企業では社長の業務領域が広く、負荷が非常に高いことが多いです。
小栗 経営者の業務知識やお客様対応、会社への想いを学習したAIが、従業員とのコミュニケーションをサポートします。例えば、従業員が『お客様にこんなことを言われたんですが……』とAI社長に相談すると、社長の言葉や判断基準に基づいてAIが回答し、従業員は日常業務をスムーズに進めやすくなります。
吉田 これは2つのメリットがありそうですね。社員の役に立つという点と、社長じしんの満足感。直感的には社長側のメリットが大きい素晴らしいソリューションだと思います(笑)。
古谷 社員目線では、気負わずカジュアルに社長の意見を聞ける良さですよね。
小栗 それで思い出したんですが、最近ソフトバンクが「カスタマーハラスメント」に対する方針を打ち出していて、面白かったんですよ。コールセンターにAIでの音声加工を組み込んで、通話相手の声をリアルタイムで「穏やかな声」に加工するという。
編集部注:AIを活用したカスハラ対策 ソフトバンクは、相談窓口の整備や、ショップやコールセンター向け対応マニュアルの展開など、カスタマーハラスメントに対するさまざまな取り組みを実施しています。コールセンターの電話応対業務では、AI(人工知能)を活用した感情認識・音声加工技術により、お客さまの通話音声を穏やかな会話のトーンに変換して、オペレーターに届けることができるソリューションの開発に取り組んでいます。 引用:https://www.softbank.jp/corp/news/press/sbkk/2024/20240515_01/ |
古谷 AIが人間同士のコミュニケーションのフィルターのような役割になると。たしかに、これは良いソリューションですね。相手の言葉づかいや、立場が違うことでうまく対応できないこともありますから。
小栗 経営者と社員の間にもコミュニケーションのすれ違いが起きてしまう場合があると思うんです。立場の違いなどから伝えたいメッセージをうまく受け取ってもらえないことも。
吉田 「AI社長」はその点でも面白い。ただし社員目線では、そのAIと話すことが本当に「社長と接している」と思えるかというところが気になりますね。たとえば経営者特有のパワフルな緊張感は、和らげてしまっていいのか。プレッシャーを感じながらも社長にスパっと提案を通したときの清々しさとかあるじゃないですか。そこが成長の余地にもなりますし。
古谷 私が社員だったらAI社長に話しかけまくって、その思考を学びたいかな。リアルに社長と話したときに承認を取りやすくなりそうです(笑)。
AIプロダクトとしてすごいと思うのは、学習先を「中小企業の社長」に絞ったことですね。
小栗 野心のある中小企業の社長様は発信も多くて、ビジネスに対してすごいデータ量と熱量を持っています。だからこそ個性的なAIが作れる。
古谷 なるほど。データ元としても優れている。基礎的な技術は一般的なAIチャットボットでも、発想しだいでマネタイズできるわけですね。
小栗 専門知識を持つコンサルタントに壁打ちしてもらうと、1時間で何十万円もかかったりしますが、こうした限られた人しか使わないサービスもAIで自動化できる可能性があります。
小栗 私は「汎用的な知識」と「特化した個性のある知識」のどちらが人を助けるのか、というのが好きなテーマなんですよ。本質は知識の量でなく「偏り」であり「切り口」なんじゃないかと思うわけです。コピーライターの方のコピーがバズったり、接客のプロとの会話がお客さんの心を掴むことがありますよね。そうしたプロのノウハウを書籍やインタビューなどで知ることはできるけれど、誰でも実践できるわけではありません。重要なのはそうした個々人の経験と結果に沿った切り口はどこからくるのか。それはどうすれば再現できるのかということだと思うんです。
ーー AIを開発する人ってそんなこと考えてるんだ……。
人間の知識の仕組みがより明らかになり、個人がAIで拡張されつつある現在。その先には何があるのだろうか? トークの後編ではさらに新しい未来のビジネスへ。最先端の開発を行う3名だからこそ話せる「AI脅威論」との付き合いかたも聞いた!
生成AIによる専門文書の精密な翻訳ソリューション
T-4OOは、LLM (大規模言語モデル) を用いた画期的な翻訳アルゴリズムにより、従来のNMTモデルとの比較で文脈や語調・書き振りをより自然に反映しながら、専門用語や参考文献に基づいた高い翻訳精度を実現。
細分化された2000の分野に対応し、ビジネス・研究開発の専門文書の翻訳など、様々なシーンで活用されてます。
「T-4OO」の機能と特徴
- 専門2000分野・100言語をカバー
- スキャン画像PDFも丸ごと翻訳
- 社内・業界フレーズを自動学習
- Web上でラクラク訳文編集
- その場で解決 電話でサポート
単に文字を翻訳するだけでいいというわけではありません。
T-4OOは、業務フローにこだわった多彩な便利機能で業務効率化を強力にサポートします。