ServiceNow AIとHugging Faceは、2026年6月9日、多言語話者が会話中に複数の言語を混ぜて使う「コードスイッチング」に対応する音声認識技術の評価結果を発表しました。これは、企業向けのAI音声エージェントが、より自然で複雑な会話を理解するための重要な一歩です。この技術が進めば、海外からの問い合わせや多言語話者とのコミュニケーションが、AIを通じて格段にスムーズになります。
多言語が混ざる話し方「コードスイッチング」とは?

「ねえ、お母さん、今日のDinnerは何?」のように、会話中に自然と複数の言語を混ぜて話す現象を「コードスイッチング」と呼びます。ルー大柴氏が「Togetherしようぜ」「藪からStick」なんて言ってた時代が懐かしいですね。これは、世界の人口の半分以上が二つ以上の言語を話す多言語話者であるため、日常的に見られる光景です。しかし、AIにとってこのコードスイッチングは、非常に難しい課題でした。従来のAIは単一言語に特化して訓練されているため、言語の境界が曖昧だと混乱しやすいのです。
企業が提供する音声エージェント、例えばコールセンターの自動応答やITヘルプデスクのAIアシスタントは、顧客の言葉を正確に理解する必要があります。もし顧客がコードスイッチングを使って話した場合、AIが誤解してしまうと、問い合わせが適切に処理されず、顧客の不満につながることもあります。ServiceNow AIは、この課題を解決するため、AIコミュニティプラットフォームのHugging Faceと共同で、コードスイッチングに対応できるAI音声認識技術の評価に取り組みました。
彼らは、この自然な話し方に対応できるAIを開発することが、企業が多言語の顧客をサポートする上で重要だと考えています。正確な音声認識(ASR)は、AI音声エージェントの最初のステップであり、ここで間違いがあると、その後のすべての処理に影響が出てしまうため、特に重要です。
どうやって評価したの?独自のベンチマークとデータセット

ServiceNow AIとHugging Faceは、この複雑なコードスイッチングを伴う音声の自動認識(ASR)モデルの性能を測るため、独自のベンチマーク(性能評価の基準)とデータセット(学習用データ)を開発しました。これは、まるで新しい種類のスポーツのルールを作り、選手たちの実力を公平に測るための練習試合を用意するようなものです。彼らは、特に企業が直面する現実のシナリオに合わせてデータを作成しました。
具体的には、スペイン語-英語、フランス語-英語、カナダフランス語-英語、ドイツ語-英語の4つの言語ペアに焦点を当てています。これらの言語ペアは、ServiceNow AIの顧客基盤にとって特に関連性が高かったため選ばれました。データセットは、人事(HR)やITサービス管理(ITSM)における幅広い状況をカバーしています。例えば、従業員が福利厚生や給与について問い合わせる場面や、パスワードのリセット、VPNアクセス、デバイスのトラブルシューティングといったサポート依頼などが含まれています。
音声認識は、AI音声エージェントが顧客の言葉を理解するための最初のステップです。この段階で正確な文字起こしができなければ、その後のAIの応答も間違ったものになってしまいます。例えば、レシピの最初の材料を間違えたら、どんなに頑張っても美味しい料理はできないのと同じで、最初の認識が非常に重要なのです。このベンチマークにより、さまざまなモデルがどの程度正確にコードスイッチングを認識できるかを客観的に評価できるようになりました。
従来のAIでは難しかった理由と、今回の成果
従来のAI音声認識(ASR)モデルがコードスイッチングに苦戦してきたのには、明確な理由があります。多くのモデルは、主に単一言語のデータで訓練されています。そのため、文の途中で言語が切り替わる「コードスイッチング」のような複雑な話し方には、なかなか対応できませんでした。まるで、日本語の辞書しか持っていない人が、急に英語と日本語が混ざった会話を聞かされても、うまく理解できないようなものです。
しかし、今回のServiceNow AIとHugging Faceの取り組みは、この状況を変える可能性を秘めています。彼らが開発した独自のベンチマークとデータセットを用いることで、既存の最先端ASRモデルがコードスイッチングに対してどれくらいの精度を持つかを、初めて具体的に評価することができました。これは、AIが「多言語が混ざった会話」をどれだけ正確に聞き取れるか、その実力を数値で明らかにしたことを意味します。
企業にとって、この成果は非常に重要です。例えば、コールセンターで「パスワードをリセットしたいんだけど、I forgot my password」と問い合わせがあった場合、従来のAIでは「パスワードリセット」の部分だけしか認識できなかったり、全体を誤解したりするリスクがありました。しかし、より正確なコードスイッチング対応AIなら、顧客の意図を完全に捉え、適切な対応ができるようになります。これにより、チケットの誤配分や、顧客への不適切な情報提供といった問題を減らすことが期待されます。
私たちの生活はどう変わる?AIがもっと身近に
今回のコードスイッチング対応AIの進化は、私たちの日常生活にも嬉しい変化をもたらすでしょう。例えば、海外旅行先でホテルのフロントに電話する際や、多言語環境の職場でAIアシスタントを使う際、より自然な会話ができるようになります。まるで、海外の友人と話すときに、お互いの言葉を自然に混ぜて話せるようになるようなものです。
これまで、AIとの会話は「正しい言葉遣い」を意識する必要があり、少し堅苦しいと感じることもありました。しかし、この技術が進めば、私たちはもっと自由に、普段の話し方でAIとコミュニケーションできるようになります。例えば、日本語と英語を混ぜて話しても、AIが私たちの意図を正確に理解し、適切な情報を提供してくれるようになるでしょう。これにより、電話での問い合わせの待ち時間が短縮されたり、自動応答システムの精度が向上したりと、ストレスのないコミュニケーションが実現します。
企業にとっては、顧客満足度の向上に直結します。多言語の顧客からの問い合わせにAIがスムーズに対応できるようになれば、オペレーターの負担も軽減され、より多くの顧客に質の高いサービスを提供できるようになります。これは、グローバル化が進む現代社会において、企業が競争力を高めるための重要な要素となるでしょう。
世界中で広がる多言語社会に対応するAIの未来
今回のServiceNow AIとHugging Faceの取り組みは、AIが世界の多様な言語環境に適応するための重要な一歩と言えます。現在、世界中で多くの人々が複数の言語を話し、日常的にコードスイッチングを行っています。そのため、AIが真に役立つツールとなるためには、このような自然な話し方を理解する能力が不可欠です。
将来的には、今回評価されたスペイン語-英語やフランス語-英語といった言語ペアだけでなく、さらに多くの言語ペアや、より複雑なコードスイッチングにも対応できるようになるでしょう。これは、AIがただの自動応答システムではなく、人間の話し方をより深く理解し、状況に応じた柔軟な対応ができる「賢い秘書」のような存在に進化していくことを意味します。例えば、方言やスラング、さらには感情までをAIが汲み取れるようになるかもしれません。
この技術の進化は、国境を越えたビジネスやコミュニケーションをさらに円滑にします。言語の壁を感じずに情報にアクセスできる社会が、AIによって実現に近づくでしょう。誰もが、自分の好きな言語で、自然な話し方でAIと対話できるようになる未来が期待されます。AIは、私たちの生活をより豊かで便利なものにするための、強力なパートナーへと成長していくのです。
編集部の予想 (今後どうなる?)
ここからは編集部の予想です。
短期 (1 ヶ月以内): このベンチマーク公開を機に、他の大手AI企業もコードスイッチング対応のASRモデル開発を加速させるでしょう。特に、顧客対応サービスを持つ企業が技術提携を進める可能性があります。
中期 (3 ヶ月以内): 今回評価された言語ペア以外にも、アジア圏の言語を含む多言語対応の動きが活発になると思われます。AI音声エージェントの導入を検討する企業が増えるでしょう。
長期 (1 年以内): コードスイッチング対応が、高性能なAI音声認識モデルの標準機能となるでしょう。これにより、言語の壁を感じさせない、より自然なAIとのコミュニケーションが実現するかもしれません。
FAQ
「コードスイッチング」って、私たちの日常でどう役立つの?
はい、私たちの会話がAIに伝わりやすくなります。例えば、海外のホテルに電話で「予約をキャンセルしたい、Can I do that?」と日本語と英語を混ぜて話しても、AIがちゃんと理解してくれるようになるイメージです。
この技術は、いつから私たちの身近なサービスで使えるようになるの?
公式にはまだ具体的な時期は発表されていません。まずは企業向けのサービスから導入が進むでしょう。スマホアプリの新しい機能が、まず一部の人から試されるのと似た流れです。
企業にとっては、どんなメリットがあるの?
多言語対応のコールセンターで、顧客の言葉をより正確に理解できるようになります。電話の相手が「Please reset my password, パスワードを忘れたんです」と話しても、AIがスムーズにサポートしてくれるので、顧客満足度が上がり、会社のコストも減るでしょう。
24時間以内の注目AIニュース
- Anthropic、新AIモデル「Claude fable 5 mythos 5」を発表 詳細な情報はまだありませんが、Anthropicが新しい大規模言語モデルをリリースしたと見られます。より賢く、多機能なAIの登場が期待されます。出典: Anthropic
- 安価なAIモデルの活用がテック企業で加速する可能性 TechCrunchの報道によると、品質を落とさずにコストの低いAIモデルを使う動きが広がっています。AIの利用コストが下がることで、より多くの企業がAIを導入しやすくなるでしょう。出典: TechCrunch
- AWS、保険金請求を自動化するAIシステムを発表 Amazon BedrockとStrands Agentsを組み合わせ、保険金の請求受付をAIが自動で行うシステムが開発されました。災害時など、手続きが複雑な場面での迅速な対応が期待されます。出典: AWS
- NVIDIA、大規模AIインフラ管理ツールを公開 NVIDIA DGX Spark Enterprise Manageabilityにより、AI開発に必要なコンピューター資源の管理が効率化されます。これにより、大規模なAIプロジェクトの運用がよりスムーズになるでしょう。出典: NVIDIA