少しずつ身近になってきている、AI音声認識の技術。SiriやAlexaなどのAIアシスタントは既に使っている方も多いですよね。ビジネスシーンでも、会議中の自動議事録作成や音声自動案内への活用など、AIの技術は少しずつ浸透してきています。ただ、こうした音声AI分野で、非常に高いハードルとなっているのが「リアルの対面接客」での活用です。
カスハラ防止、法律の順守・不正防止など、望まれる“接客分野”のAI活用
「最近ではカスタマーハラスメント(カスハラ)が企業のかなり大きな課題になっていて、カスハラが理由で社員さんが産業医にかかるような状態になってしまったり、休職・退職まで追い込まれてしまったりと、企業によっては年間で数千万から億単位の経済損失を出していると聞きます。そうしたストレスのかかる“リアルの対面接客”を何とかAIで支援したいというお声をお客様からよく聞きます」
と語るのは当社カスタマーサクセス(CS)チーム マネージャーの三根(みね)。CSはチームのミッションとして「既存顧客からの信頼を構築し、その事業の安定・拡大に貢献する」を掲げています。クライアント企業の抱えるこの難題に取り組むことで単なる対面接客のカスハラ対策にとどまらず、会社や事業へも大きな影響を与えうるのです。確かに顧客からの理不尽な要求は、社員の心理的な負担に加えて、そうした情報がSNSで拡散されることで人材の採用難易度が上がってしまうなどの副次的な損失も考えられます。
厚生労働省が令和2年に実施した「職場のハラスメントに関する実態調査」によると、過去3年間に職場でカスタマーハラスメントを受けた経験のある労働者は全体の15%でした。
反面、リアルの対面接客では、社員側の意図的で強引な営業や、違法な交渉をしてしまうなどの不正防止もケアしなければなりません。対面接客の現場は録画などの記録をする慣習がないため、接客状況の管理や、技術的な指導をすることが難しいという課題も。そのため、現場にAIを導入して解決の糸口を見出したいという要望が絶えないのです。
同じく厚労省の調査結果でも、ハラスメントの予防・解決のための取組を進める上での課題として、「ハラスメントかどうかの判断が難しい」・「発生状況を把握することが困難」・「対処の目安がわからない」・「取組を行うノウハウが無い」といった回答が寄せられており、実態を把握し取組に繋げる難しさが伝わってきます。
「今までは導入が難しい理由が2つありました。一つ目はコストの問題です。例えば当社クライアントである多数の店舗を運営する大手企業様ですと、約8,000台の録音機器が稼働しています。1台あたり、1日平均5時間の稼働。つまり1日で4万時間分の録音声があがってきます。これをクラウド上に送信し続け、さらにノイズ除去や音声認識も必要になると、かなりのコストがかかってきます」(三根)
確かに、録音データを機器に保存し続けるわけにはいかないので、音声データは常にクラウドに送り続ける必要があります。さらに店頭は雑音が多いため、AIに正しく音声を認識させるにはノイズ除去の処理も必要。このノイズ除去だけで同社の試算によると1日100万円弱かかってしまい、ハード、ソフトウェア、クラウドの利用も含めると、それを超えるリターンを作らなければROIが成立しないことになってしまいます。
「もう一つ難しいのは“話者分離・ノイズ抑制の技術”です。例えば、隣のカウンターの声、店内BGM、呼び出しの音声などのノイズを除去する。そのうえでソフトウェア側が話者を認識し、“誰が何を話しているか”だけを収録する必要があります。ノイズの変数が大きい中で、そうした技術開発の難易度は高かったです」(同)
“コスト”と“音声処理”の課題を解決する「AIマイクソリューション」
しかし、そうした高いハードルを越えて、“AIマイク”が完成します。当社の「エッジAI」の技術を利用した「AIマイクソリューション」です。
「シンプルに言うと、すごく便利なICレコーダーをイメージしていただければ良いと思います。基本的にずっと全自動録音している状態なのですが、その中で人間が発話している期間だけを録音データとする処理をAIが行っています。かつ、Wi-Fiでインターネットに常時接続され、端末上にはデータを保存しない仕様となっています。端末側にデータを保持することで、端末紛失時の情報漏洩リスクが発生してしまうリスクを抑えることでセキュリティも担保しているのも特長です」
既存のICレコーダーであれば、いちいち録音・停止ボタンを押さなければならず、多くの店舗で人力操作に頼ると、必ず漏れが出てきてしまいます。全自動録音であれば、そうした操作の必要がありません。さらに、端末に音声データが残ると個人情報流出のリスクを抱えてしまいますが、常時音声データをクラウドに送ることでセキュリティを確保できます。事前の初期設定やPCへの接続なども不要で、電源さえあればOKです。
「さらに、以前からテキスト化精度に対する課題であった“話者分離・ノイズ抑制”についても、デバイス上にマイクを複数設置。店員さんとお客さんのそれぞれの声がマイクに届く時間の差によってマイクとの位置関係を推定することで話者を別々に分離して認識できるようになったり、話者の発話以外の店内放送やBGMなどのノイズを抑制することができるようになりました」
AIマイク話者分離のイメージ(従来イメージは左側)
端末で“話者分離・ノイズ抑制”を処理できることで、以前よりも低コストでの運用が可能になりました。こうした“AIマイク”が店頭窓口に設置されれば、前述のカスタマーハラスメントもエビデンスを伴って防止ができます。加えて、接客の質の担保や、業態によっては違法となる営業行為をきちんと記録・判定して、未然に防ぐことが可能になります。
「実際にこのAIマイクは、先ほども述べましたとおり、全国展開されているある企業様の全店舗の接客カウンタ―に本導入され、約8,000台のマイクが稼働中です。マイクを設置しているという事実だけでもハラスメントの抑止力になっているというお声も聞きます」
“守り”から“攻め”へ――「ネクストアクションの示唆」にChatGPTをどう活用する?
このようにリスク回避のために取得できる“守り”のための接客データですが、営業観点で収益を上げるための“攻め”に活用できないかという動きも始まっています。
「例えば、その時期に推している商品・サービスを効果的にご案内できているかどうか。店員さんが会社の方針に従って、お客さんにきちんと提案できているかを定量的に測ることができます。さらに“成約したかどうか”“成約した場合、その要因は何だったか”を測ることも。こうした例に限らず、様々な観点で接客をリアルタイムで評価することで、スピード感のある接客品質の改善が期待できるようになります」
接客データを解析し、的確に現場へフィードバックし、収益に繋がるスキームを構築する――そうした「ネクストアクションの示唆」にはデータサイエンティストや現場感のあるマネージャーが必要と思われがちだが、そうなるとコストが上がり、ROIが成立する可能性が低くなってしまいます。では、どのように行っているのでしょうか?
「そこで、人の役割を代替できないかと活用実験を行ったのがChatGPTです。一例としては『あなたはクライアント企業の接客の悩みを解決し、顧客満足度向上を必ず達成する一流のコンサルタントです』といった役割を与え、実際の現場の接客データを読み込ませてみました」
果たして、その結果は…。ChatGPTとの組み合わせで、“AIマイク”は進化するのでしょうか。さらにはその“進化”によって、莫大なコスト削減や、店舗パフォーマンス向上につながる提案活動や成約率の可視化が可能になり、他社にノウハウをソリューションとして販売することも…?その内容は公式noteに掲載した後編にてご覧ください。
(「AIマイクのもたらす可能性 ~ 開発ストーリーと事業価値創造に向けた新たな取り組み ~ 後編」はこちらよりご覧いただけます。)
当社のAIマイクについてより詳しく話を聞いてみたい方は以下のボタンからお気軽にお問い合わせください。営業担当がより詳しいご説明をさせていただきます。
このブログに登場したCSマネージャーの三根について