間違いだらけのネットワーク作り(986)2017/10/07
「不完全な音声認識」

  秋が深まって来ましたね。 昨日からスーツを冬ものに替えました。  5日木曜日にNTTコミュニケーションズのフォーラムに参加しました。 MUFGの人の講演を聴いた後、AIコンタクトセンターやSD-WANなど関心のある展示を見て来ました。 コンタクトセンターは興味のある人が多いようで、デモをするのに15分以上、待ちました。 そのデモの様子を紹介します。

「不完全な音声認識」
   

デモはコンタクトセンターのオペレータと電話をかけてくる顧客の間の会話を音声認識AIでリアルタイムにテキスト化して表示し、NGワードの表示等をするものです。 私は顧客の役、見ず知らずの人がオペレータ役で、用意された台本どおりに会話しました。 その結果がこれです。 ほとんど正しく認識しています。



台本を使わず自由に話して試していいかと断って、会話したのがこれです。 私が展示でどれが良かったですか、と質問したのに対して、相手が三菱UFJ銀行の講演が良かったと答えたやりとりです。



台本で言葉が限定されていると認識率が高いですが、自由な会話だとまったくダメですね。 音声認識というのはどこでもこんなレベルなのでしょうか。 昨日はGoogleHomeが発売され、新聞やネットで大々的に報道されていました。 AIスピーカーの音声認識率はどの程度のものなのでしょう。 利用するシーンが限られているのでけっこう高いのかも知れません。 いずれにしても、企業で音声認識AIを使うには100%にはなり得ない認識率で、どこまで効率化が図れるのか見極める必要があります。 認識した結果を人間がチェックせねばならないようでは大した効果はないでしょう。

  さて、12月2日(土)午後、恒例の情報化研究会を日本科学未来館で開催します。 トップページにプログラムを掲載します。 全体テーマは「AI、IoT、クラウド活用の今とこれから」です。 ぜひ、ご参加ください。


*ここに書いてあることで質問、ご意見などありましたら掲示板かメールでお知らせください。 

  情報化研究会掲示板

 tuguhiro@mti.biglobe.ne.jp



ホームページへ