その昔、米国に出張したとき、多くのホテルの部屋の電話システムに留守録音機能がついていることに驚かされた。

相手が不在だと、録音された音声で、「メッセージを入れてパウンドキーを押してください」と言われ、当時はパウンドキーが何かよく解らずうまく録音できなかったことを思いだした。

現在は日本の航空会社のコールセンターに電話すると録音された音声で質問されて、何度か電話機のボタンを押した後に用件を扱ってくれる電話にたどり着くことができる。

ここにもAI(音声認識と文脈の機械学習)が入ってきていて、先日米国の航空会社に予約の変更で電話したところ、英語を話すコンピュータと会話をさせられてしまった。

目的のオペレーターにたどり着けたが、最初は私の英語でたどり着けるかと不安でいっぱいだった。

電話機のボタンを押すことなく、全て会話で進行する技術の進展に驚いたところである。

よく考えれば携帯電話の時代、質問のたびにボタンを押すのは操作性に難があり、会話で対応は自然の流れであろう。

ここで使われているのはコールセンターシステムで、その中ではIVR(Interactive Voice Response)技術が用いられ、人とシステムの会話を可能としている。

背景には音声認識、音声合成、機械学習による判断が入っている。

調査業務で最新のコールセンターシステムを手掛けるベンダーにヒアリングする機会を得たが、ただただその電話を受ける機能、かける機能、システムの操作性の良さに関心したところである。

コールセンターシステムで進歩した技術はIoTのコアシステムになる勢いであった。

 

藤井伸朗:NTT研究所、NTTグループ会社において通信網オペレーションシステム等の研究開発、国際標準化に従事。2014.7よりサイバー創研に勤務。電子情報通信学会フェロー。