1-1 普及のきっかけ ~ Siri、Alexa、Googleアシスタントにより一気に身近な技術へ
2011年にApple社Siri、2014年にAmazon社Alexa、そして2016年にGoogleアシスタントが発表され、音声による検索やPC・家電の操作など私たちの身の回りでも音声認識システムの利便性が浸透してきました。音声認識技術自体は70年以上の歴史がありますが、近年、従来の研究に加え、マイクの性能向上、ディープラーニング機能を用いた認識精度向上、端末CPUの性能向上などにより一気に実用性が高まりました。
現在ではディープラーニングや感性抑制を活用した、より人間に近い音声認識・音声合成の実用化に向けた研究が進められています。
第1世代 1950~1960年代 ヒューリスティック(声道の変化を数学的に記述)
第2世代 1960~1980年代 DP マッチング(音の伸縮特性を用いて単語を連続処理)
第3世代 1980~1990年代 隠れマルコフモデル(統計データを基に確率的に処理)
※コンピュータの処理速度向上、記憶装置の大容量化が貢献
3.5世代 1990~2000 年代 Nグラム法(統計モデルの識別学習)
第4世代 2010 年代 ニューラルネット (2011年Siri/2014年Alexa登場)
※ネットワークの処理速度向上、音響技術の進歩が貢献
4.5世代 2015年~ End-to-End(2016年Googleアシスタント登場)
現在 AI⇒機械学習⇒ディープラーニングの進化+感性抑制の研究
参考:音声認識、Siriへの道 河原 達也
音声認識技術はどこに向かうのか? 山路達也
音声認識技術の変遷と最先端 *–深層学習による End-to-End モデル– 河原達也
AI・IoT時代の覇権を制するものは誰か? 野村 靖仁
1-2 音声認識の実力 ~ 騒音レベル90dBの環境でも利用可能、認識率99.8%の実績も
音声認識技術の導入を検討において従来ネックとなっていたのは作業現場の騒音環境です。
シーネットの音声認識システムに採用されている音声エンジンAmiVoiceは、90dBの騒音下でも認識可能です。以下の表は主な製造業の作業環境における騒音レベルの目安と、日常生活における騒音レベルの目安の一覧です。
端的に言えば、90dBの騒音とは、パチンコ店内やゲームセンターなど、声を張らなければ意思疎通ができないほどの騒音下でも、使用することが可能ということです。
一般的な事務所での認識精度については実際にシーネットの音声検査システムLISTESTを導入されたENEOS株式会社様川崎製油所品質管理グループでのテスト結果をご紹介します。導入前に現場で行った800回のテストのうち、1回のみ誤認識(0.125%)がありました。
実運用にあたっては問題ないという判断のもと、現在問題なく運用されています。
1-3 認識精度向上の舞台裏 ~ ハード・ソフトの進化により飛躍的に向上
騒音下での音声認識精度が向上した背景には、機器・エンジン・AI技術の進化がありました。
シーネットの音声認識システムに採用されているAmiVoiceにおける技術の進化の概要は下記のとおりです。
マイク
・高指向性2マイクアレイ方式により、周囲のノイズを避けて発話者の声だけを拾う
音声認識エンジン
・ノイズキャンセリング機能により認識対象となる音声を抽出
・音響モデル/言語モデル/発音辞書/ディープラーニングの最適化により音声をテキスト化
機械学習精度
・音声認識エンジン開発に機械学習を利用
ハンズフリー&アイズフリー、聞く・話すだけで作業が完結
PCやスマートホン、スマートスピーカーなどの音声アシスタントの利用普及によって、身近に音声認識の機能や利便性を実感できる機会が増えるとともに、様々な分野で現場実務への運用も急速に拡大しています。
医療現場でのカルテ入力業務、会議の議事録作成業務、データの入力業務、動画や音声コンテンツの字幕作成業務といったヒトからシステムへの単方向インプット作業から、現在ではコールセンターでの顧客対応業務や物流現場でのピッキング作業、製造現場での検査・試験・分析といったヒトとシステムの双方向のインプット・アウトプット作業へとその適用範囲が広がっています。
・音声システムからの作業指示(アウトプット)に基づく作業により決められた手順を遵守可能
・ハンズフリー・アイズフリーの作業によって作業効率向上、作業品質向上
・誰が行っても同じ手順を徹底できるため、属人性から脱却し標準化を実現
・作業者の音声による結果入力(インプット)によって入力工数を削減
・作業と同時にデータが登録でき、リアルタイムに作業状況を可視化
・タイムスタンプつきのログデータにより作業履歴のトレーサビリティを実現
これらにより、従来作業者に依存していたため経験や作業者の状態によりばらつきのあった現場作業を、一定の品質を担保した作業レベルにて運用できるようになりました。
エビデンスマネジメントを実現
音声システムは、作業効率を向上させるだけでなく作業品質の向上や作業者による作業レベルの均質化も可能な現場業務に最適なシステムと言えます。
・物流現場での仕分け(種まき/摘み取り)作業、入出荷検品作業
・製造現場での原料検査・試験・分析作業
・製品出荷時の瑕疵・不備・機能検査作業
・設備や機器メンテナンス現場での点検作業
・その他SOP(Standard Operating Procedure:標準作業手順書)に基づいて行う作業
上記以外にも人による現場業務の可視化、デジタル化に、音声システムは役立つツールです。
以上
お気軽にお問い合わせください
お電話でのお問い合わせ
(CCS) 043-307-7170
(CIS) 043-307-5125
メールでのお問い合わせ