2011年6月3日金曜日

音声認識のしくみ

音声認識を行うためには、「音響モデル」と「認識辞書」が必要です。
音響モデルには、人間の発声の小さな単位(音素)の音響特徴が記述されており、認識辞書には音声認識させることばが記述されています。音声認識は、以下のような処理が行われます。
(1)入力された音声を分析し、音響特徴を算出します。
(2)認識辞書に記述されていることばの中から、ことばの音響特徴が入力音声の音響特徴に最も近いことばを探して音声認識結果として出力します。これまでの音声認識では、人間の自由な発話を一語一句認識することは難しく、認識することばを記述した認識辞書を持っているのが一般的でした。
自由発話対応の音声認識エンジン「SpeechRec」では、上記の音声認識技術に加え、実例を数多く集めた言語モデルや発話理解技術、対話制御技術などを駆使して、人間の自由な発話を高精度に認識し発話を理解できるようになりました。電話回線、IP電話、インターネット、直接対話など多様な利用環境下で、子供から高齢者までさまざまな不特定の話者が自由なタイミングで、自由な言い方で話しても発話を認識することが可能です。

0 件のコメント:

コメントを投稿