AmiVoice Cloud Platformではソフトウェア開発者のためのクラウド音声認識APIを用途に応じて3種類用意しています(2021年10月現在)。今回の記事ではそれぞれの違いや用途について概要を解説します。
音声認識APIを提供している「AmiVoice Cloud Platform」のAPPKEYの取り扱い方法について、簡単に解説します。APPKEYの仕様を知ることで、あなたのプログラムのセキュリティレベルを一つレベルアップすることが出来ます。
音声認識は難しい技術なので、なかなか認識率100%にはできません。今回の記事では、なぜ音声認識は難しいのか、そしてAmiVoiceではどうやってその難しさに立ち向かっているのかを解説します。
音声認識の認識精度(認識率)は、認識精度が上がるほど、さらに1ポイント上げるのは難しくなります。その理由を「エラー改善率」という指標を用いて説明します。また、音声認識の論文等でよく使われるWERという指標についても触れています。
何を喋っても正しく認識できる万能な音声認識エンジンを作るのは難しいので、AmiVoiceでは数種類の音声認識エンジンを開発者向けに提供しています。今回はその中から汎用エンジンと電子カルテ用エンジンを使って認識率を比較してみました。
「Linuxで音声認識を動かしてみた」という題材でお話していきます。今回の目標はACPのC++とPulseAudioライブラリを使ってマイク認識するまでです。
「Linuxで音声認識を動かしてみた」という題材でお話していきます。今回の目標はACPのC++とarecordコマンドを使ってマイク認識するまでです。