AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

マイク選びが音声認識活用の決め手。マイク利用と発話のポイント



f:id:amivoice_techblog:20210115094116p:plain 永井 一次

 

スマホもノートPCも内蔵マイクあるけど、マイクは必要?

今回の記事は音声認識を業務などで利用している人に向けた記事となっています。

近くで音声認識を利用している人を見て、不思議に思ったことはありませんか?
スマホに組み込まれた音声認識やAmiVoice製品など、様々なシーンで音声認識サービスが利用されているところを見かけるようになりました。でも機械がうまく聞き取れなかったのか変な反応してるところを見たことありませんか?その人が喋っている声、自分が聞いている分にはちゃんと喋っているように聞こえるのに。

誤認識の要因に人が聞いている声と録音された声で大きく違っている時があります。業務で音声認識を上手に活用したい時には出来るだけ精度をあげたいので 録音するためのマイクの選び方や使い方 がとても大事になります。

マイク選びは音声認識活用の決め手!

最近では音声認識の技術が進み認識率は90%を超えているという話をよく聞くのに、体感的には「そんな精度が出てない」と思ったら、マイクを見直しましょう。

 

マイクを選ぶ時のポイント

音声認識を活用するためどんなマイクを選んだら良いか、マイクのカタログから読み取ってみましょう。ただし、カタログにのっているスペックはあくまでも参考情報です。機械同士の相性、利用しているサービス、動かしているOSやソフトウェアの制限など様々な要因で録音される音は変わります。どんなにスペックが良くても実際の音声はボロボロということもあるので、以下のような点を確認してください。  

 

  1. 指向性
    まわりの音を拾わずに自分の声だけを集中して録音するために 単一指向性 のものが良いとされています。

  2. 感度
    騒音環境などで音声認識を利用する時、マイクは 感度低め を選びマイク自体を口元に近づけて話すことで良い結果を得られることがあります。これは周りの騒音を拾いにくくなって自分の声にフォーカスがあたるからです。しかし感度低めのマイクを利用する時には、すこし声をはってしゃべりましょう。中にはマイク本体で感度調整ができる機種も販売されており、とても便利です。

  3. 形式
    一般的には エレクトレットコンデンサー型 と呼ばれているものをご利用ください。皮膚伝導や咽喉マイクなどの音声は特殊な音声となり残念ながら音声認識での利用には厳しくなります。

  4. 形状
    マイク本体が マイクアーム と呼ばれるような長いアームの先端についていて口元へ動かして調整できるようなマイクがベストです。指向性の工夫などで口元から離れていても近くにあるかのように利用できるマイクもあります。

  5. 接続方法
    PCへ有線マイクを接続する際には USBオーディオアダプタ経由 をお勧めします。電気ノイズなどの影響を受けにくくなります、Bluetooth接続のマイクを選ぶ時にはHD VOICEなどで表現されている WIDE BAND(16kHz) で録音できる製品を選んでください。

マイクの利用方法や発話のポイント

いいマイクを手にしても正しく使っていないとマイクの性能を発揮できません。利用する時のポイントをまとめまてみました。

  1. マイクと口の位置が適切な位置になっているのか見直しましょう。指向性があるマイクはマイクに向かって発話しないと極端に音が小さくなったりします。

  2. Bluetoothで繋がっているマイクがあるのに、本体に向かって喋っていたりしませんか?話すマイクとアプリが利用しているマイクが同じか確認しましょう。

  3. 自分は静かなところで喋っているつもりでも周りの雑音、BGM、話し声、部屋の反響音が入り込んでいることがあります。録音した音声に耳を傾けると意外に大きいことに気がつけると思います。

  4. 騒音環境で利用する時にはマイクの感度を下げて、マイクを口元に近づけてしゃべります。周りがうるさいと自分も知らずに大声で出していることがあるのでマイクの入力メーターが振り切れるくらいの大声にならないように注意します。

  5. 実は口を開けるとき「パッ」っという音がでていたり、話終わりに息が鼻から抜ける音が録音されることがあります。こんな時には風防(マイクカバー)がついているマイクを利用すると軽減されます。  

  6. 喋る時に「え?」とか「あっ」など自分では気づいてない口癖がある人は注意しましょう。先頭に余分な言葉が入ることで意図しない単語に変換されてしまうこともあります。  

  7. 子供へ言葉を教えるようにゆっくり喋ったりしていませんか?ゆっくり喋ると音が途切れてしまい精度がさらに落ちる要因になります、普段の会話と変えずに話してみましょう。  

その他

マイクの種類やOSなどによってはエコーキャンセルやAGC(オートゲインコントロール)などの機能が用意されています。これらは通話時に声を聞きやすくしてくれるのですが、人間には聞きやすくなるけれど音声認識サービスでは逆に音声が加工されて認識が下がる原因にもなるので、一旦設定を解除することをおすすめします。

 

音声認識には専用マイクがオススメ

   

アドバンスト・メディアでも、音声認識に必要不可欠なクリアな声を集音できる専用マイクの開発を行っています。Amazonでも販売していますので、よければ是非お試しください。

マイクを正しく利用して音声認識をより便利に!

この記事を書いた人


  • 永井 一次

    音響好きが高じてフリーから会社勤めへ変わる際に音声認識業界へ。製造・物流現場など騒音環境下での音声認識活用を提案してます。