2022年2月7日にACPの非同期HTTP音声認識APIで、話者ダイアライゼーション (Speaker Diarization)が使えるようになりました。複数人が話している音声に対して、話者ごとに発話区間を推定する機能です。利用方法や精度向上のヒントを説明します。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。