音声認識APIで使える話者ダイアライゼーション (Speaker Diarization)の解説です。複数人が話している音声に対して、話者ごとに発話区間を推定する機能です。利用方法や精度向上のヒントを説明します。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。