安藤章悟
みなさま、こんにちは。
音声ファイルや動画ファイルに含まれる音声をアップロードしてAmiVoice Cloud Platformで音声認識して字幕ファイルを簡単に作成するツールのご紹介です。UDトークというコミュニケーション支援・会話の見える化アプリを開発している Shamrock Records, Inc. さんが開発・公開してくれました。
AmiVoice Cloud Platformの機能だけでは動画ファイルの音声認識はできませんが、こちらのツールを使うと動画ファイルの音声認識をすることが可能です。また頭出し再生など字幕を作成するための機能もあるので字幕を作りたい方にもおすすめです。
ツールはこちらになります。
詳しい使い方は、Shamrock RecordsさんのYoutubeチャネルで解説されています。
ツール公開後すぐに動画ファイルにも対応されました。
動画でも説明がありますが、このツールを使う際は、AmiVoice Cloud Platform の ユーザー登録が必要です。詳しい手順はこちらの記事でも説明しています。
ソースコードは透明性の観点からオープンソースとして公開しているそうです。ポイントは、動画ファイルをサーバーには送信せずにブラウザ上で音声抽出しているので、動画を誰かに見られてしまう恐れがないところです(ただし音声データは音声認識時にAmiVoiceのサーバーに送信されるのでご注意ください)。音声認識アプリケーション開発の参考にしたい方は是非ご覧ください。