AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

AmiVoiceで音声ファイルや動画ファイルから字幕をかんたんに作る方法

f:id:amivoice_techblog:20220127095217p:plain

f:id:amivoice_techblog:20210115094116p:plain 安藤章悟

みなさま、こんにちは。

音声ファイルや動画ファイルに含まれる音声をアップロードしてAmiVoice Cloud Platformで音声認識して字幕ファイルを簡単に作成するツールのご紹介です。UDトークというコミュニケーション支援・会話の見える化アプリを開発している Shamrock Records, Inc. さんが開発・公開してくれました。

AmiVoice Cloud Platformの機能だけでは動画ファイルの音声認識はできませんが、こちらのツールを使うと動画ファイルの音声認識をすることが可能です。また頭出し再生など字幕を作成するための機能もあるので字幕を作りたい方にもおすすめです。

ツールはこちらになります。


詳しい使い方は、Shamrock RecordsさんのYoutubeチャネルで解説されています。

 

ツール公開後すぐに動画ファイルにも対応されました。

 

動画でも説明がありますが、このツールを使う際は、AmiVoice Cloud Platform の ユーザー登録が必要です。詳しい手順はこちらの記事でも説明しています。

 

ソースコードは透明性の観点からオープンソースとして公開しているそうです。ポイントは、動画ファイルをサーバーには送信せずにブラウザ上で音声抽出しているので、動画を誰かに見られてしまう恐れがないところです(ただし音声データは音声認識時にAmiVoiceのサーバーに送信されるのでご注意ください)。音声認識アプリケーション開発の参考にしたい方は是非ご覧ください。

この記事を書いた人


  • 安藤章悟

    音声認識の研究をしていたら、近所に音声認識屋を見つけてしまい入社。今に至る。

    趣味は海外旅行と美味しいものを食べることとサウナ。