AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

【中級者向け】AmiVoice の単語の読みの自動変換について

日本語では「先生(せんせい)」を時として「せんせー」と発音するケースがあるように、読み仮名と実際の発音が少し変化することがあります。AmiVoiceではその変化に対応するために指定された読みを自動的に変化させていますが、読みを厳密に指定したい時に…

音声認識に必要なサンプリングレートはどのくらいか?

音声認識をする時の最適なサンプリングレートの解説をします。また、AmiVoice APIでのサンプリングレートの扱いについても細かく解説します。

NPCの実現間近!?VRChat 向け音声対話アバター「AIアバターAOI」開発者インタビュー

メタバース空間上での対応を自動化する音声対話アバター「AIアバターAOI」の開発者インタビューです。NPC(ノンプレイヤーキャラクター)が実現するかも!と各所で話題になりました。

AmiVoice APIの単語登録機能で選択可能な「クラス」の解説(汎用エンジン)

AmiVoiceの単語登録では「クラス」を指定することで、より適切な音声認識が出来るようになります。今回はAmiVoice APIで最もよく使われている汎用エンジンの「会話_汎用」と「音声入力_汎用」の2つのエンジンについてどのようなクラスを指定できるかを解説…

【RPA】請求書PDFをPADでテキスト化。JavaScriptと正規表現のハマりポイントも回避。

PADで請求書PDFをテキスト化する方法と、JavaScriptを実行する時のハマりポイントを紹介します!

【Swift】AmiVoice APIとAlamofireでつくる感情解析アプリ

AmiVoice APIを利用して感情解析と音声認識ができるiOSアプリの作り方についてご紹介します。

【OBS】リアルタイム字幕配信の遅延対策してみた時の話

OBSにリアルタイム字幕を付けるためのプラグインをオンラインセミナーでの利用を想定して実際に使ってみたので、どんな感じに仕上がったのかを紹介したいと思います。