AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

【初心者向け】EdgeとChromeからAmiVoice APIを実行してみた Webページ編

EdgeとChromeからAmiVoice APIの3種類の音声認識APIを実行するWebページのサンプルとその作り方を紹介します。AmiVoice APIのアカウント作成後、すぐに試せます。

【同じ発話で比較検証】音声入力エンジンと会話エンジンの認識結果の違いとは 

今回は音声入力用エンジンの特徴や合致する利用シーンについて紹介しています。この記事を見れば音声入力用エンジンか会話用エンジンのどちらが適しているかが分かる内容となっています。

ハイブリッド型音声認識とEnd-to-End音声認識の違いと特徴

ハイブリッド型音声認識とEnd-to-End音声認識の違いや特徴について解説します。また、それぞれの特徴をふまえてアドバンスト・メディアで採用している方式について説明します。

精度検証付き!特定用途に特化した音声認識エンジンのご紹介

AmiVoice API Privateにて提供している、人名や住所などに特化した音声認識エンジンについてご紹介します。汎用エンジンと精度を比較した検証も行いました。

AmiVoice API Private・SDKの「ルールグラマ」認識とは?

AmiVoice API Privateで提供している音声認識エンジン「ルールグラマ」について、通常のディクテーション認識との違いや、適した利用シーン、使用するメリット・デメリットなどを解説します。

"会議"の音声でOpenAIのWhisperとAmiVoiceの音声認識率を比較してみた

会議の音声をOpenAIのWhisperとAmiVoiceで音声認識して、それぞれの音声認識精度を比べました。結果としてはAmiVoiceの方が誤認識が大幅に少なく高精度でした。Whisperの誤認識の例など出しながらこの差の要因について解説します。

Windowsアプリにマイク録音を実装してみた。音声認識アプリ開発の第一歩!

C#を用いてWindowsアプリでマイク録音を実装します。 録音した音声をAmiVoice APIを使用して音声認識を行い、ストリーミング処理で認識内容を表示する方法について解説します。