AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

開設1周年!音声認識テックブログはどの位見られているのか?

AmiVoiceテックブログは2022年3月で1周年を迎えました。今回はこの1年間でアクセス数がどう変化してきたかを見てみました。

AmiVoice Cloud Platformの認識結果に表示される「confidence(信頼度)」とは?

AmiVoice Cloud Platform(ACP)の認識結果に表示される「confidence(信頼度)」について、その活用例とともに紹介します。

【小ネタ】最速!?音声認識の体感速度を上げる裏技!!

AmiVoice Cloud Platformの体感認識速度を向上させる方法を解説しています。お客さんに出すアプリで音声認識を使うときはUイベントを使っていきましょう。

音声認識率がマイナス(負)になる場合とは?

誤りが多いと音声認識精度は下がりますが、その最小値はいくつなのでしょうか?実は認識精度は0%どころか、マイナスになる場合もあります。そのような例と、それに関連した「誰の声を音声認識したいのか」という視点を紹介します。

AmiVoiceで音声ファイルや動画ファイルから字幕をかんたんに作る方法

AmiVoice Cloud Platformを使って音声ファイルや動画ファイルから字幕を簡単に作るツールのご紹介です。コミュニケーション支援・会話の見える化アプリを開発している Shamrock Records, Inc. さんが開発・公開してくれたものです。

【HttpClient】C#でAmiVoiceの話者ダイアライゼーションを利用する方法

弊社のAmiVocie Cloud Platformの非同期HTTP音声認識APIにおける話者ダイアライゼーションをC#のHttpClientで実装する方法についてご紹介します。

AmiVoice APIで話者ダイアライゼーションが使えるようになりました

音声認識APIで使える話者ダイアライゼーション (Speaker Diarization)の解説です。複数人が話している音声に対して、話者ごとに発話区間を推定する機能です。利用方法や精度向上のヒントを説明します。

Apple WatchでAmiVoiceの非同期APIを試してみた

この記事では、非同期HTTP音声認識APIを利用してバッチ認識ができるWatchOSアプリのご紹介をします。

音声認識されない単語は単語登録!AmiVoiceの単語登録のコツ

音声認識を使っていて、喋った単語がうまく認識されない経験は多くの方にあると思います。AmiVoiceではそういう時のために単語登録機能があります。今回はAmiVoiceの単語登録機能について、仕組みやコツなどを詳しく説明します。音声認識ならではのクセを理…

年末ご挨拶・2021年記事閲覧数ランキング

今年最後の投稿になります。2021年に投稿された記事の中で閲覧数が多かった記事をランキング化してご紹介します。

InsomniaでAmiVoiceが試せる。音声ファイルを文字起こし。

APIクライアントアプリInsomniaから、AmiVoice Cloud Platform (ACP) のHTTP音声認識APIを試す!

【OBS】AmiVoiceを使って配信画面にリアルタイム自動字幕を付けてみた【字幕と音声・映像の同期方法も!】

ライブ配信時に聞き逃した方や海外の視聴者さんにとって、字幕があったら便利ですよね。 今回は音声認識を用いて、OBS Studioのリアルタイム自動生成字幕プラグインを作って試してみました。実際にお試し版も公開します。

なぜ音声認識率は100%にならないのか?

音声認識技術の究極の目標は「認識率100%」ですが、そう簡単には実現できません。実現できない要因を、話者の特徴・方言などの音響的な観点や、固有名詞・表記ゆれなどの言語的な観点から例を挙げて説明します。

音声ファイルをAmiVoiceで音声認識してみる簡単な方法

「音声ファイルを音声認識してみたい」という方のために、AmiVoiceを使って簡単に音声ファイルをテキスト化してみる方法について解説しました。開発者用のAPIやプログラムを使っていますが、今回のお試しではプログラミングの知識は不要です。

AmiVoiceとGoogleの音声認識率を電子カルテ入力音声で徹底比較してみた!

以前の記事で、AmiVoiceの汎用エンジンと領域特化型エンジンの音声認識精度(音声認識率)の比較をしたところ、AmiVoice VS Google が気になるというご意見を多方面から頂きました。 というわけで、今回は AmiVoice Cloud Platform と Google Speech to Text…

AmiVoice Cloud Platformの3種類の音声認識API(非同期HTTP音声認識APIが新たに追加されました)

AmiVoice Cloud Platformではソフトウェア開発者のためのクラウド音声認識APIを用途に応じて3種類用意しています(2021年10月現在)。今回の記事ではそれぞれの違いや用途について概要を解説します。

AmiVoice Cloud PlatformのAppKeyの取り扱いについて

音声認識APIを提供している「AmiVoice Cloud Platform」のAPPKEYの取り扱い方法について、簡単に解説します。APPKEYの仕様を知ることで、あなたのプログラムのセキュリティレベルを一つレベルアップすることが出来ます。

なぜAmiVoiceは高精度なのか?音声認識エンジンの種類が豊富な理由

音声認識は難しい技術なので、なかなか認識率100%にはできません。今回の記事では、なぜ音声認識は難しいのか、そしてAmiVoiceではどうやってその難しさに立ち向かっているのかを解説します。

音声認識の「エラー改善率」と「認識精度(認識率)」の違いとは?

音声認識の認識精度(認識率)は、認識精度が上がるほど、さらに1ポイント上げるのは難しくなります。その理由を「エラー改善率」という指標を用いて説明します。また、音声認識の論文等でよく使われるWERという指標についても触れています。

AmiVoiceの領域特化エンジンの音声認識精度を比べてみた(汎用 vs 電子カルテ)

何を喋っても正しく認識できる万能な音声認識エンジンを作るのは難しいので、AmiVoiceでは数種類の音声認識エンジンを開発者向けに提供しています。今回はその中から汎用エンジンと電子カルテ用エンジンを使って認識率を比較してみました。

Linuxで音声認識を動かしてみた3(ACP+pulseaudio編)

「Linuxで音声認識を動かしてみた」という題材でお話していきます。今回の目標はACPのC++とPulseAudioライブラリを使ってマイク認識するまでです。

Linuxで音声認識を動かしてみた2(簡易マイク入力編)

「Linuxで音声認識を動かしてみた」という題材でお話していきます。今回の目標はACPのC++とarecordコマンドを使ってマイク認識するまでです。

Linuxで音声認識を動かしてみた1(ビルド編)

「Linuxで音声認識を動かしてみた」という題材でお話していきます。今回の目標はACPのC++のサンプルをビルドして動かすまでです。

音声認識精度よりも大切なこと(タスク達成率)

音声認識の性能を見る指標として、音声認識精度(音声認識率)がとてもよく使われますが、それだけでは見逃してしまう重要な性能もあります。今回はAmiVoiceの社内でも使われることの多い「タスク達成率」について説明します。

「認識精度(認識率)○○%」の見た目を比較してみた

「音声認識の認識精度(認識率)が○○%」と数字で出されても、見た目でどの程度正しく認識できているかは分かりづらいですよね。この記事では、認識精度が50%・80%・90%…といった文を正解と比較して、その見た目の差を解説します!

WebSocket + AVAudioEngineを駆使してApple Watchでリアルタイム音声認識してみた

Apple Watchで音声認識をしてみたいと思ったことはありませんか?本記事では、AmiVoice Cloud Platformを利用することで、容易に音声認識を実装できることを説明していきたいと思います。

その音声認識精度は本当に正しいのか?

安藤章悟 みなさま こんにちは。以前の記事で、AmiVoice Cloud Platform( https://acp.amivoice.com/ )とGoogle Cloud Speech-to-Textを使って音声認識精度(音声認識率)を計測してみました。 amivoice-tech.hatenablog.com 結果はこうでした。 エンジン 音…

音声認識で固有名詞を認識させる方法

固有名詞を認識できなくて困ることはありませんか?本記事では、開発者向けにAmiVoice Cloud Platformを使って固有名詞を認識するまでをざっくり説明していきたいと思います。

音声認識エンジンAmiVoiceの音声認識精度(音声認識率)を計測してみた

安藤章悟 みなさま こんにちは。 AmiVoiceユーザーのみなさまからのよくある質問に「AmiVoiceって音声認識精度(音声認識率)は何パーセントですか?」というものがあります。ですが、実際に音声認識精度がどういうもので、どうやって測るかはあまり知られて…

【初心者向け】Perlを駆使して音声認識APIを使ってみた

ひしばゆり はじめまして、ひしばゆりと申します。 株式会社アドバンスト・メディア(以下AMI)所属の「超初心者」エンジニアです。AMI入社時はアルバイトで、未経験からのスタートでした。 今回はそんなわたしが、初心者でも弊社の音声認識API「AmiVoice Cl…