AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

AmiVoice APIの単語登録機能で選択可能な「クラス」の解説(汎用エンジン)

f:id:amivoice_techblog:20210115094116p:plain 安藤章悟

みなさま、こんにちは。

AmiVoiceの単語登録機能では「クラス」という項目を指定すると、登録した単語がどのような文脈で出現しやすくするかを指定することが出来ます。

詳しくはこちらの記事で説明しました。

今回は、この「クラス」について、AmiVoice API の汎用エンジンである「会話_汎用」(接続エンジン名:-a-general)と、「音声入力_汎用」(接続エンジン名:-a-general-input)が持つクラスの詳細を説明します。

 

・固有名詞

さまざまな固有名詞のクラスです。具体的には、商品名、サービス名、作品名、イベント名、施設名、団体名、またニュースなどでトピックになるワードなどさまざまな単語の文脈を持っています。

・名前

「苗字(ラストネーム)」のクラスです。

また、フルネームを登録する時にも、このクラスを使用することをおすすめします。

・名前(名)

「名前(ファーストネーム)」のクラスです。

・駅名

「駅名」のクラスです。

このクラスに単語を登録する際は、必要に応じて "駅" を付けた表記と付けない表記のそれぞれを登録する方が好ましいです。

例えば "架空駅" という駅を単語登録する場合に「架空駅で待ち合わせ」のような発話をするのなら "架空駅" を単語登録してください。「架空で待ち合わせ」のような発話をするのなら "架空" を単語登録してください。

・地名

市区町村や、島、山、州、などの「地名」のクラスです。

上記の駅名と同様に、例えば "架空村" という村を単語登録する場合には "架空村"と"架空"をそれぞれ必要に応じて単語登録することが好ましいです。

・会社名

「会社名」のクラスです。会社名は正式名称だけではなく通称や略称で(時には少し間違った呼び方でも)発話されることもありますので、正式名称にこだわらず発話されそうな名称で登録することがポイントです。

・部署名

会社や組織に所属する「部署名」のクラスです。

駅名や地名と同様に、例えば "架空グループ" という部署を単語登録する場合には "架空グループ" と " 架空" をそれぞれ必要に応じて単語登録することが好ましいです。

・役職名

「役職名」のクラスです。部長・課長のような役職名だけではなく、肩書や資格名などの文脈も持っています。

・記号

"&"や、"@"、"+"、"ー"、"○"などの「記号」のクラスです。特殊な記号を音声認識させたい時に使用します。

元号

元号」のクラスです。2022年10月時点ではこの元号クラスには "明治" 以降の元号のみが登録されていますので、それより前の元号で認識させたい・認識しにくい場合などにご利用ください。

※明治より前の元号でも、元号クラス以外で音声認識エンジンに学習されている場合があり、その場合は単語登録しなくても音声認識されます。

・括弧開き

"("  などの括弧(開き)のクラスです。特殊な括弧を認識させたい時に使用します。

・括弧閉じ

")" などの括弧(閉じ)のクラスです。特殊な括弧を認識させたい時に使用します。

 

クラスは指定しなくてもOK

単語登録の画面をご覧頂くとわかりますが、<クラス未指定> として単語登録することも出来ます。その場合、登録した単語はさまざまな文脈で出現しやすくなります。

登録する単語の読みが長くユニークな場合にはクラスを指定しなくても問題ないことが多いですが、もしも登録する単語の読みが短かったり(例えば1~2文字)、他に似た読みの単語が多くある場合には「喋ったつもりが無いのに間違って音声認識されてしまう」という可能性が上がるため注意が必要になります。

そのような場合は、適切にクラスを指定することで、喋った内容の文脈に応じて適切な単語が音声認識されるようになります。

 

クラスは使用する音声認識エンジンごとに異なる

今回は汎用エンジンのクラスについて説明しましたが、使用する音声認識エンジンによって選択できるクラスは異なります。下記画面の「エンジン選択」で汎用エンジン(-a-generalと-a-general-input)以外を選択すると、今回の説明に無いクラスも出てきますのでご注意ください。

さいごに

今回は AmiVoice API の汎用エンジンの「クラス」について詳細を説明しました。

単語登録した時になかなか思い通りの単語が出なかったり、あるいは喋っていないはずなのに単語登録した単語が出現してしまうような場合には、クラスをうまく活用いただければと思います。

この記事を書いた人


  • 安藤章悟

    音声認識の研究をしていたら、近所に音声認識屋を見つけてしまい入社。今に至る。

    趣味は海外旅行と美味しいものを食べることとサウナ。

    f:id:amivoice_techblog:20220410134301p:plain : @anpyan