AmiVoice Techblog

AmiVoiceの音声認識に関する技術情報・活用方法・組み込み方などを発信するアドバンスト・メディアのテックブログです

【中級者向け】AmiVoice の単語の読みの自動変換について

f:id:amivoice_techblog:20210115094116p:plain 安藤章悟

みなさま、こんにちは。

以前、こちらのAmiVoiceの単語登録のコツで「読みは自動的に変換される」というお話をさせていただきました。

例えば、以下の「読み」は全て同じものとして扱われますので、このようないろいろなパターンを登録する必要はなく、どれか1つだけを登録すれば十分です。

 "とうきょう"
 "とうきょお"
 "とうきょー"
 "とおきょう"
 "とおきょお"
 "とおきょー"
 "とーきょう"
 "とーきょお"
 "とーきょー"

上記は「全て同じ読みとして扱われるのでどれか1つでいいよ」ということですが、この例だけだとどういうケースでどう登録をすればいいのか分かりにくいので、もう少し詳細を説明します。

 

日本語では連続した母音は長音化することがある

「成功(seikou)」という単語は本来なら読みは「せ/い/こ/う」となるところですが、「ei」「ou」と母音が連続している箇所があり、そこの音が「えい→えー」「おう→おー」と変化し、「せー/こー」という読みに変化をします。この現象を長音化と言います。

 

AmiVoiceによる読みの自動変換

AmiVoiceでは、連続母音の長音化の対応として、単語登録時に読みに下記7パターンの母音の連続があった際は長音に自動変換しています。

  • aa → a:(例:かあ→かー)
  • ii → i:(例:きい→きー)
  • uu → u:(例:くう→くー)
  • ee → e:(例:けえ→けー)
  • oo → o:(例:こお→こー)
  • ei → e:(例:けい→けー)
  • ou → o:(例:こう→こー)

例として、「おとうさん(お父さん)」と登録すると「お/と/う/さ/ん」ではなく「お/とー/さ/ん」となり、「おかあさん(お母さん)」と登録すると「お/か/あ/さ/ん」ではなく「お/かー/さ/ん」として読みが登録されます

 

AmiVoiceで読みの自動変換をさせない方法

上記7パターンは長音化するケースが多いため自動変換をしていますが、中には例外的に長音化しないケースがあったり、また地域差などもあります。

そこで、長音化させたくないケースでは連続する母音の間に "." (半角ドット)を入れることで読みの自動変換をさせないことが可能になっています。

例として、長音化しないこともある単語と、その読み指定の例が下記です。

単語 読み指定 登録される読み
先生 せんせい せ/ん/せー
先生 せんせ. せ/ん/せ/い
丸の内 まるのうち ま/る/のー/ち
丸の内 まるの.うち ま/る/の/う/ち
ため息 ためいき た/めー/き
ため息 ため.いき た/め/い/き

 

実際のところ、長音化してもしなくても音響的には似ているものが多いので、"." を使った詳細な読みを指定しなくても問題なく音声認識することが多いです。どうしてもうまく音声認識しない場合や、少しでも音声認識精度を高めたい時に試してみるとよいでしょう。

この記事を書いた人


  • 安藤章悟

    音声認識の研究をしていたら、近所に音声認識屋を見つけてしまい入社。今に至る。

    趣味は海外旅行と美味しいものを食べることとサウナ。

    f:id:amivoice_techblog:20220410134301p:plain : @anpyan