【アプリ】新機能!日本語の音声認識モードを選択可能に

iOS版 ver.158、Android版 ver.120で日本語の音声認識でAmiVoiceの高精度認識や端末組み込みのエンジンを選択できるようにしました。(写真は法人向けプラン適用の端末なのでGoogleまで選択できるようになっています)。

※Android版のGoogleでは連続音声認識できないので今まで通りAmiVoiceをご利用ください。単発話でよければGoogleをお使いください。

いままで無料版は認識率向上のため音声データの収集を行なっておりました。

【ヒント】喋った音声はどうなるの?

まず現在本当にたくさんの方におつかいただいてまして、音声データの収集が十分になってきました(もちろんあればあるだけありがたいです)。

でもユーザーが増えすぎてサーバーが逼迫しレスポンスが鈍い時があります。そういう時にやはり使えないと困ることになります。 それもあり選択肢としてiOSではAppleの組み込み(Siriのですね)、Androidでは本体の音声認識機能で日本語も入力できるようにしました。

もう認識率が高い低いというところで話をするフェーズは終わり「特色を生かしてどう活用するか」だと思います。

AmiVoiceは単語登録もでき、句読点も入ります。なにより「音」があったところに忠実に結果を出すので議事録作成や字幕作成にはこれ一択です。 ですが、例えば雑音が多いところとか話し方が曖昧なケースなどはAppleやGoogleの音声認識エンジンの方がわかる結果を出すケースもあります。

このあたりは動画に違いをまとめてありますのでごらんください(AppleのはGoogleに近いです)。

【UDトーク】第二十一回:AmiVoiceとGoogle、音声認識エンジン比較!

あと実はAmiVoiceにもAppleやGoogleに近い状態で認識をする機能があります。

最近はUDトークを「自助」のツールとして自分で使う人も増えてきました。そこで「高精度」認識モードを選択できるようにしました。ただしこれは編集者が入るときは編集する単位が大きくなってしまうので向きません。使い分けを考える必要がありますが、修正者なしの自動字幕で使うときはきっといい結果が得られると思います。

これについては後日YouTubeでまとめて解説をしたいと思います。

※リリース後に法人向けプランでAmiVoiceのみを使用可で運用されてるところが「高精度」を選べないバグを見つけました。すぐにver.158をリリースしますのでお待ちください。