音声認識技術について

UDトークでは株式会社アドバンスト・メディアの高精度日本語音声認識エンジン「AmiVoice(アミボイス)」を採用しております。AmiVoiceの中でもクラウド上で大規模に処理をするAmiVoice Cloudを実装しております。

AmiVoice Cloudは「日本語」で提供しております。AmiVoice Cloudの特徴としては「単語登録」ができたり「長時間の処理ができる」ことによりスピーチや動画の音声を文字化することが可能です。

無料版では日本語以外の言語はOS提供の音声認識エンジンを使用しております。つまりiOSであればApple、AndroidであればGoogleを使用しております。

法人向けプランではiOSアプリのみ日本語以外の言語でGoogleのCloud Speech-to-text APIを採用しています。

Cloud Speech-to-text API – 拡張モデルの使用
(UDトークは拡張モデルを使用しておりません。つまりデータのロギングは行っておりません。)

コンパクトプランと法人向けプランでは日本語の音声認識エンジンをAmiVoiceとGoogleで選択することができます。用途によって使い分けてください。

※また「英語、中国語、韓国語」ではAmiVoice Cloudを選択することもできます。国内のベンダーのクラウドサービスのみを使用したい場合にご利用いただけます。

GoogleとAmiVoice、音声認識の特徴

多言語翻訳技術について

無料版のアプリでは「Google翻訳」を実装しています。

Cloud Translate API – データ使用に関するよくある質問
(Google翻訳はデータの再利用を行っておりません。)

※法人向けプランでは株式会社高電社の「翻訳クラウド」も選択することができます。国内のベンダーのクラウドサービスのみを使用したい場合にご利用いただけます。

音声合成技術について

読み上げで使用する音声合成はiOSやAndroidで提供される端末のものを使用しております。


音声認識、多言語翻訳、音声合成を一覧にまとめてみました。

【音声認識】 【多言語翻訳】 【音声合成】
無料版 AmiVoice Cloud Google翻訳 OS提供
OS提供
(その他の言語)
法人版
AmiVoice Cloud
OS提供
Google音声認識
(その他の言語)
※使用しない設定可

法人向けプランでは音声認識サーバー上に音声データが残らない運用が可能です。

漢字かな変換/置き換え技術

初等教育のグレードに合わせて未習得漢字をひらがなに置き換える機能があります。株式会社トップゲートのサービス「初等教育漢字振り分けAPI」を使用しています。