音声や言語の技術


音声認識技術について

「文章で話された音声を文章の文字に変換する」のが現在の音声認識の技術です。つまりちょっと文章より話すと精度が高い結果を得ることができます。

UDトークでは株式会社アドバンスト・メディアの高精度日本語音声認識エンジン「AmiVoice(アミボイス)」を採用しております。AmiVoiceの中でもクラウド上で大規模に処理をするAmiVoice Cloudを実装しております。

現在、AmiVoiceは「日本語」と「北米英語」で提供しております。AmiVoiceの特徴としては長時間の処理ができることによりスピーチや動画の音声を文字化することが可能です(※無料版には3分間の制限あり。くわしくはこちら

その他の言語はOS提供の音声認識エンジンを使用しております。つまりiOSであればApple、AndroidであればGoogleを使用しております。

多言語翻訳技術について

UDトークは「Google翻訳」を実装しております。普段みなさんがウェブ上で使用しているものと同じ精度でご利用いただけます。法人向けプランでは「日本語、中国語(簡体字、繁体字)、韓国語、英語」で株式会社高電社の「翻訳クラウド」を実装しております。オプションをご利用いただくことで言語間の双方向の多言語翻訳単語登録が可能です。

※iOS版 ver.5.5.4、Android版 ver.3.5.4まではMicrosoft翻訳を実装していました。

音声合成技術について

読み上げで使用する音声合成はiOSやAndroidで提供される端末のものを使用しております。

【音声認識】 【多言語翻訳】 【音声合成】
無料版 AmiVoice Cloud
(日本語、北米英語)
Google翻訳 OS提供
OS提供
(その他の言語)
法人版 AmiVoice Cloud
(日本語、北米英語)
翻訳クラウド
(日中韓英)
OS提供
(その他の言語)
※使用しない設定可
Google翻訳
(その他の言語)
※使用しない設定可

法人版の音声認識「AmiVoice Cloud」と多言語翻訳「翻訳クラウド」はサーバー上にデータを残さない運用をしております。

漢字かな変換/置き換え技術

初等教育のグレードに合わせて未習得漢字をひらがなに置き換える機能があります。株式会社トップゲートのサービス「初等教育漢字振り分けAPI」を使用しています。