【トピック】UDトークの今後どうなる?


「UDトークはこのあとどうなっていくんだろうな〜」と言うことは常々考えていたりします。こここ3〜4年の音声認識で声を文字にする界隈の「変化」を見てても次の3〜4年はもっと早く変わっていくんだろうなと。

まずUDトークを「使う」と言うことは2つあって

・自分で相手やメディアから発信された音声を拾って文字にして見る
・自分が発信する音声やメディアを文字情報として伝える

UDトークはずっと「伝える方が使う」ってコンセプトで言い続けているので前者の使い方ではなく、後者の使い方になります。

それで前者の使い方に関してはいま世の中に出ている自動の音声認識字幕がそれでたくさん選択肢が増えてきました。YouTubeの自動字幕もそうだし、Microsoft Teamsの字幕もそうです。正直この辺りは「自分がいいと思うもの」をメインで使ったり、併用して結果を見比べることで情報を得ていただければいいのかなと。UDトークのAmiVoiceの特徴は「音があるところには何か出す」なので実はGoogle等と併用すると効果が上がったりします。

後者の使い方に関してはUDトーク調べではあまり競合製品もない気がします。そもそも「音声認識の結果を修正して正しく出す」と言う発想は日本語独特なようにも思えます。伝える方が出したい字幕を出すと言う手段としては音声認識をキーボードの代わりに使う「リスピーク入力」で全文や要約をしながら字幕を出していくのもいい手段だと思います。こちらは自動というよりは人がやる仕事を音声認識でサポートすることになると思います。

前者の使い方の中で以前はUDトークだけだったものがいまは多くの選択肢が出てきてある意味で特別なものではなくなってくると、反面後者の方はUDトークにしかできないことが明らかになってきてリアルタイム字幕の裏側で動いていくのかなと。

余談ですが最近よく「UDトークあり」って表示があってUDトークが「音声認識アプリ」の代名詞になっていたりします(笑)。UDトークを知ってる人ならいいんですが、「UDトーク(音声認識アプリ)あり」とか「音声認識字幕(UDトーク)」とか書いてもらった方がいいんじゃないかなと思いながらも、こんな感じに世の中に浸透していくんだってことを面白い感じで見ています。

流石に10年後、20年後はまた違った世の中になっていると思うのですが、数年後の近未来、いま変化が自分達でも実感できるくらい変わっていくのが早いので楽しみではあります。