【ヒント】認識率ってなんだろう?

ほんの今からUDトークを使い始めた人は「まだ誤認識がありますね。もっと認識率あがるといいですよね」といいます。

これ、3〜4年前、それこそUDトークができたときから使い始めてる人が聞いたらひっくり返りますよね(笑)。それこそ音声認識の業界に10〜20年関わってきた人からするとまさかここまで認識するなんて、と言うレベルに達してます。

でも、ほんの今から使い始めた人のその印象も「正しい」のです。知ったその時がその人にとっての相対的な「あたりまえの認識率」になります。それは絶対的な値にするともちろん高く、ずっと右肩上がりです。悪くなることはなくこれからどんどん良くなります。

でも認識率に100%以上はありません。もし仮に130%とかあったらそれは自動生成とか「忖度」になりもしかしたらAIの世界になるかも?(笑)

つまり何がいいたいかと言うと、認識率の話しとかそれを採用基準をするのって「意味がない」という事です。使い始めた時期にも、目的によっても、環境によっても求められる数値が変わってくる、そんなものでの比較や検討は本質的には思えません。

例えば絶対的な数値で80%の認識率だったとします。

Aさん:なんだ20%しか間違わないんだったらたいしたもんだ。
Bさん:20%も間違うならそんなの全くダメだね。

これはちょっと前に「Aさんは海外の、Bさんは日本の考え方」と揶揄されていましたが、いまはわりとAさんタイプも日本に増えてきてるように思います。

なぜ認識率と言う数字にこだわってきたのか?それは最先端の技術である音声認識が「高くて手に入らなかった」「研究室や企業の製品のでしか試せなかった」からなのですよね。でもいまは、特にUDトークは最先端の音声認識技術を搭載しているのに、それをスマホのアプリとして無料で配信し当たり前に使えるようにしています。ほとんどの人が認識率と言うのを知るまでもなく自分で使ってみて体感できます。

そうなってくると「はじめての音声認識の結果」が重要になってくるわけですが、それは運が悪い人もいれば、はじめからやる気がない人もいる(いい結果を得ようとしない)ので試してもらうときには「正しい使い方を教える」か「最高のパフォーマンスを見せる」必要があります。

あと「認識結果が良くなる」と言う表現も実は微妙に間違っていて、先にも書きましたが、認識率は100%が最高です。なのでそこから下がるので認識率は「維持するもの」であり結果が悪くなってくる「要因」があると考えます。

そうすると「あ、だからうまく使えなかったんだ…」ってことが自ずと見えてきます。あと大前提として登録されていない単語はいくら頑張っても出ません。素直に登録しましょう。

50%くらいしか認識してなくても役に立つシーンもあれば、90%近く認識しててもUDトークじゃないねぇ、ってシーンもあります。

認識率と言う数値にとらわれず、目的に合うかどうかで採用をきめるのが良い結果を生むと思います。