【トピック】記録を残すために喋る

UDトークの面白いところ(と言っちゃ変だけど)は、すごく評価が二分することです。例えば議事録や文字起こしでこんな感じです。

・すごい認識率高くて使える!

・まだまだ認識率に課題があって使えない…

UDトークは来年で10年目を迎えるわけですが、リリース当初からほんと今日までずっと「同じアプリ」に対して言われて来ています。なのでもう何を言われても気にしないのですが、なぜこうも二分するのかは考えてみたくなります。

一つの解としては「課題がどこにあるか」です。まず音声認識での議事録や文字起こしを導入する理由としては「楽ができる」「コストダウン」と言うのがあると思います。

(もちろん一番使われてるであろう聴覚障害者対応での情報支援はもう用途としては定番で絶対必要なものですが)

そこで導入して楽ができなくてコストダウンもできなかった場合、後者の「まだまだ認識率に課題があって使えない」になるわけです。つまりこれは

「喋ったことを記録に残す」

と言うことができなかったためにそういう結論になると。つまり会議自体のやり方を変えないでいい感じの議事録ができてくることを期待したらそれができなかった。

たぶんこの場合って認識率ではないと思います。ほとんど誤認識がなくてもこの人たちの中では「期待するものではなかった」わけです。そもそも人が聞いて理解できないことは音声認識もできないし、したとしても記録として出して読んでもわからないでしょう。まず会議の進め方や喋り方に課題があることをきちんと認識しないと音声認識を入れたところで、と言う話です。そしてそこに課題があると言うと「技術やアプリが未熟だから」と決まって言います。

ところがうまく導入できている人たちは会議の進め方や話し方に課題があることを認識した上で音声認識を導入し

「記録を残すために喋る」

と言う意識で使っていると思います。そうすると課題は導入した音声認識技術を「記録を残すためにどう活用していくか」と言うところに向きます。例えば喋る前に名前を名乗ってタグ付けみたいに結果を出しておけばあと話者ごとにまとめやすいとか、文章で出してわかりにくい言い回しは言い直してみるとか。その日の議題をちょっと単語登録しておくとか。最後に要点をまとめて喋って記録に残しておくだけでもいいですよね(キーボードの代わりに喋るわけです)。

UDトークはリアルタイム字幕での運用が多く、今の時点で誤認識はあるけど認識率にすごく課題があると思う人は少ないと思います(何を求めるかによっても違うかもしれませんが)。

リアルタイム字幕からすると議事録での使用はハードルは低いです。音を聞いて後から直せばいいし、いつでも作業できます。「まだまだ認識率に課題があって使えない」と言ってる人たちはもう仕方ないと思いつつ別にこちらから直接言うことはしませんが、それ「すごくもったいないですよ」とは言いたくなります。音声認識を導入するしないの前に会議の進め方や話し方の課題に気がついていないので。

音声認識を議事録として活用するときは使う人たちが「喋ったことを記録に残す」から「記録を残すために喋る」と言う意識を変えて課題の認識するだけで、すごく活用の幅が広がります。

そうしたアプローチで一度取り入れてみてください。