【トピック】認識結果は編集しよう!
音声認識の結果は完璧ではありません。そもそも何が完璧なのか、その定義も難しいです。話者が「いい間違えた」場合、認識結果は
・間違えたまま出す?
・間違いを正して出す?
前者は音声認識としては正しいですが、見た人は間違っていると言うでしょう(こういう人は減ってきましたがまだまだいます)。後者はある意味では改ざん担ってしまうので望まない結果でもあります。
UDトークはこういうとき「認識結果を修正する」機能があります。知っているよ、という方は多いのですがこれ以外と知られてないケースもあり。
修正方法は簡単です。項目をタップするだけです。その発話が編集できます。自分の発話の編集はもちろん、トークの公開で接続されてる相手の発話も編集できます。
またWindowsとMacではPCで編集できるツールもダウンロードできるようになってます。
単語登録では補えなかったところは積極的にみんなで編集しましょう。
よく「編集は難しい」と言う方もいらっしゃいますが、同じくらい「誰でもできる」のでそのへんの人やみんなにやってもらうって人もいます。
UDトークが協賛として関わる多くのイベントもコンセプトは「みんなで創る字幕」と言うコンセプトで数百人の参加者全員で編集していくようにしています。その結果、適した字幕も表示され記録も残せます。(※このときはQRコードを編集許可で配布します)
よく運用ケースでも「まだ誤認識が多い」とコメントしているところは編集をしていないところが多いです。編集作業があたりまえになると誤認識があるないはさほど問題ではないのです。見つけたらささっと手持ちのスマホで修正をしましょう。これは大きなシンポジウムでも飲み会で使っても使い方は同じです。
ちなみに、AIテクノロジーの観点から言うと多くの(例えばタイピングのような)単純作業は機械に変わっていきますが、認識結果の編集はいまは「人間にしかできない仕事」でありおそらくこの先もしばらくはそうでしょう。なので「ありがたくやりましょう」とUDトークのセミナーでは皮肉まじりの冗談で紹介をしております(笑)。でもこれはホントです。「配慮する」ということはまだまだAI技術では苦手とするところなので。
AIがほとんど作業をしてあと少しを人間が行う、と言う理想的なモデルがUDトークで出来上がってます。
ぜひみなさん(特に法人利用されてるかたは)、運用を一度見直してみてください。これは聴覚障害者支援のアプリではなく議事録・記録作成や会議の可視化アプリとして見ると運用のモチベーションも変わってくると思います。