【トピック】生成系AIと相性が良いUDトーク
最近はほんと「AIで議事録作成」という製品が増えてきたと思います。中にはリアルタイムに認識結果を出せるものもあり、わざわざUDトークを使わなくても手軽にできるようになったかな、と思ったのですが、今でもむしろ前以上にUDトークが使われています。なんでかなと考えつつも、自分も議事録や講演録、生成系AIで要約やレポート作成なんかをするときにUDトークを使っています。
音声認識エンジンにもよりますが、「単語登録がちゃんとできる音声認識エンジンで出た結果の方がデータとして相性が良い」ということなのかなと思います。いくら音声認識から要約作成まで自動でできても、たとえば固有名詞が全然認識されず結果として出てこなかった場合、生成系AIを通しても「なんの話をしてたのだろう?」ということになります。実際、「UDトーク」という単語さえ認識しない音声認識エンジンがほとんどです。
では普通の誤認識はどうかというと、ほとんど気にせず処理をしてくれるようです。音声認識の誤認識も今では人間が起こす誤字脱字くらいに生成系AIは感じているのかもしれません。
これらのことから、やはりきちんと生成系AIで要約をしたり分析をするためのデータは、一番重要な固有名詞を認識している必要があります。おそらくそれに気がついた人たちがいて、またUDトークで音声認識の結果から議事録作成したり、生成系AIへの入力データとして活用しているのではないかと。
実際のところはわかりませんが、個人的には単語登録ができない音声認識エンジンで作成した結果と、UDトークでちゃんと単語登録をして作成した結果では、同じ生成系AIを使っても出来上がってくるものの差は圧倒的にUDトークの結果を使用したものの方が良いです。
ぜひ一度試してみてください。