12月12〜14日に東京ビッグサイトで開催されたSEMICON Japan 2018、TechSTAGEのすべてのセッションに自動リアルタイム字幕を提供させていただきました。今回は「協賛」という形をとりましたので、ホームページ等にも大きく掲載いただき、各TechSTAGEの入り口には大きくQRコードと案内を表示していただきました。

今回は「自動提供」でサービスとしてリアルタイム字幕を配信すると言うコンセプト。ですので、スクリーン投影なし、編集者なし、ですがそのかわり使用されるであろう専門用を500語ほどしっかりと登録していただきました。現場で見ている限り、かなり認識精度は高かったように思えます。

TechSTAGEは3箇所「South」「North」「Innovation and IoT」。朝それぞれのディレクターの方がUDトークの「タップして話す」ボタンを押す、あと日本語以外の話者になったら手動で切り替える、この2つの操作だけで運用が可能でした。機材はすべてSEMICON事務局でレンタル(ケーブル、iRig2、iPad、Mobile WiFi)しました。

機材も操作も非常に低コストでサービスが提供できました。今回協賛なのでシステム利用料はありませんが、もしイベント向けプランを使用するとしても一日一万円ですので、これで3ステージ27セッションのすべて字幕対応に加えて記録も取得できます。

各言語でのQRコードの案内も作成して多言語対応もバッチリです。

英語のスピーカーの方も何人かいらっしゃいまして、そのときは瞬間的にUDトークの使用率が上がりました。おそらくは会場の1/3くらいの方が手元のスマホでご覧になってたかと思います。

むしろ専門用語や論理的な話は英語の認識率が非常に高いと感じました。翻訳はもちろん完璧ではないですが、そこに参加している人たちならピックアップすればわかる内容だったと思います。

では今回どれくらいの人がUDトークを見たのか?必要だったのか?ですが、ほとんど必要なかったと思います。ですが1000人のうち1人しか必要じゃなかったらやらなくてもいい、500人必要だったらやるのか?と言うとそれも違うと思います。

  • 要望があったら人数によらず必要な対応を行う
  • サービスとして対象者の有無によらず行う

この2つの観点が重要です。自己主張が強く要望がほぼ通る海外のイベントなどは前者が多いと聞きますが、後者の対応が日本人には向いていると考えています。これがいま低コストで行うことが出来るようになりました。

もしこれにリアルタイムの編集者をつけるとしたら常時2名で対応することになります。そうするとスクリーンに出すなどのもっと見栄えを良くする運用も可能で0す。

これからリアルタイム字幕は当たり前になっていき、何人がそれを見ているかと言う議論自体が過去のものになると考えています。もちろん音声認識は機械なので誤認識はありますが、

  • 9割近くは正しい字幕を出せる
  • 人が修正することで正しい字幕を出せる

理解して使いこなす、適応していくということが見る側にも提供する側にも必要となっていて、今回SEMICON Japanの事務局の方はこれをちゃんと理解して運用していただきました。

ぜひ今後もこうした「協賛」の形は取りたいと思いますので、よろしくお願いします!