shamrock1976 のすべての投稿

【運用レポート】塩野義製薬株式会社

塩野義製薬さんからUDトークの社内での活用レポートをいただきました!

もうベテランユーザーの塩野義製薬さん。社内でも運用チームが立ち上がりうまく活用できているようです。

引き続きよろしくお願いします!

ーーー
【イベント概要】
7月17日(金)4時間にわたるシオノギグループの社内発表イベントを開催。

社内からUDトーク修正タイピスト(10名)を募集した。ただし、COVID-19拡大防止のため、社内中継先で遠隔修正を実施した。

【工夫点】
事前に収集した発表資料から、誤変換しやすい専門用語等をピックアップし、UDトーク単語登録を実施した。その結果リアルタイム修正のタスクが少なくなった。

本拠点は、Web会議ツールのチャット機能を利用して、中継先の修正タイピストとコミュニケーションを行なった。修正タイピストの負担軽減のために、演目ごとに2名の修正タイピストの交代を指示したことから、効率的なタスク配分ができた。

【改善点】
中継先の配信画面はスライドのみであったことと、別途配信しているUDトーク画面とスライド間の視線移動が苦痛だったため、次回は配信画面にUDトークが反映されるようにするなど改善していきたい。

シオノギは聞こえる人、聞こえない人誰でも参加しやすい環境作りを今後も全社向けイベントを通して実施していきます。

【運用レポート】Asia Open Data Challenge 2020 イベント

7月9日(水)日本、韓国、台灣の合同で開催されるAsia Open Data Challenge「COVID-19対策における 台湾・韓国・日本の官民連携事例」が開催されました。こちらCode for JapanのサポートでUDトークによるリアルタイム多言語字幕を提供、多くの参加者の方にお使いいただきました。

英語で開催されるイベントということでなかなか言語のハードルは超えづらいのが私達日本人。UDトークは自動翻訳で内容がわかる程度にはサポートができると思っています。

今回は数人で英語の誤認識の修正も行いました。YouTube Liveであることの利点を活かし「少し遅らせて再生」して認識結果を見ながら聞いて修正しました(このテクニックは日本語でも使えるのでぜひやってみてください)。特に英語は後から聴きながらの編集がしやすいようです。

日本人の名前や固有名詞など、英語の音声認識(Google)は単語登録ができないので、改めて単語登録ができる日本語エンジンAmiVoiceのありがたみがよく分かります。

こちらではこうしてZoomの画面共有と組み合わせてZoomの字幕機能には英語のリアルタイム字幕(途中経過も出る)、画面は分割して大きく字幕を並べるようにしてみました。資料も話も一緒に見れてとても聞きやすかったです。

「英語」というのはマジョリティの言語で便利ではあるのですが、アジア圏の方々にとっては第二外国語。いつかは自動翻訳・自動音声認識で全員が「母語」で話してこうしたイベントが開催できるようになるといいなと思っています。UDトークならいま技術的にはもう可能なので、そうした多言語対応の「チャレンジ」をしていただけるイベントがあれば協賛しますのでコメントください。

【お知らせ&シェア】無料版の連続発話の時間制限を無料にしました

iOS版 ver.126、Android版 ver.89より、月額240円で提供していた時間制限のアドオンを無料で提供することにしました。これにより30分の時間制限がなくなります。

このアドオンを購読中の方はバージョンアップ後、トップ画面に案内が表示されますので、マニュアルを参考に購読を解除してください。

https://teachme.jp/27228/manuals/782806/

アプリ内からは解除できませんので、ご自身で操作をお願いします。

引き続きご利用ください!

【トピック】ネットワークのトラブル

UDトークは遠隔でも使用できてとても便利ですが、どうしても遭遇してしまうのがネットワーク関係のトラブルだと思います。そこで現象ごとに可能性がある原因を列挙してみたいと思います。もちろん全ての原因はネットワークの状態が悪いと言うことに行き着くので、どこに原因があるかと言うのを見つけるためのヒントになればと思います。

■音声認識の結果が出てくるのが遅い

音声認識をしている端末でそもそも音声認識結果の表示が遅い場合はネットワークの状態が悪い、もしくは音声認識サーバーが混み合っている可能性があります。最近はサーバーの数も増やすことができているのでそこまで大きな遅延は発生しないと思いますが時間帯によっては発生する可能性もあります。

■トークに参加している端末で全てで表示が遅い

この場合は音声認識をしている端末のネットワーク環境が良くない可能性があります。音声認識結果はスムーズに出ている時もありますが、音声認識の結果を参加している端末に送信するのはまた通信方式が違うので、ネットワークの状態やルーターのスペックなどにも依存してきます。この場合は音声認識している端末が接続しているネットワークをハイスペックのルーター(モバイルルーターなどではなく)や、4GやLTEに切り替えると解決することが多いです。古い端末で動作させると起きることもあります。運用のコツにもなりますが音声認識をしている端末のスペックや環境は良いものを使用してください。

■トークに参加しているいくつかの端末で表示が遅い

この場合は個々のネットワーク環境に依存、もしくはPCや端末のスペックに依存しています。特にウィンドウズで厳しめのウイルスチェック関係のソフトが動いている場合に起きていることが多いです。例えばリアルタイムチェックをユーディートークのアプリだけ外すとか、企業や団体等で使用している場合は地域の管理者にお問い合わせください。

■通信環境全般

時々Wi-Fiを使っている環境で電波が強いのに通信がうまくできないと言うことをきますが、電波強度と通信帯域はまた別の話になってきます。特に大学では授業が始まる前に使っているときは通信がうまくいくのですが、授業が始まって学生さんたちが一気に教室のWi-Fiに接続するとより、使えなくなると言う報告が多数上がってきています。それは当たり前と言えば当たり前なのですが、UDトークで通信できる帯域がなくなってしまっていると言うことです。通信速度を測定するためのアプリがたくさんありますのでそれらを使って通信速度を確認してみるのもいいと思います。

ネットワーク環境は1つ安定した運用を見つけておくとトラブルが起きにくいと思いますし、アプリや機材が変わらない中で唯一変わるのがネットワーク環境だと思います。自然に解決するものでもないので、まずは原因の切り分けをしてみて「
どこが変わると状態が変わるのか」をきちんと見極めることもトラブルを回避するためには大事です大事なことです。

【お知らせ】iOS版でアドオンが反映・復元できない方へ

(追記)開発者の個人アカウントで実際に購入をしてみました。iOS13.5でも購入でき、アンインストール後に復元をしても問題なく復元がされます。

ーー
先週くらいからいくつか「月額購入のアドオンが反映されない」と言う報告をうけています。

iOSのバージョンアップが上がったからかもしれませんが、原因は不明です。

で、こちらではAppleの課金情報は匿名なので何もできず、かつAppleが提供するテスト環境での課金や復元処理は正常に完了しております。

ですので、Appleへお問い合わせの際は「開発会社からはTestFlightを経由した課金と復元のテストは正常に完了をしていると言う報告をもらいました」と添えて問い合わせしていただけるとよいと思います。

ただこちらでもしばらく課金の部分は手を付けていませんのでiOSのバージョンアップで仕様が変わったところがないかを調べてみます(ただテストが正常にできているので不具合がある可能性は低いと思われます)。

こういうトラブルがあるのでコンパクトプランや時間制限解除の提供はもうやめていく方向で検討を始めたいと思います。

よろしくお願いします。

【重要】ZOOMとの連携の正しい設定方法

ZOOMとの連携について、検索すると勘違いをされてる方が見受けられますので、とりあえず図解してみました。

複数人で使うときもAPIトークンを設定するのは1台だけです。絶対に「それぞれが設定をしないでください」です。喋るときはそれぞれが自分のUDトークを使って話します。このとき喋った端末の話者名もホストのUDトークに送られそこからZOOMに送られ表示されます。

1台だけで使うときはホストがZOOMからの音声を音声認識させます。話者名はその端末のものになるのでオフにして運用するのもいいでしょう。スピーカー越しのAさん、Bさん、Cさんの声と、ホストさんの声は肉声で認識することになります(ホストさんと他者の認識率に差はでるかもしれません)。有線でつないで認識させる方法もあります。

マニュアルも合わせて御覧ください。

https://teachme.jp/27228/manuals/8656888

なんどもいいますが、ZOOMへ字幕を出す機能は「付加的な機能」です。通常のUDトークの運用に加えてやるものなので、これによって使い方が変わることはありません。

正しく設定してご利用ください。

【重要】ZOOMへの字幕送信機能の調整

ZOOMへの字幕送信機能が大きな反響をいただいてとてもうれしく思います。

ーーー
現在Android版のver.86はリリース済み、iOS版 ver.121は現在審査中です。写真はこれからリリースするver.121のものですが、運用のコツを少しご説明します。
ーーー

使ってらっしゃる方たちのの要望や自分でも使ってみて変えたほうがいいところなど仕様を調整してみて最終的に決まりました。

■字幕のシーケンス番号をリセット

ZOOMの字幕データはミーティングの開始から0をスタートとして一つ一つの字幕に番号が振られているようです。これを0から開始しないと字幕の表示に遅れが生じたりするようです。ですので、ミーティングをスタートしたらリセットボタンを押して字幕番号を0にしてください。時々字幕がでない、表示が遅いと言う報告があるのですが、これが原因ではないかと思います。

※ただ、いまver.120ではリセットを押すと上のAPIトークンまで消えてします。これはバグでver.121では修正されていますので少々ご不便おかけします。

■APIトークンを設定する端末は1台だけ

上記の字幕のシーケンス番号の理由からも複数の端末から字幕を送ると表示がされません。仕様としてもこのAPIトークンは字幕を送信することができる情報なのでホストの方が設定をし信頼できる相手以外は外に出さないように管理をお願いします。悪意をもって行えば会議を荒らすことも可能な情報をなります。

■翻訳結果を送信する

これはver.120まではスイッチで設定できましたが、使用感をみるとトーク画面の翻訳のオンオフに連動させたほうが楽だと気づきました。ですので、ver.121からは説明文を残し設定を消しています。

ーーー
機能リリースとともに微調整が入りバージョンアップを頻繁におこなっておりますが、みなさんが使ってくれていろんなところにアップしてくれたおかげでどういうふうに実装したらいいかもわかりました。ありがとうございます。

とりあえず、ver.121をお待ち下さい。ver.120でも問題なく使用できますが、ver.121がZOOM連携の安定版となります。Android版 ver.86はこの仕様になっています。

【トピック】GAAD Japanの字幕付き配信のしくみ

5月21日(木)、GAAD JapanというGlobal Accessibility Awareness Day関連のイベントがオンラインで開催されました。UDトークは開催協力ということで字幕付きでYouTube Liveの配信を担当しました。

ご覧になった方はわかると思うのですが、YouTube Liveの画面右1/3はUDトークの字幕、左はZOOMの画面。最初から最後までこのスタイルで配信を行いました。

その仕組を少しご説明します。

まず一枚目の写真、これが配信部分です。右のWindowsのラップトップでOBSと言うソフトを動かしてYouTube Liveへ配信をしています。OBSは配信をしている方にはおなじみのソフトで音声や画像などいろんなソースのコントロールができます。当日はこれでセッションの間を画像をだしてミュートにし、次の登壇者との打ち合わせを行ったりして進めていきました。

右のMacはZOOMとUDトークを並べて表示しています。この画面をHDMIで出力し、Windowsのラップトップに接続してあるキャプチャデバイスに入力し配信をしています。MacのQuick Time PlayerというアプリがiOSの画面をキャプチャでき、さらにMacはスプリットビューという2画面フルスクリーンができます。これで調整して配置。

ZOOMはカメラをオフにしている人は出ない設定にし、通常はギャラリービュー、登壇中はスピーカービューと切り替わるようにしていました。なので基本配信中はなにも操作をすることなくいい感じの画面で遷移してました。

2枚めの写真はUDトークの方です。今回登壇者グループはZOOMでやったのでそこの音声を取り込むためにZOOMをiPadで起動し、その音声をヘッドフォン端子からiRig2を経由してもう一台のiPadに入れてます。ここで音声認識した結果を一枚目の写真のiPhoneにトークの公開で送っています。

そして最後に「タイムラグ」への対応です。YouTube Liveはだいたい20秒くらいの遅延があります。これに対応するために「20秒遅延させて配信する」アプリを開発しました(※公開予定なし、ニーズがあれば出そうかと)。こうすることによって

・YouTubeの画像にはリアルタイムで認識しているUDトーク
・YouTube Liveを見ている人の手元には配信遅延に合わせて表示されるUDトーク

と2つの時間軸で字幕を進行させることに成功しています。

ちょっと機材は多めに使ってますが、数人集まれば用意できると思いますのでぜひやってみてください。

ここまで用意するのは大変!ってかたは、画像に字幕を配信するのを諦めて、配信されているYouTubeの音声を有線でiRig2に取り込み認識させて公開するといいと思います。

何度もリハーサルと検証をしたおかげで配信は大きなトラブルもなく(あったんですが、復帰できました)終えることができました。

iOS版 ver.120にてZOOM連携で機能を追加しました

iOS版 ver.120にてZOOM連携で機能を追加しました。

・話者名を表示する
UDトークに設定している話者名を表示します。「トークを公開」で複数人で喋って使っているときに便利です。(複数人で使っていてもAPIトークンを設定する端末は1台ですので運用を間違えないようにしてください)

・翻訳結果を表示する
翻訳結果の方を字幕として出すことができます。話者名を表示して「トークの公開」と合わせて外国語を話す方と使用すると2言語で双方向に名前と翻訳結果を出すこともできます。(※超応用編です。使いこなしていただけますか?(笑))

ZOOMへの送信機能が思いのほか話題になってびっくりしております。なのでもうちょっとのんびり機能追加をしようと思ったのですがここはアクセルの踏み時と思い要望があった2つの機能を実装しました。

マニュアルも更新してあります。

https://teachme.jp/27228/manuals/8656888

お試しください!

ZOOMの字幕機能にUDトークの音声認識結果を表示できるようになりました

ZOOMの字幕機能にUDトークの音声認識結果を表示できるようになりました!

https://teachme.jp/27228/manuals/8656888

iOS版 ver.119の新機能です。みなさんお使いのオンライン通話アプリZOOMと連携して使える機能です。ZOOMの「ホスト」の方が設定することができますのでぜひお試しください。簡単にできます。

また他にもこうした通話アプリで連携できるものがあれば実装していきたいと思ってますので通話アプリを提供されてる企業の方はぜひご提案ください。

よろしくお願いします。