カテゴリー別アーカイブ: トピック

【重要】ZOOMとの連携の正しい設定方法

ZOOMとの連携について、検索すると勘違いをされてる方が見受けられますので、とりあえず図解してみました。

複数人で使うときもAPIトークンを設定するのは1台だけです。絶対に「それぞれが設定をしないでください」です。喋るときはそれぞれが自分のUDトークを使って話します。このとき喋った端末の話者名もホストのUDトークに送られそこからZOOMに送られ表示されます。

1台だけで使うときはホストがZOOMからの音声を音声認識させます。話者名はその端末のものになるのでオフにして運用するのもいいでしょう。スピーカー越しのAさん、Bさん、Cさんの声と、ホストさんの声は肉声で認識することになります(ホストさんと他者の認識率に差はでるかもしれません)。有線でつないで認識させる方法もあります。

マニュアルも合わせて御覧ください。

https://teachme.jp/27228/manuals/8656888

なんどもいいますが、ZOOMへ字幕を出す機能は「付加的な機能」です。通常のUDトークの運用に加えてやるものなので、これによって使い方が変わることはありません。

正しく設定してご利用ください。

【重要】ZOOMへの字幕送信機能の調整

ZOOMへの字幕送信機能が大きな反響をいただいてとてもうれしく思います。

ーーー
現在Android版のver.86はリリース済み、iOS版 ver.121は現在審査中です。写真はこれからリリースするver.121のものですが、運用のコツを少しご説明します。
ーーー

使ってらっしゃる方たちのの要望や自分でも使ってみて変えたほうがいいところなど仕様を調整してみて最終的に決まりました。

■字幕のシーケンス番号をリセット

ZOOMの字幕データはミーティングの開始から0をスタートとして一つ一つの字幕に番号が振られているようです。これを0から開始しないと字幕の表示に遅れが生じたりするようです。ですので、ミーティングをスタートしたらリセットボタンを押して字幕番号を0にしてください。時々字幕がでない、表示が遅いと言う報告があるのですが、これが原因ではないかと思います。

※ただ、いまver.120ではリセットを押すと上のAPIトークンまで消えてします。これはバグでver.121では修正されていますので少々ご不便おかけします。

■APIトークンを設定する端末は1台だけ

上記の字幕のシーケンス番号の理由からも複数の端末から字幕を送ると表示がされません。仕様としてもこのAPIトークンは字幕を送信することができる情報なのでホストの方が設定をし信頼できる相手以外は外に出さないように管理をお願いします。悪意をもって行えば会議を荒らすことも可能な情報をなります。

■翻訳結果を送信する

これはver.120まではスイッチで設定できましたが、使用感をみるとトーク画面の翻訳のオンオフに連動させたほうが楽だと気づきました。ですので、ver.121からは説明文を残し設定を消しています。

ーーー
機能リリースとともに微調整が入りバージョンアップを頻繁におこなっておりますが、みなさんが使ってくれていろんなところにアップしてくれたおかげでどういうふうに実装したらいいかもわかりました。ありがとうございます。

とりあえず、ver.121をお待ち下さい。ver.120でも問題なく使用できますが、ver.121がZOOM連携の安定版となります。Android版 ver.86はこの仕様になっています。

【トピック】GAAD Japanの字幕付き配信のしくみ

5月21日(木)、GAAD JapanというGlobal Accessibility Awareness Day関連のイベントがオンラインで開催されました。UDトークは開催協力ということで字幕付きでYouTube Liveの配信を担当しました。

ご覧になった方はわかると思うのですが、YouTube Liveの画面右1/3はUDトークの字幕、左はZOOMの画面。最初から最後までこのスタイルで配信を行いました。

その仕組を少しご説明します。

まず一枚目の写真、これが配信部分です。右のWindowsのラップトップでOBSと言うソフトを動かしてYouTube Liveへ配信をしています。OBSは配信をしている方にはおなじみのソフトで音声や画像などいろんなソースのコントロールができます。当日はこれでセッションの間を画像をだしてミュートにし、次の登壇者との打ち合わせを行ったりして進めていきました。

右のMacはZOOMとUDトークを並べて表示しています。この画面をHDMIで出力し、Windowsのラップトップに接続してあるキャプチャデバイスに入力し配信をしています。MacのQuick Time PlayerというアプリがiOSの画面をキャプチャでき、さらにMacはスプリットビューという2画面フルスクリーンができます。これで調整して配置。

ZOOMはカメラをオフにしている人は出ない設定にし、通常はギャラリービュー、登壇中はスピーカービューと切り替わるようにしていました。なので基本配信中はなにも操作をすることなくいい感じの画面で遷移してました。

2枚めの写真はUDトークの方です。今回登壇者グループはZOOMでやったのでそこの音声を取り込むためにZOOMをiPadで起動し、その音声をヘッドフォン端子からiRig2を経由してもう一台のiPadに入れてます。ここで音声認識した結果を一枚目の写真のiPhoneにトークの公開で送っています。

そして最後に「タイムラグ」への対応です。YouTube Liveはだいたい20秒くらいの遅延があります。これに対応するために「20秒遅延させて配信する」アプリを開発しました(※公開予定なし、ニーズがあれば出そうかと)。こうすることによって

・YouTubeの画像にはリアルタイムで認識しているUDトーク
・YouTube Liveを見ている人の手元には配信遅延に合わせて表示されるUDトーク

と2つの時間軸で字幕を進行させることに成功しています。

ちょっと機材は多めに使ってますが、数人集まれば用意できると思いますのでぜひやってみてください。

ここまで用意するのは大変!ってかたは、画像に字幕を配信するのを諦めて、配信されているYouTubeの音声を有線でiRig2に取り込み認識させて公開するといいと思います。

何度もリハーサルと検証をしたおかげで配信は大きなトラブルもなく(あったんですが、復帰できました)終えることができました。

iOS版 ver.120にてZOOM連携で機能を追加しました

iOS版 ver.120にてZOOM連携で機能を追加しました。

・話者名を表示する
UDトークに設定している話者名を表示します。「トークを公開」で複数人で喋って使っているときに便利です。(複数人で使っていてもAPIトークンを設定する端末は1台ですので運用を間違えないようにしてください)

・翻訳結果を表示する
翻訳結果の方を字幕として出すことができます。話者名を表示して「トークの公開」と合わせて外国語を話す方と使用すると2言語で双方向に名前と翻訳結果を出すこともできます。(※超応用編です。使いこなしていただけますか?(笑))

ZOOMへの送信機能が思いのほか話題になってびっくりしております。なのでもうちょっとのんびり機能追加をしようと思ったのですがここはアクセルの踏み時と思い要望があった2つの機能を実装しました。

マニュアルも更新してあります。

https://teachme.jp/27228/manuals/8656888

お試しください!

ZOOMの字幕機能にUDトークの音声認識結果を表示できるようになりました

ZOOMの字幕機能にUDトークの音声認識結果を表示できるようになりました!

https://teachme.jp/27228/manuals/8656888

iOS版 ver.119の新機能です。みなさんお使いのオンライン通話アプリZOOMと連携して使える機能です。ZOOMの「ホスト」の方が設定することができますのでぜひお試しください。簡単にできます。

また他にもこうした通話アプリで連携できるものがあれば実装していきたいと思ってますので通話アプリを提供されてる企業の方はぜひご提案ください。

よろしくお願いします。

【トピック】UDトークは無料アプリなので企業や教育機関でも使うことができます

「無料のUDトークって仕事で使えるの?」とたまに問い合わせがあるのですが、「使うことができます」。有料のプランがあるので「違いは?」と聞かれますが、音声データの収集ポリシーが違うだけで機能は同じです。

皆さんに協力していただき認識率は驚くほどに向上しております。

利用規約に書いてありますが

・一般の企業や団体いわゆる「法人」→無料アプリをお使いいただけます

・官公庁、地方自治体及び教育機関→「アプリ導入プログラム」を申し込んでいただければ無料でお使いいただけます

すべての団体にたいして音声の収集を行わない有料の「法人向けプラン」はお申し込みいただければご利用いただけます

法人向けプラン
https://udtalk.jp/price/

アプリ導入プログラム
https://udtalk.jp/requesting-from-organization/

オンラインミーティングやセミナーでのリアルタイム字幕や全文文字のアーカイブなどいろんな活用方法が日々入ってきております。

ぜひお気軽にご利用ください。

【トピック】教育機関での使い方の実例

一つ前の投稿の反響が大きかったので、具体的な運用方法を図解してみました。
「パターン1」は先生がUDトークを運用するケースです。「パターン2」は学生側(支援者側)で運用するケースです。

パターン1が推奨ではありますが、先生がきちんと単語登録をしたり、卓上マイクではなくヘッドフォンマイク等で授業を行って(あときちんと話す)いただければパターン2でもいい結果が得られます。(パターン1でもちゃんと話すことは大前提なのですが)

つまり「先生側でやることが多い」のか「学生側でやることが多いのか」になります。そしてどちらの運用をしても字幕は授業を受けている全生徒に配信することができます。パターン1でやっているときはたとえオンライン授業に通信上のトラブルがあってもUDトークは字幕を配信できるのでいいことも多いです。実際におおくのオンラインカンファレンスで「音声がとぎれてもUDトークが動いててよかった」という声は多いです。

そしてこれがやることが多いのか?と言われると、これをすべて手書きとかタイピングでやろうと思ったら不可能だしもっとやることは多いでしょう。これくらいの準備でよい、と考えていただければいいかなと思います。それにこれをやることで授業の全文ログも先生側で保存ができます。それをきれいに修正して配布してもいいわけです。

ぜひ参考にしてみてください。

【トピック】教育機関での使い方、あってますか?

最近、教育機関(特に大学関係)で問い合わせが多いのですが、

「聴覚障害がある学生がオンラインで授業を視聴するために対象学生に配布をしたい」

と言われます。ですが、これは学校が導入して使う使い方としては「間違っています」。オンラインで配信されてるものを自分のスマホを使ってそこで音声認識して字幕で見るだけなら、それは学校がサポートをしているとはいいません。別に学生さんはUDトークだろうがGoogleのアプリだろうが別になんでもいいのです。

学校が導入してサポートをすると言うことはどういうことか?と言うと「先生が使う」ということです。先生がきちんと単語登録をしてUDトークを手元でつかい、QRコードを発行して学生さんに案内をします。学生さんはオンラインの授業を見ながらスマホのUDトークで字幕を見ます。支援室の人たちはオンラインの授業を見ながら誤認識の編集をしましょう。

これが正しい使い方です。

可能かどうかで言うとすでに都知事の会見でその方法で行っています。音声認識は先生もしくは配信を見ている支援室の誰かが行えばいいです。なので支援室が運用をすることでもきちんと学生さんに字幕を配信することができます。

以前からUDトークを学生に渡して導入した気になってるところが多いのですが、こちらは「それは違う」と指摘をしています。

オンライン授業の字幕は聴こえない学生のためでしょうか?先生の方でUDトークを使って字幕配信をしていればネットが不安定で音声が途切れたり、音が大きく出せない環境などでも見ることができます。

聴覚障害がある学生のためにだけ、と考える必要はまったくなく、アクセシビリティとして教育機関の方たちには取り組んでいきたいです。特に「アプリ導入プログラム」を申し込んでくるからにはこちらもきちんと使ってもらえるところにのみ適用をしていく所存です。

今一度、UDトークを導入されている教育機関の方は使い方を振り返ってみてください。導入担当の方は「もし自分が耳が聞こえなかったら、このオンライン授業は受講できるだろうか」と想像をしてみてください。

【シェア希望】「UDトークでリアルタイム字幕配信」オンライン無料レッスン:受付開始

(2020.4.29 追記)オンライン無料レッスンは無料版をお使いの方でも受講できます。法人向けプランは必須ではありません。

官公庁、地方自治体及び教育機関につきましては「法人向けプラン(教育機関向けプラン)、またはアプリ導入プログラム」のご利用が必須となりますので、お申込み時に確認をいたします。


現在行われている東京都知事のYouTubeでの会見にUDトークで字幕対応が行われているのをうけ、この方法を中心にUDトークでリアルタイム字幕をつける方法の無料セミナーを4〜6月の間に開催します。

対象は「聴覚障がい者への文字支援に関わっている方」となりますので、聴覚障害がある方向けではありません、ご承知ください(※聴覚障害がある方で受講されたい方はNerima Baseで開催する方にご参加ください)。

要約筆記サークルなどの支援団体だけではなく、地域団体や動画にリアルタイム字幕配信をして活動をしたい団体なんかも募集しております。

講師は現役の聴覚障害者への文字支援をされている方たちです。

まずはお問い合わせください。みなさんの受講、お待ちしております!

お問い合わせはこちら
https://info.roisinc.net/support/lecture/

【シェア希望】都知事の会見、字幕対応の仕組み

本日の都知事の会見もUDトークでリアルタイム多言語字幕配信が行われます。

仕組みですが、音声認識も誤認識の編集もすべて遠隔で、運用はNPO法人メディアアクセスサポートセンターさんのスタッフ3人ほどで東京以外の各地でも行っています。大掛かりな設備や訓練を詰んだスタッフの必要がありません。

ただし緊急時なので東京都の公式ですがすべて無償ボランティアで行っております。

この方法はべつに東京都だけではなく全国の会見で行っていただくことができます。各地の会見も地域団体等で聴こえない方や外国人の方へこの方法で支援をすることができると思います(すでに行っているという報告も受けてます)。

各自治体に提案をしても良いでしょう。そしてこうした行政の放送に関しては実は勝手にやっても著作権上は問題がありません。公式としたほうが多くの方には広まると思います(今回の公式はこれが目的)。

1.非公式で始める
2.動画配信責任者に見て貰う
3.公式になる

というステップもありです(緊急時なので東京都がこれでした)。

これと同じ方法でテレビの字幕も配信することができます。画面に入ってるほうがいいときもありますが、字幕で映像が見えないときなどもあり、セカンドスクリーンで見るときがいい場合もあります。「選択肢」は多いほうがいいです。

YouTubeからの配信音声でもきちんと音を取れば認識率はかなりでます。タイムラグもありません。

メディアアクセスサポートセンターさんから東京都への提案資料を頂きましたので添付します。これを各地の自治体へ提案資料として持っていっていただければよいかと。

本日の配信はこちらです。

https://tokyodouga.jp/MaD4vf2ppIo.html

UDトークでの閲覧方法はこちら

https://www.npo-masc.org/tokyo

(UDトークを起動するリンクを追記したのでQRコードをキャプチャしなくても字幕を見ることができます)