カテゴリー別アーカイブ: トピック

【お知らせ】無料版のアプリを一部業務でもお使いいただけます

無料版のアプリをご利用の皆様。UDトーク無料版の利用規約を改定しました。変更点は附則に記述してありますが、今回大きな点は「一般の法人などの業務で使用するのを規約上は禁止としない」ようにしたことです。
第5条(禁止事項)の④を

ーーー
④ 法人格を有する事業者がその業務のために本アプリを利用すること(ただし、事業内容・規模・形態、従業員数等から、当社が利用を認める場合を除く)
ーーー

これから

ーーー
④ 官公庁、地方自治体及び教育機関(幼稚園、小学校、中学校、高等学校、中等教育学校、特別支援学校、大学及び高等専門学校)がその業務のために本アプリを利用すること
ーーー

にしました。官公庁、地方自治体及び教育機関は規約上は法人向けプランを必須としますが、それ以外は規約では禁止をしません(そのかわりサポートはないのでお問い合わせされてもお答えすることはできません)。

無料版のアプリは音声データを収集しております。

【ヒント】喋った音声はどうなるの?

ですので、業務でお使いいただく際はコンプライアンスやプライバシーの基準をご確認ください。これは使用を推奨するものではなくおまかせをすると言ったものです。
現在UDトークは25万ダウンロードがあり、だいぶ公共性を帯びてきたアプリとなりました。規約上で一部の業務での利用を開放することでもっと広がりを見せることを期待しております。そしてデータ収集のポリシーも含めいまいろいろ出てきている実証実験をしているような音声認識アプリを使うことへの「理解」を深めていただければと思っております。

利用規約の内容をご確認ください。

UDトーク®利用規約(一般)

法人向けスタンダードプランの利用範囲を拡大、活用がしやすくなりました

法人向けスタンダードプランの利用範囲を拡大、活用がしやすくなりました。

法人向けプランのプラン内容を変更いたしました。

スタンダードプランは100人以上の事業所だと5部署での利用と定めておりましたが、特に行政機関でここ最近は窓口利用よりも内部の議事録作成でのニーズが高まってきました(神戸市、高松市、香川県など)。

そこでこの5部署を撤廃し、スタンダードプランでご契約の1拠点内であればご自由にお使いいただけるようにしました。

例えば「○○市役所」でご契約いただければ役所の敷地内ですべて活用いただけます。

また企業様に置いても同じ敷地内であれば従業員やデバイスの数によらずご利用いただけます。スタンダードプランは月額24,000円。毎日使えば一日1,000円くらいの計算です(しかも端末台数の制限なし!)。

おかげさまで現在400契約を超えるご利用団体がいらっしゃいます。現在お使いのところも5部署制限ととっぱらい更に拡張していただければよいのと、これからご利用検討されるところも更に活用のシーンを広げていただけると思います。

詳しくはホームページからお申し込み時にご確認ください。

Code for Japan Summit 2018、リアルタイム字幕付き!

9月に新潟で開催されるCode for Japan Summit 2018、こちらのすべての会場でUDトークによるリアルタイム字幕配信を行います。

https://summit2018.code4japan.org

UDトークはこのイベントにシルバーパートナーとして協賛しており、機材提供も行います。

シビックテック(Civic+Technology)という言葉がだんだん周知されてきたんでしょうか、このイベントは全国のシビックテック団体、ITで地域課題の解決に取り組んでいる団体が参加し、活動内容を報告や課題についてのディスカッションを行います。

こうした市民参加のイベントが障害者や外国人に対してユニバーサルであることはとても重要だと思います。今回、全面的にUDトークで行くと決めていいただいたCode for Japanの皆様、ありがとうございます。

また、UDトークを使用することでこのサミットのセッションの全文ログを残すことができます。それは膨大な量ですが、それを分析することで見えてくるものもありますし、オープンデータとして公開することで参加できなかった方も共有できると言うメリットもあります。
9月の連休、もしよろしければ新潟でシビックテックについて一緒に考えてみませんか?ご参加、お待ちしております。

【トピック】UDトークで動画の書き起こしをして字幕をつけてみましょう

収録済みで音声がクリアに収録されている動画であればUDトークのプレゼンテーションモードを活用して字幕データを作成することができます。

元ネタはこちら、ヒルズブレックファーストでの登壇動画です。

音声は非常によく録れています。
今回は一から音声認識させて文字起こししてみました。編集しているところも収録しました。

音声認識が完了したら内容をメールで書き出します。CSVファイルを更にチェックして完成させます。
CSV Converterを使って.sbvファイルを作成します。今回のデータは最初の字幕が動画の開始7.5秒後からだったので7500と入力して読み込ませます。

コピペして.sbvファイルを作成したらあとはYouTubeに追加です。

作成中の収録動画に今回作成した字幕を設定してありますので、御覧ください。
うまくやれば爆速でフル字幕つけれますので、ぜひ皆さんもお試しください。

そして字幕ができるってことは全文書き起こしも楽勝ってことですね!

ーーー
司会/Shamrock Records株式会社の青木秀仁さん、よろしくお願いします。ご登壇ください。

青木/皆さんおはようございます。
いつも見に来ているこのHIllsBreakfastのこの舞台に登壇するのでいささか緊張はしておりますが、短い時間ですが、よろしくお願いします。自社製品の紹介をさせてもらおうかなと思いますのでよろしくお願いします。
ただいまご紹介に上がりましたが、青木秀仁と申します。Shamrock Recordsというね。一見何やってるか分からない会社名なんですけども、アプリ開発をやってる会社です。
もともとミュージシャンでCD出したレーベルの名前をする会社名にしたのでこんな名前になっておりますが、開発者としてはですね、音声認識技術を使って、長年、開発をしておりました。声シャッターでアプリが去年ぐらいにヒットしてですね、もしこの中で知ってる方がいらっしゃったら光栄です。
と言うわけでUDトークというアプリですが、今こっちで出てる字幕。これUDトークというアプリの機能の一部で音声認識を使ってリアルタイムに声を文字化しています。それで後の方で間違ったのを編集するという形で正しい字幕を出していくというシステムになります。
UDトーク一言で言うとですね、対面でコミュニケーションするアプリです。これって一体どういうときに使うのかって、何か皆さん想像できますか?
結構これ言うと本当どう言う時に使うのというふうな疑問をもらうんですけども。
耳が不自由な方とのコミュニケーションですね。対面で音声認識とかキーボードとか筆談とかそういうものを使ってやりとりするのUDトークでできますよということです。
うん。皆さんの周りにいらっしゃったら、どういったコミュニケーションとってるのかちょっと後でお聞きしたいなと思うんですけども、実際僕もですね耳が不自由な友達ができて初めてこういうことに気がつきました。
開発のきっかけはですね、その友人に所属している市民団体で講演をしてほしいとやっぱ音声認識って耳が不自由な方とか結構注目してますので。
そこで講演をしたんですが、やっぱりなかなか通じないですね。うん。あれとかこれとか言ってもなかなか難しいし。なので、自分が話したいことを何か伝えるために作らなきゃいけないなと思いました。
何か使命感というよりはですね何か開発者の興味というか、どこまでできるんだろうというので、このUDトークというアプリを
開発に開発することになりました。
ちょっと聴覚障害についてお話をしたいなと思います。なかなか理解されにくい障害なんじゃないかなと個人的には思います。やっぱり見た目でわからないというのが大きいですね。それとあと、聞こえないという体験がなかなかしづらい。
自分の声も聞こえないわけなので、そういった中で、なかなか理解されにくいんですが、これから高齢化社会、誰もが耳が遠くなります。ここにいる方も全員例外なく目が遠くなって、自覚のない障害者になっていきます。そうなったときにですね、コミュニケーションの問題というのは必ず出てきます。
そうなったときにですね、よく障害者の人が困ってる困ってるっていうんですけども、一対一になったときって、こっちも困るんですね。話したいことが伝わらないという。
なのでコミュニケーションの問題というのは、双方向なんじゃないかと僕は考えています。
なので、UDトークというアプリはですね、聞こえる側の人をサポートするアプリ。
いわゆる障害者の周りの人をサポートするアプリという位置付けで、これを開発しております。
いい感じてますねよかったこれがだいたい出るかどうかで僕の仕事は終わるので(笑)。
UDトークですが、そう。やっぱり始めにどういうコミュニケーションをとっていいかということを話し合う前のステップ、そこのハードルをこれを使うと一気に下げることができると思います筆談がいいのか手話がいいのか、それとも講話がいいのか、それをまず話すためのステップとしてUDトークを使うといいかなと思います。
UDトークですが、各ストアから、ダウンロードができます。もう2年ぐらい前になりますね最初のリリースしたのは、そんな試行錯誤を繰り返して今のものになっております。
これ全部無料でダウンロードできますので、今スマートフォンとかお持ちの方すぐ使うことができます。じゃあ一体どこでビジネスするのかというと法人向けプランというのを用意して一般企業の会議の導入とか、教育機関への難聴学生のサポートなんかでお使いいただいてます。
何社か契約も取れてますので、これからどんどん広がっていけばいいかなと。
実は営業なんですけども、Shamrock Recordsは私1人だけなので、開発部しかない感じです。なのでこちらからちょっと営業している余裕がないので、口コミとか問い合わせベースで全て対応しております。
やっぱり先方さんに意識がないとなかなかこういうので導入しても使えないかなと。
ただそれだけではなくてですね、展示会で紹介したりとか、あとは各地で講演会とか説明会を開いて、当事者と支援者の方に対してこういうのがあるという紹介をさせてもらってます。
一般企業さんに行ったときにですね、いろいろ説明をするんですが、なかなか聴覚障害者のためにって言ってもピンとこない方も、残念ながらいらっしゃいますのでUDトークを使うことで生まれる新たな価値というのをですね、こちらから提案させてもらってます。
例えば議事録取れますよね。会議の。後から修正もしているので正しいものができますと、あとは会議の見える化に繋がって効率アップでもっと言うと、これからの会議のスタイルはこうだみたいなちょっとおしゃれな感じを出してあげれば、こういうの普及に繋がるんじゃないかなと思ってます。
なので、こういうのが普及してくると、結果的に聴覚障害持った方が社会参加しやすくなるのかなと思います。やってることが正しいのは当たり前なので、それを押し付けてもやっぱりなかなか人というのはおれないと。
結果的に参加しやすくなれば僕はいいんじゃないかなと思ってきます。と言うわけで、駆け足でしたが、紹介をさせていただきました。ホームページとかFacebookページで結構活動内容を随時報告してますので、興味のある方は見ていただけると。
また何かこの話を聞いてそういうこともあるんだなってことにちょっと気が気づきが得られた方はですね、後でお話をさせていただきたいと思います。どうもありがとうございます。

司会/ありがとうございます。
ちょっと皆さんを代表してご質問させていただきたいと思うんですけども。すごいですよね。みんなすごーいって言ってぼーっと見てたんですけど(笑)。
素晴らしい理念とサービスだと思いました。で、せっかくなのでいろんなたくさんの方が来てましたけどなんかこういうとこでもしいろんなサポートとか、力をかりたりだとか
あったりしますか?。

青木/えとですね、実はこのHIllsBreakfastでもう1年近くになるんですけども、裏で僕ずっと音声認識のこれを動かして試験運用したんですね。はい。
やっぱり音声認識のこういう精度を上げていくには実際に喋った音声が必要なので本当実験の場ということで提供させていただいてるのは本当にありがたいことです。この後はもしできたら実用フェーズみたいな感じで。
やっぱこういうトークイベントを字幕にできるといいかなと思うんですね。それがそういう人たちが来るからではなくて、表現する人がこういうのを使って知ってもらいたいっていうふうな動機でなんかこういうのを使っていくような文化が出来上がるといいかなと思ってます。

司会/ありがとうございました。

iOS版 ver.78 プレゼンテーションモードを追加

【追記】不具合修正版はすでにver.79としてリリースされております!

ーーー
iOS版 ver.78をリリースしました。iPadのみの機能となりますがプレゼンテーションモードを追加しました。

プレゼンテーションモードボタンをタップすると左側に各種ファイルを表示することができます。ウェブページやフォトライブラリから写真や動画も表示できます。
使い方としては、プロジェクタが1台しかないときに字幕と資料を一緒に出しながら発表をしたりとか、手元のiPadに会議の資料や教科書を表示しながら進めていくとか、使い方の可能性はかなり広がります。

それで、すみません、ver.78ですがプレゼンテーションモードで少しバグがあります。

・プレゼンテーションモードのままQRコードを表示すると画面のレイアウトがおかしくなる。
→画面を回転させれば復帰します。
・動画や音声を再生してたとき、止めないでトークを終了すると再生し続ける。
→止めてからトークを終了するか、アプリを終了させてください。
・iCloud Driveからファイルが読めないケースがあります。
→次バージョンで対応します。

現在すでにver.79を申請済みなので1〜2日でお届けできます。
それまでお待ちいただくか、とりあえずちょっと動作がおかしくても(実用にはほぼ影響はないです)先に使ってみたいかたはアップデートお願いします。

【トピック】UDトークは誰が話したか判別できますか?

UDトークの議事録での活用で一番多い質問が「誰が話したか判別できますか?」です。答えは「その機能はありません」です。「できません」ではないのです。すでに声紋認証などの技術で「事前登録をしておけば」誰が喋ったかは分かったり、一定時間音声が溜まると「Aさん(仮定)である」などの推測をすることができます。でもそれはUDトークには採用をしていません。いろいろな理由があります。例えばスマートフォン1つをみんなで回しながら使ったり、多くの割合で初めてしかも一瞬使うケースが多いことから事前登録は難しい。推測もある程度蓄積されるまでは不確かなケースが多いなどもありますが、そもそもUDトークの目的からすると「その機能いらない」という判断をしています。

簡単なことです、名前を登録しておいて話す前に「名乗ればいい」これだけのことです。さらに基本的な使い方「話に割り込まない、遮らない」を守れば誰が喋ったかは明確に記録できます。

多くのこの質問をされる方は使用目的を間違っています。「自由勝手に適当に喋っているものを文字化」するのがUDトークではありません。仮にできたとしてもその記録はあまり価値がないでしょう。会議自体やらないほうがいいくらい生産性は低いのです。
目的は「記録を作成する」ことであり「情報共有の補助」になります。そもそもUDトークを使わなくてもちゃんと共有ができて記録が作成しやすい会議をちゃんとしたルールで開くことが大事です。そのうえでUDトークを使えば終わった瞬間にほぼほぼの議事録が出来上がっています。

実はこれが障害者の方が会議に参加することで必然的に採用されることになります。視覚障害者の方が参加される会議では名乗ることは必須です。じゃないとびっくりしてしまいます。聴覚障害者の方が参加される場合は音声言語特有の言いっ放しでは通用しません。ちゃんと理論立てて話す必要があります。

そのうち周りの人が気がつくわけです。「なぜか障害者の方が参加している会議は毎回きれいな議事録が残っている」と。実はUDトークはそこから周りの健常者の方たちが「こう使えば議事録が取れる」と言うヒントを得て使い始めております。

・名乗ってから話す
・話し終わったら「以上です」など
・話に割り込まない

これで会議を進めればUDトークできれいに議事録が取れます。誰が喋ったかなんてことは音声から読み取る必要もないのです。
ちなみにそれぞれがスマホを持って話した場合はちゃんとそのUDトークに設定した「名前」で話者名が振られます。UDトークのトップ画面から設定へ行くと名前が設定できますのでぜひご自身のお名前を設定してみてください。

ですが、ちゃんと仕様的に良さそうなものを思いついたら話者の推定機能は実装すると思いますので。

iOS版 ver.77、Android版 ver.59をリリースしました

iOS版 ver.77、Android版 ver.59をリリースしました。

ひとつ大きな仕様変更があります。トークの公開参加でグループになっているとき、いままでは全員同時にタップして話すを押して話すことができましたが、止め忘れも多く自動的に次の人が話すタイミングで他の端末の音声認識が止まったほうが良いのでは、と言う提案をいただいていました。

今回のバージョンからグループの中で1台のみ発話ができるように縛りをいれることにしました。ただし、QRコードを作成した端末はいつでも話すことができます。

QRコードを公開後にも「同時発言を許可する」をONにすることで従来どおりの運用ができます。まずはこの方法の方がグループで使用するときにうまく使えるのかを試してみたいと思います。

ぜひバージョンアップをしてグループでお試しください。

CSV Converterをリリースしました。

UDトークの会話ログ(.csv)を読み込ませてFacebook動画の字幕ファイル(.srt)とYouTubeの字幕ファイル(.sbv)のデータを作成するプログラムを簡単ではありますが作成してみました。

開始時間が00:00:00.000で作成されるので、動画の開始から最初の字幕までの間隔を入力して作成します。マイナスの値も入力可能です。
こちらGithubにてオープンソースで提供いたしますのでご自由にお使いください。

https://shamrockrecords.github.io/CSVConverter/

リポジトリはこちら
https://github.com/ShamrockRecords/CSVConverter

【トピック】UDトークの正しい使い方、とは?

良くある問い合わせの一つに「UDトークの使い方を教えてください」と言うのがあります。おそらくそれは「正しい使い方」と言うのも含まれると思います。

もし問い合わせをされてきた方が聴覚障害者だった場合「このアプリを使うのはご自身ではなく周りの人です。それが正しい使い方です」とお答えします。そしてそれはまったくピンと来ていないようです。

法人向けプラン契約者に対する内部の講習会でも「このアプリは相手に伝えることができない話し手のスキル不足を補うもの」と言う話をします。聞き手がUDトークを使って工夫することについては一切触れません。それは講習会としては正しい使い方ではないからです。

いまだに多いのが「手元でUDトークを使っても認識しない」とか「電車の中で使ってもアナウンスが文字化されない」など自分が使ってしまって評価を下げているケースです。

UDトークを使うのは「話し手」です。環境を用意するのも単語を登録するのも「話し手」です。どうしてもそれを「聞き手」に頑張らせてしまう傾向が、特に教育機関で見受けられます。

教育機関での運用は思うところがあるのであえて書かせていただきます。

大学から講習会の依頼が来た時、対象は学生ではなく教職員と伝えます。UDトークを使用するのは学生ではなく教職員だからです。最初はなんで?と理由が分からない人たちも、講習会が終わったあとにはちゃんとその意図がわかっていただけます。「話し手」である先生が使うものなのです。しかし大学によってはちゃんとした運用がされておらず、学生さんが自分で授業の単語登録を行ったり、自分でセッティングしたり、よく分かってないところだとアカウントだけ渡して手元でUDトークを使ってしまい結局授業内容が分からないで終わってしまいます。もちろん学生さんの学内の活動でも使用できますのでアカウントを渡すのはOKですが、それはあくまでサークル活動とかそういったところで使い方になります。

そういう間違った運用をしている大学は講習会を企画されなかったりと言う状況です。

UDトークは話し手が使うものです。ですので、運用は教職員が行います。授業の準備をするのと同じようにUDトークの準備もして授業に臨みます。学生さんは授業に来たらUDトークのQRコードをもらって好きなところでみる。もちろんいくつかの大学はこういう運用をしています。

ですので、もしこの投稿を見て心当たりがある大学や間違った方法でUDトークを使っている学生さんがいたら一度内部でしっかりと「正しい運用」について話し合ってみてください。

UDトークは教育の分野においては既存の支援方法をサポートする大きな武器となります。またサポートする人員の割当が難しいときの手段として有効です。でもそれはすべて正しい使い方をしてのみです。企業での運用は正しい運用はそのまま結果につながるので教育機関よりはちゃんと試行錯誤をしているように思えます。

UDトークとしましても教育の分野は重要と考え、教育機関向けプランと言う導入しやすいプラン(月額16,000円使い放題)も用意し、導入後には積極的に講習会も行っております。

まずはちゃんとした運用をするとその先にいろんな可能性が見えてくるのがUDトークだと自負しております。

【運用レポート】東京国立博物館様

なんだろうこのアイコン?と思う方もいらっしゃるかなと(笑)。こうしてUDトークのアイコンが付いていると知ってる方は「あ、リアルタイム字幕付きね!」と言うくらいまで知名度は上がってほしい、ですね(笑)

さて、一昨年から正式に導入してる東京国立博物館。試験的に何度かやったのち、最近はイベントに普通に使用されるようになってきたみたいです。

おそらくこれからどんどん美術館、博物館の情報アクセシビリティは進むと思います。東京国立博物館はぶっちぎりNo.1ということで(UDトークに関してですが)。

アプリを持っていれば誰でも手元で見れると思いますので、ぜひご訪問の際はアイコンで問い合わせてみてください。

将来的に誰もがこのアイコンをみたら「あ、多言語字幕付きね」とわかってくれるくらいシェアが広がってほしいなと期待しております!