カテゴリー別アーカイブ: トピック

法人向けスタンダードプランの利用範囲を拡大、活用がしやすくなりました

法人向けスタンダードプランの利用範囲を拡大、活用がしやすくなりました。

法人向けプランのプラン内容を変更いたしました。

スタンダードプランは100人以上の事業所だと5部署での利用と定めておりましたが、特に行政機関でここ最近は窓口利用よりも内部の議事録作成でのニーズが高まってきました(神戸市、高松市、香川県など)。

そこでこの5部署を撤廃し、スタンダードプランでご契約の1拠点内であればご自由にお使いいただけるようにしました。

例えば「○○市役所」でご契約いただければ役所の敷地内ですべて活用いただけます。

また企業様に置いても同じ敷地内であれば従業員やデバイスの数によらずご利用いただけます。スタンダードプランは月額24,000円。毎日使えば一日1,000円くらいの計算です(しかも端末台数の制限なし!)。

おかげさまで現在400契約を超えるご利用団体がいらっしゃいます。現在お使いのところも5部署制限ととっぱらい更に拡張していただければよいのと、これからご利用検討されるところも更に活用のシーンを広げていただけると思います。

詳しくはホームページからお申し込み時にご確認ください。

Code for Japan Summit 2018、リアルタイム字幕付き!

9月に新潟で開催されるCode for Japan Summit 2018、こちらのすべての会場でUDトークによるリアルタイム字幕配信を行います。

https://summit2018.code4japan.org

UDトークはこのイベントにシルバーパートナーとして協賛しており、機材提供も行います。

シビックテック(Civic+Technology)という言葉がだんだん周知されてきたんでしょうか、このイベントは全国のシビックテック団体、ITで地域課題の解決に取り組んでいる団体が参加し、活動内容を報告や課題についてのディスカッションを行います。

こうした市民参加のイベントが障害者や外国人に対してユニバーサルであることはとても重要だと思います。今回、全面的にUDトークで行くと決めていいただいたCode for Japanの皆様、ありがとうございます。

また、UDトークを使用することでこのサミットのセッションの全文ログを残すことができます。それは膨大な量ですが、それを分析することで見えてくるものもありますし、オープンデータとして公開することで参加できなかった方も共有できると言うメリットもあります。
9月の連休、もしよろしければ新潟でシビックテックについて一緒に考えてみませんか?ご参加、お待ちしております。

【トピック】UDトークで動画の書き起こしをして字幕をつけてみましょう

収録済みで音声がクリアに収録されている動画であればUDトークのプレゼンテーションモードを活用して字幕データを作成することができます。

元ネタはこちら、ヒルズブレックファーストでの登壇動画です。

音声は非常によく録れています。
今回は一から音声認識させて文字起こししてみました。編集しているところも収録しました。

音声認識が完了したら内容をメールで書き出します。CSVファイルを更にチェックして完成させます。
CSV Converterを使って.sbvファイルを作成します。今回のデータは最初の字幕が動画の開始7.5秒後からだったので7500と入力して読み込ませます。

コピペして.sbvファイルを作成したらあとはYouTubeに追加です。

作成中の収録動画に今回作成した字幕を設定してありますので、御覧ください。
うまくやれば爆速でフル字幕つけれますので、ぜひ皆さんもお試しください。

そして字幕ができるってことは全文書き起こしも楽勝ってことですね!

ーーー
司会/Shamrock Records株式会社の青木秀仁さん、よろしくお願いします。ご登壇ください。

青木/皆さんおはようございます。
いつも見に来ているこのHIllsBreakfastのこの舞台に登壇するのでいささか緊張はしておりますが、短い時間ですが、よろしくお願いします。自社製品の紹介をさせてもらおうかなと思いますのでよろしくお願いします。
ただいまご紹介に上がりましたが、青木秀仁と申します。Shamrock Recordsというね。一見何やってるか分からない会社名なんですけども、アプリ開発をやってる会社です。
もともとミュージシャンでCD出したレーベルの名前をする会社名にしたのでこんな名前になっておりますが、開発者としてはですね、音声認識技術を使って、長年、開発をしておりました。声シャッターでアプリが去年ぐらいにヒットしてですね、もしこの中で知ってる方がいらっしゃったら光栄です。
と言うわけでUDトークというアプリですが、今こっちで出てる字幕。これUDトークというアプリの機能の一部で音声認識を使ってリアルタイムに声を文字化しています。それで後の方で間違ったのを編集するという形で正しい字幕を出していくというシステムになります。
UDトーク一言で言うとですね、対面でコミュニケーションするアプリです。これって一体どういうときに使うのかって、何か皆さん想像できますか?
結構これ言うと本当どう言う時に使うのというふうな疑問をもらうんですけども。
耳が不自由な方とのコミュニケーションですね。対面で音声認識とかキーボードとか筆談とかそういうものを使ってやりとりするのUDトークでできますよということです。
うん。皆さんの周りにいらっしゃったら、どういったコミュニケーションとってるのかちょっと後でお聞きしたいなと思うんですけども、実際僕もですね耳が不自由な友達ができて初めてこういうことに気がつきました。
開発のきっかけはですね、その友人に所属している市民団体で講演をしてほしいとやっぱ音声認識って耳が不自由な方とか結構注目してますので。
そこで講演をしたんですが、やっぱりなかなか通じないですね。うん。あれとかこれとか言ってもなかなか難しいし。なので、自分が話したいことを何か伝えるために作らなきゃいけないなと思いました。
何か使命感というよりはですね何か開発者の興味というか、どこまでできるんだろうというので、このUDトークというアプリを
開発に開発することになりました。
ちょっと聴覚障害についてお話をしたいなと思います。なかなか理解されにくい障害なんじゃないかなと個人的には思います。やっぱり見た目でわからないというのが大きいですね。それとあと、聞こえないという体験がなかなかしづらい。
自分の声も聞こえないわけなので、そういった中で、なかなか理解されにくいんですが、これから高齢化社会、誰もが耳が遠くなります。ここにいる方も全員例外なく目が遠くなって、自覚のない障害者になっていきます。そうなったときにですね、コミュニケーションの問題というのは必ず出てきます。
そうなったときにですね、よく障害者の人が困ってる困ってるっていうんですけども、一対一になったときって、こっちも困るんですね。話したいことが伝わらないという。
なのでコミュニケーションの問題というのは、双方向なんじゃないかと僕は考えています。
なので、UDトークというアプリはですね、聞こえる側の人をサポートするアプリ。
いわゆる障害者の周りの人をサポートするアプリという位置付けで、これを開発しております。
いい感じてますねよかったこれがだいたい出るかどうかで僕の仕事は終わるので(笑)。
UDトークですが、そう。やっぱり始めにどういうコミュニケーションをとっていいかということを話し合う前のステップ、そこのハードルをこれを使うと一気に下げることができると思います筆談がいいのか手話がいいのか、それとも講話がいいのか、それをまず話すためのステップとしてUDトークを使うといいかなと思います。
UDトークですが、各ストアから、ダウンロードができます。もう2年ぐらい前になりますね最初のリリースしたのは、そんな試行錯誤を繰り返して今のものになっております。
これ全部無料でダウンロードできますので、今スマートフォンとかお持ちの方すぐ使うことができます。じゃあ一体どこでビジネスするのかというと法人向けプランというのを用意して一般企業の会議の導入とか、教育機関への難聴学生のサポートなんかでお使いいただいてます。
何社か契約も取れてますので、これからどんどん広がっていけばいいかなと。
実は営業なんですけども、Shamrock Recordsは私1人だけなので、開発部しかない感じです。なのでこちらからちょっと営業している余裕がないので、口コミとか問い合わせベースで全て対応しております。
やっぱり先方さんに意識がないとなかなかこういうので導入しても使えないかなと。
ただそれだけではなくてですね、展示会で紹介したりとか、あとは各地で講演会とか説明会を開いて、当事者と支援者の方に対してこういうのがあるという紹介をさせてもらってます。
一般企業さんに行ったときにですね、いろいろ説明をするんですが、なかなか聴覚障害者のためにって言ってもピンとこない方も、残念ながらいらっしゃいますのでUDトークを使うことで生まれる新たな価値というのをですね、こちらから提案させてもらってます。
例えば議事録取れますよね。会議の。後から修正もしているので正しいものができますと、あとは会議の見える化に繋がって効率アップでもっと言うと、これからの会議のスタイルはこうだみたいなちょっとおしゃれな感じを出してあげれば、こういうの普及に繋がるんじゃないかなと思ってます。
なので、こういうのが普及してくると、結果的に聴覚障害持った方が社会参加しやすくなるのかなと思います。やってることが正しいのは当たり前なので、それを押し付けてもやっぱりなかなか人というのはおれないと。
結果的に参加しやすくなれば僕はいいんじゃないかなと思ってきます。と言うわけで、駆け足でしたが、紹介をさせていただきました。ホームページとかFacebookページで結構活動内容を随時報告してますので、興味のある方は見ていただけると。
また何かこの話を聞いてそういうこともあるんだなってことにちょっと気が気づきが得られた方はですね、後でお話をさせていただきたいと思います。どうもありがとうございます。

司会/ありがとうございます。
ちょっと皆さんを代表してご質問させていただきたいと思うんですけども。すごいですよね。みんなすごーいって言ってぼーっと見てたんですけど(笑)。
素晴らしい理念とサービスだと思いました。で、せっかくなのでいろんなたくさんの方が来てましたけどなんかこういうとこでもしいろんなサポートとか、力をかりたりだとか
あったりしますか?。

青木/えとですね、実はこのHIllsBreakfastでもう1年近くになるんですけども、裏で僕ずっと音声認識のこれを動かして試験運用したんですね。はい。
やっぱり音声認識のこういう精度を上げていくには実際に喋った音声が必要なので本当実験の場ということで提供させていただいてるのは本当にありがたいことです。この後はもしできたら実用フェーズみたいな感じで。
やっぱこういうトークイベントを字幕にできるといいかなと思うんですね。それがそういう人たちが来るからではなくて、表現する人がこういうのを使って知ってもらいたいっていうふうな動機でなんかこういうのを使っていくような文化が出来上がるといいかなと思ってます。

司会/ありがとうございました。

iOS版 ver.78 プレゼンテーションモードを追加

【追記】不具合修正版はすでにver.79としてリリースされております!

ーーー
iOS版 ver.78をリリースしました。iPadのみの機能となりますがプレゼンテーションモードを追加しました。

プレゼンテーションモードボタンをタップすると左側に各種ファイルを表示することができます。ウェブページやフォトライブラリから写真や動画も表示できます。
使い方としては、プロジェクタが1台しかないときに字幕と資料を一緒に出しながら発表をしたりとか、手元のiPadに会議の資料や教科書を表示しながら進めていくとか、使い方の可能性はかなり広がります。

それで、すみません、ver.78ですがプレゼンテーションモードで少しバグがあります。

・プレゼンテーションモードのままQRコードを表示すると画面のレイアウトがおかしくなる。
→画面を回転させれば復帰します。
・動画や音声を再生してたとき、止めないでトークを終了すると再生し続ける。
→止めてからトークを終了するか、アプリを終了させてください。
・iCloud Driveからファイルが読めないケースがあります。
→次バージョンで対応します。

現在すでにver.79を申請済みなので1〜2日でお届けできます。
それまでお待ちいただくか、とりあえずちょっと動作がおかしくても(実用にはほぼ影響はないです)先に使ってみたいかたはアップデートお願いします。

【トピック】UDトークは誰が話したか判別できますか?

UDトークの議事録での活用で一番多い質問が「誰が話したか判別できますか?」です。答えは「その機能はありません」です。「できません」ではないのです。すでに声紋認証などの技術で「事前登録をしておけば」誰が喋ったかは分かったり、一定時間音声が溜まると「Aさん(仮定)である」などの推測をすることができます。でもそれはUDトークには採用をしていません。いろいろな理由があります。例えばスマートフォン1つをみんなで回しながら使ったり、多くの割合で初めてしかも一瞬使うケースが多いことから事前登録は難しい。推測もある程度蓄積されるまでは不確かなケースが多いなどもありますが、そもそもUDトークの目的からすると「その機能いらない」という判断をしています。

簡単なことです、名前を登録しておいて話す前に「名乗ればいい」これだけのことです。さらに基本的な使い方「話に割り込まない、遮らない」を守れば誰が喋ったかは明確に記録できます。

多くのこの質問をされる方は使用目的を間違っています。「自由勝手に適当に喋っているものを文字化」するのがUDトークではありません。仮にできたとしてもその記録はあまり価値がないでしょう。会議自体やらないほうがいいくらい生産性は低いのです。
目的は「記録を作成する」ことであり「情報共有の補助」になります。そもそもUDトークを使わなくてもちゃんと共有ができて記録が作成しやすい会議をちゃんとしたルールで開くことが大事です。そのうえでUDトークを使えば終わった瞬間にほぼほぼの議事録が出来上がっています。

実はこれが障害者の方が会議に参加することで必然的に採用されることになります。視覚障害者の方が参加される会議では名乗ることは必須です。じゃないとびっくりしてしまいます。聴覚障害者の方が参加される場合は音声言語特有の言いっ放しでは通用しません。ちゃんと理論立てて話す必要があります。

そのうち周りの人が気がつくわけです。「なぜか障害者の方が参加している会議は毎回きれいな議事録が残っている」と。実はUDトークはそこから周りの健常者の方たちが「こう使えば議事録が取れる」と言うヒントを得て使い始めております。

・名乗ってから話す
・話し終わったら「以上です」など
・話に割り込まない

これで会議を進めればUDトークできれいに議事録が取れます。誰が喋ったかなんてことは音声から読み取る必要もないのです。
ちなみにそれぞれがスマホを持って話した場合はちゃんとそのUDトークに設定した「名前」で話者名が振られます。UDトークのトップ画面から設定へ行くと名前が設定できますのでぜひご自身のお名前を設定してみてください。

ですが、ちゃんと仕様的に良さそうなものを思いついたら話者の推定機能は実装すると思いますので。

CSV Converterをリリースしました。

UDトークの会話ログ(.csv)を読み込ませてFacebook動画の字幕ファイル(.srt)とYouTubeの字幕ファイル(.sbv)のデータを作成するプログラムを簡単ではありますが作成してみました。

開始時間が00:00:00.000で作成されるので、動画の開始から最初の字幕までの間隔を入力して作成します。マイナスの値も入力可能です。
こちらGithubにてオープンソースで提供いたしますのでご自由にお使いください。

https://shamrockrecords.github.io/CSVConverter/

リポジトリはこちら
https://github.com/ShamrockRecords/CSVConverter

【トピック】UDトークの正しい使い方、とは?

良くある問い合わせの一つに「UDトークの使い方を教えてください」と言うのがあります。おそらくそれは「正しい使い方」と言うのも含まれると思います。

もし問い合わせをされてきた方が聴覚障害者だった場合「このアプリを使うのはご自身ではなく周りの人です。それが正しい使い方です」とお答えします。そしてそれはまったくピンと来ていないようです。

法人向けプラン契約者に対する内部の講習会でも「このアプリは相手に伝えることができない話し手のスキル不足を補うもの」と言う話をします。聞き手がUDトークを使って工夫することについては一切触れません。それは講習会としては正しい使い方ではないからです。

いまだに多いのが「手元でUDトークを使っても認識しない」とか「電車の中で使ってもアナウンスが文字化されない」など自分が使ってしまって評価を下げているケースです。

UDトークを使うのは「話し手」です。環境を用意するのも単語を登録するのも「話し手」です。どうしてもそれを「聞き手」に頑張らせてしまう傾向が、特に教育機関で見受けられます。

教育機関での運用は思うところがあるのであえて書かせていただきます。

大学から講習会の依頼が来た時、対象は学生ではなく教職員と伝えます。UDトークを使用するのは学生ではなく教職員だからです。最初はなんで?と理由が分からない人たちも、講習会が終わったあとにはちゃんとその意図がわかっていただけます。「話し手」である先生が使うものなのです。しかし大学によってはちゃんとした運用がされておらず、学生さんが自分で授業の単語登録を行ったり、自分でセッティングしたり、よく分かってないところだとアカウントだけ渡して手元でUDトークを使ってしまい結局授業内容が分からないで終わってしまいます。もちろん学生さんの学内の活動でも使用できますのでアカウントを渡すのはOKですが、それはあくまでサークル活動とかそういったところで使い方になります。

そういう間違った運用をしている大学は講習会を企画されなかったりと言う状況です。

UDトークは話し手が使うものです。ですので、運用は教職員が行います。授業の準備をするのと同じようにUDトークの準備もして授業に臨みます。学生さんは授業に来たらUDトークのQRコードをもらって好きなところでみる。もちろんいくつかの大学はこういう運用をしています。

ですので、もしこの投稿を見て心当たりがある大学や間違った方法でUDトークを使っている学生さんがいたら一度内部でしっかりと「正しい運用」について話し合ってみてください。

UDトークは教育の分野においては既存の支援方法をサポートする大きな武器となります。またサポートする人員の割当が難しいときの手段として有効です。でもそれはすべて正しい使い方をしてのみです。企業での運用は正しい運用はそのまま結果につながるので教育機関よりはちゃんと試行錯誤をしているように思えます。

UDトークとしましても教育の分野は重要と考え、教育機関向けプランと言う導入しやすいプラン(月額16,000円使い放題)も用意し、導入後には積極的に講習会も行っております。

まずはちゃんとした運用をするとその先にいろんな可能性が見えてくるのがUDトークだと自負しております。

UDトーク講習会@岐阜羽島

6月24日(日)に岐阜県の羽島市で開発者によるUDトークの講習会が開催されます。

主催の岐阜音声認識支援研究会さんはUDトークを導入していただき、同様に導入されている岐阜県白川町のサポートや先日の岐阜市長選挙でもUDトークを使った候補者演説のサポートをするなど活用されております。

県外の方でもご参加可能ですのでお気軽にお問い合わせください!

ーーーー
【平成30年度 第1回 音声認識活用講座】
会話が視える!UDトーク講習会

2018年6月24日(日)
13:30~16:00 (受付13:00〜)

羽島市福祉ふれあい会館
2階 地域ふれあいスペース

参加費:無料
定 員 :60名(締切:定員になり次第)
講師 :青木 秀仁氏 (郡上市出身・東京在住)
シャムロック・レコード株式会社 代表取締役
コミュニケーション支援アプリ 「UDトーク」 開発者
主 催 : 岐阜音声認識支援研究会
後 援 : 岐阜県 ・ 岐阜県教育委員会
羽島市 ・ 羽島市教育委員会
(一財)岐阜県身体障害者福祉協会
(一社)岐阜県聴覚障害者協会
羽島市身体障害者福祉協会
岐阜市身体障害者福祉協会
(特非)ぎふ難聴者協会
岐阜新聞社 岐阜放送

Android版にシアターモードを実装しました!

Android版 ver.51をリリースしました。iOS版で実装されているシアターモードをAndroidでも採用しました。

操作方法ですが、トーク画面でメニューから「シアターモード」を選択。

・1指タップで文字が出る場所が右回りで変わります。
・2指タップでVRモードに切り替わります。
・ピンチインアウトで文字の大きさが変わります。
・1指ダブルタップで前の画面に戻ります。

UDトークは音声認識は「口にスマホを近づけて」と言う原則があるため、このシアターモードも単体で音声認識ができるモードではなく「相手が喋ってるのを見るため」の機能になります。ただ単体でも音声認識がしたい(静かな場所や条件が揃えば音声認識も可能)と要望も来ているので現在仕様を検討しております。

今回Android版ですが、端末によっては動作が重かったり、対応していないものもあります。その辺りは確認をできたわけではないのでもし動作がおかしかったときはお知らせください。

なお、今回Android端末では大きな端末でもちゃんとVRゴーグルに合うように大きさが調整されます。ですので小さめのタブレットの方でも(ちょっと無理がありますが)VRゴーグルでお楽しみいただけます。iOSも画面サイズの調整が入るものは現在申請中ですのでお待ち下さい〜。