カテゴリー別アーカイブ: トピック

【字幕付きイベント】渋谷区総合防災訓練 – SHIBUYA BOSAI FES 2017

渋谷区総合防災訓練 – SHIBUYA BOSAI FES、Stage Programの「BOSAI トークステージ」の全てにUDトークのリアルタイム字幕サポートが付きます。また手元のスマートフォンでも見ることができます。

9月2日(土)、9月3日(日)の両日、代々木公園にて開催です。

特に2日の

12:00〜12:45 こんなときこそ考えたい「防災×障害」

ではUDトークの導入校の宮城教育大学の松崎丈先生がパネリストとして登壇されます。緊急情報の情報伝達など障害者対応でいまもっとも急がれている分野の一つが防災です。この機会にみんなで考えることができればよいかと思います。

その他にも防災に関わる興味深いトークが盛りだくさんです。
ちょっとまだ暑い時期かもしれませんが、ぜひご参加ください!

渋谷区総合防災訓練 – SHIBUYA BOSAI FES
http://shibuya-bosai.tokyo/
ステージプログラムはこちら
http://shibuya-bosai.tokyo/stageprogram

山形県立山形聾学校が研究成果報告書で受賞されました!

山形県立山形聾学校が公益財団法人パナソニック教育財団の「平成28年度(第42回)研究成果報告書の評価」で佳作を受賞されました!

1年間の活用と研究成果が認められ引き続き本年度も学校で活用していただいております。聾学校での活用例は数例ありますが、この評価は非常に意義があるものではないかと感じております。

導入や活用に関わられた先生方、ほんとにおめでとうございます!これからもよろしくお願いします。
そしてみなさんにはこうした助成と評価体制があることをこの機会に知っていただければいいかと思います。教育現場の先生たちは日々研究に奮闘しております。

ーーーー
平成28年度(第42回)研究成果報告書の評価
http://www.pef.or.jp/school/grant/evaluation/h28_evaluation/
(スクロールし一番下)
研究成果報告書はこちら直リンク
http://www.pef.or.jp/wp-content/themes/panasonic_theme/db/pdf/042/2016_06.pdf

UDトーク for Win & Mac、ver.2.2.6をリリース

UDトーク for Win & Macをお使いのみなさま。

両方ともにver.2.2.6をリリースしました。
(Mac版の途中のは欠番となります)

Win版はCtrl+P、Mac版はCommand+Pで「セパレーターを挿入」することができるようになりました(操作メニュー内にあります)。多目的に使うため名称をセパレーターとしましたが、早い話が「話者記号」です。

実行するとその発話の先頭に設定してある文字列が挿入されます。初期値は半角のスラッシュです。

例えば1つのマイクで複数にが話しているとき、話者が切り替わったタイミングでこれを実行すると発話の先頭に記号が入ります。手で打つのよりも少ないステップで実行できます。

お時間ある時にアップデートよろしくお願いします。

「UD手書きPro」をリリースしました

新しいコミュニケーションアプリをリリースしました。もともとリリースしている音声認識筆談アプリ「UD手書き」。これを更にパワーアップし、様々なシーンで手書きコミュニケーションに対応できるように機能を実装しました。

・iPadでは上限に画面を2分割して対面で使用。
・音声認識ボタンで楽々テキスト入力。
・相手と自分の言語を設定し翻訳。
・写真やテキストを回転、移動、サイズ変更と自由に配置。
・Apple Pencilの筆圧対応。

アプリは無料ですので、ぜひダウンロードしてお試しください。

UDトークの法人向けプランをご利用のお客様は同じ法人アカウントを使用することができます。設定するとUDトークと同じ音声認識サーバーや翻訳のポリシーで使用することができます。

このアプリの使用想定は短い会話のコミュニケーションです。もちろんUDトークもそう言うシーンでは有効ですが、UD手書きProは活躍してくれると思います。

リリースしたばかりなのでまたこれからいろいろとバージョンアップをして行きたいと思います。

ダウンロードはこちら。「UD手書きPro」で検索。

すでにリリースしている「UD手書き」も簡単で便利な筆談アプリです。ぜひご利用ください。

UDトーク for Windows ver.2.2.5リリース

ご利用のみなさま。

UDトーク for Windowsの ver.2.2.4に致命的な不具合が見つかりました。
編集を行うと発言の時間情報が破損してしまい、内容を保存した祭に欠損したり順序が変わったりする現状が見つかりました。

現在2.2.4をお使いの方はなるべくご利用前に2.2.5にアップデートしてお使いください。
議事録として使用しないのであればとりあえずは影響はありません。

お手数とご不便おかけしますが、よろしくお願いします。

UDトークで便利に使える集音器「ベルマン ミノ」のご紹介

聴覚障害をお持ちの方に便利に活用いただける機器を販売されてる「自立コム」さん(UDトークの協力パートナーです)からUDトークと一緒に使うととても便利な集音器が販売されているのでご紹介したいと思います。

「ベルマン ミノ」と言う機器です。こちら集音器で本来これにイヤホンをさして聴くためのものですが、そこにUDトークを接続することで音声認識をし文字を表示することができます。ケーブル1本(オプション販売)で接続することができるので非常にコンパクトに設置、持ち運びをすることができます。

集音方法としては3つ

・本体のマイク(指向性/無指向性を切り替え)
・有線の外部入力
・内蔵のTコイル(磁気誘導コイル)

例えばこれ本体を卓上に置き喋る人の直ぐ側に置いたり手持ちや首掛けでマイクとして使用できます。

iRig2などのスマートフォンへ有線で入力するためのアタッチメントと同じように動作します。

そして特筆するべきはTコイル(磁気誘導コイル)です。これを内蔵しているので、ヒアリングループが設置してあるところへ行くとループの音を受信して手元のスマホやタブレットで文字化することができます。もちろんヒアリングループを経由した音質にもよりますが、普段ヒアリングループをご利用されいる方であれば手軽にUDトークを併用して情報を補完することができます。特にヒアリングループ側で設定は必要ありません。現在ヒアリングループは公共施設への普及も進んでいると聞いています。

写真は自立コムさんからリリースされている卓上の小型ヒアリングループとの組み合わせですが、もちろん他のヒアリングループと一緒に使用できます。

聴覚障害をお持ちの方がご自身で持ち歩くのにピッタリなマイクだと思います。お値段も¥28,000(税抜)と多機能なのにお手頃価格です(一週間の貸出も行っているとのこと)。

ぜひお試しください!

ベルマン ミノ(自立コムの販売ページへ)

【トピック】UDトークは誰のためのもの?

結論から言うと、UDトークは「話す方」「伝える方」が使うものです。なので情報を受け取る方(聴覚障害者など)はあくまで使われた結果を「見るだけ」になります。

いまだに多く人が勘違いされてるのはこのアプリは対象となる本人が持って使うものではなく、相手に使ってもらうことによって成り立つもの。つまり「自立」のためのものでなく「共助」のための手段なのです。逆に言うと話すほうがUDトークを使う気がなければまったく役に立ちません(まぁ、それでも多少分かる結果は出ると思いますが)。

例えばトークイベントでも聴覚障害者の方が手にUDトークを持って手元で音声認識を開始しても文字になるわけではありません。トークイベントの主催者がちゃんと導入をして正しい使い方をし話される方や出席者にこれが何をするための手段なのかをちゃんと理解した上で使用するものです。

じゃこれを使ってもらうために頭を下げてお願いをしなきゃいけないのか?と言うと答えは「はい」です。これを使ってもらう事によって自分がメリットを得ることができるのであればお願いすればいいと思います。合理的配慮の世の中、それを断る人もいないと思います。

そもそもの考え方を変えてみてはどうでしょうか。相手に対してのメリットを提示するのです。話す人がこれを使った場合たくさんメリットがあります。まず音声認識や翻訳の機能を使うことでそこに外国人や聴覚障害者の方たちがいても自分の話した内容を持ち帰ってもらうことができます。つまり「伝えること」ができます。

終わったあとにすぐに全文の記録が残ります。ちょっと直してすぐに公開することもできますし、動画のフル字幕を作成する手助けにもなります。

リアルタイム字幕は話している内容を補完します。手元で見ることで遡って確認したりすることができるので、全ての参加者にとって役に立つ情報補助となります。

これはよく言われることですが、

「話している内容が相手に伝わらないのは100%話し手の責任」

です。

話し手の立場からするとわざわざ足を運んでくださった方たちに自分の話をちゃんと持ち帰っていただくことへの努力は当たり前のことです。UDトークは話して側の補助ツールとして効果を発揮します。

このように話し手に対してのメリットも一緒に提示してあげることで「共に使う」と言う関係ができます。

もちろん人によってはこういうのがめんどくさいと感じる方もいらっしゃるでしょう。ですが、そのときに自分たちにとって何が一番大事なことなのか、と言う目的を大事にしていただければきっとうまく使えるのではないかと思います。

もちろんUDトークは万能ではないのでさっぱり使えないケースもあります(笑)。そういうときはまた別のことを考えていただければいいと思います。UDトークは問題解決のツールでもありますが、問題発見のツールでもありますので。

【トピック】音声認識、いろいろあるけど

iOSではSiriやキーボードに、Androidは検索したりと音声認識が身近になって、もうちょっとした検索や操作なら喋って済んでしまうことが多くなったのではないでしょうか(少なくとも開発者、かなりスマホの音声認識使ってます)。

よく聞かれるのがズバリ「UDトークってSiriとかと何が違うの?」と言うことです。ですがこの質問は少しばかりずれています。

まずこれを理解するには「音声認識」と呼んでいるものがなんなのか?を正しく把握する必要があります。

音声認識とひとことで言った場合に要素は「技術」と「インターフェイス」と2つに分けて考えなければいけません。

SiriやGoogle検索で説明をします。AppleもGoogleも独自に「音声認識技術」を持っています。そしてSiriやGoogle検索と言った「音声認識インターフェイス」でユーザーに提供されます。キーボードについているのも「音声認識インターフェイス」となります。みなさんが音声認識を使っているとよく言っているのは「技術をインターフェイスを通して」使っているということになります。

ではUDトークで同じ説明をすることにします。AmiVoice(アミボイス)と言う株式会社アドバンストメディアが開発している音声認識技術があります。それをUDトークと言うインターフェイス(アプリそのものがインターフェイス)を通して使用しています。UDトークはAmiVoiceと言う音声認識技術を採用しています。

では、技術の提供を受けて「インターフェイスを開発する立場」になって考えてみます。技術の提供元から「インターフェイスを開発してもいいよ」と言う条件や規約が提示されます。それぞれ分かりやすいところで列挙をしてみます。

■Apple
・開発キットを通して自由に使用
・無料(年間のアプリ開発ライセンスは必要)
・時間(連続1分)や回数制限あり
・音声データは提供

■Google
・専用インターフェイス(「お話ください」の)を通して無料で使用
・Speech APIで有料(従量課金)で使用
・専用インターフェイスは一言、Speech APIは連続可能
・音声データは提供

■AmiVoice
・開発ツールキットの販売提供(企業間のみ)
・ライセンス料+利用料
・時間制限なし
・単語登録や辞書のカスタマイズ可能

(これが全てではありませんのでご了承を)

AppleとGoogleの技術としての提供形態はよく似ています。両方とも開発者が無料で使用してインターフェイスを開発できるようになっています。ただし、これを使用して作った場合は喋った音声データはすべてAppleとGoogleに提供をすることになります(利用規約に明記されています)。

技術としてのAmiVoiceはAppleやGoogleとは大きく異なります。特徴はやはり日本でビジネスをしている企業の技術なので企業間でライセンス契約をし、開発会社が製品を開発します。カスタマイズも可能なのでその分野に合わせた使い方(専門用語とか)にも対応できます。

ではこの技術を使ってインターフェイスを提供する立場になってみます。どの音声認識技術を使用しても無料有料にかかわらず、インターフェイス、つまりアプリやソフトウェアは「価格をつけて販売」することになります。これで言うとiOSやAndroidはOSや端末を使っている分にはそれ自体のインターフェイスを使って無料で提供されています。UDトークも無料アプリとして提供をしています。しかし厳密には無料ではなく、インターフェイスを使用したユーザーの音声を対価としていただいているので無料提供をしているということです。UDトークは法人向けには音声データを収集していないので、その分有料で提供をしております。

ここまでで「技術」と「インターフェイス」、そしてそれを「開発」して「提供」するところまでなんとなく理解していただけかと思います。

ではここで「日本」と言う市場を考えてみたいと思います。これは筆者の見解ですが、「喋り言葉を一字一句文字にする」と言う音声認識のニーズは日本独自なのではないかと考えています。それは日本語は複雑でキーボードでリアルタイムに打つことが不可能だからです(頑張ればできる、と言う議論はここでは論外で、サービスとしての提供のクオリティの話をしています)。海外での音声認識のニーズは検索をしたり、命令をしたり、対話をしたり、といったところ。これは長時間連続で文字化をするような技術の提供形態をとっていないことからも推測できます。長時間の利用を前提とすると例え時間制限なく使える技術があってもそれが従量課金だと使用する方も提供する方もなかなかビジネスにはしづらいといえます。なのでどこで「インターフェイス」を提供するか、ビジネスをするかで「技術」を選択することになります。

逆に考えるとUDトークと言うインターフェイスをユーザーに無料で提供をしようと考えた場合(聴覚障害者へのサポートでの使用を考えたときも)、ニーズやビジネスに合って選択した技術がAmiVoiceだった、とも言えます。

と、いろいろ難しい話もしてきましたが、ユーザーの人にとってみたら結局「良く認識する技術がいい」ってことだけだと思います(笑)

まず技術同士で比較というのは難しいのですが認識率と言うところで言うと正直「どっこいどっこい」です。認識率は数値的なものももちろんありますが、体感も含まれてきます。インターフェイスの違いでだいぶ体感が変わってくるのです。SiriやGoogle検索は短い言葉を発する前提で非常によくチューニングされていますし、結果をよりリクエストに適したものに変換したりしています。つまり「明日」と喋って「明日」と言う文字が取得できるのは音声認識ですが、明日の日付が取得できるのはインターフェイスということです。ユーザーはしばしばこれも「認識率がいい」と判断をします。

UDトークは長いスピーチなんかを文字化するためにチューニングされています。一番分かりやすいのは「句読点」の挿入なのではないかと。AmiVoiceは長文で句読点が入る音声認識技術です。あと他の音声認識技術やインターフェイスにはない「単語追加」などのカスタマイズも可能です。

みなさんが音声認識を使用するとき、それは「音声認識インターフェイス」であって、その裏にある「音声認識技術」まではほとんど意識することがないと思います。でもちょっとだけ仕組みを知っておくと使い方のアイデアも生まれたり、より活用できたりするんじゃないかと思います。

ここまで読んで頂いてありがとうございます。もう一回頭から読んでみましょう(笑)

【重要】UDトークの「UDトーク®利用規約(一般)」を一部変更しました

UDトークの「UDトーク®利用規約(一般)」を一部変更しました。

第五条の4項を

④ 法人格を有する事業者がその業務のために本アプリを利用すること(ただし、事業内容・規模・形態、従業員数等から、当社が利用を認める場合を除く)

と変更いたしました。

いままでどおり無料のアプリの業務利用は「原則禁止」のまま、例外的に認める場合は業務での利用も可能にするものです。
ここで「当社が利用を認める場合」のいち例としては「自営業者・個人経営の商店」などとなります(接客で利用する場合には音声の収集については承諾を得てからご利用ください)。

改めて確認ですが「自治体」「公共機関」が窓口で住民への対応としての利用するときはすべて業務利用となります。ですが、住民の方が自分でUDトークを持ってって窓口で使ってもらう(筆談器のように)のは問題ありません。

また「教育機関」で学校側が学生支援や業務で使用することももちろん業務利用となります。ですが、学生さんが自分たちでサークル活動とかで使用するのは問題ありません。

通常「一般企業」で利用する場合は殆どのケースが業務利用となります。

利用規約についてはこちらから取り締まるわけではなく、報告があったときに都度判断させていただくことになります。
もし「こういう使い方は大丈夫だろうか?」と懸念される場合はお問い合わせください。

一般の無料アプリをお使いの方にとってはいままでちょっと利用がグレーゾーンだったところが明確なったので利用できる範囲がすっきりしたかと思います。引き続きご利用ください。

UDトーク®利用規約(一般)

ジョーク機能「大阪弁で表示する」をリリースしました

iOS版 ver.5.6.6、Android版 ver.3.6.6でジョーク機能「大阪弁で表示する」をリリースしました。出てきた音声認識結果がとことん大阪弁になります(笑)。実用性は…、皆さんしだい(笑)

標準語で喋ると大阪弁で表示されます。あ、大阪弁の音声認識ができるようになったわけではないのでご注意を。

聞こえないかたが使うと、標準をを喋る人が一人もいなくなったような感覚になります。設定のしっぱなしにご注意を。

英語から日本語への翻訳でも大阪弁になります。外国人が全員大阪弁で喋ってます。

どんな真面目な会議もこの機能を使うと笑いを堪えるのに必至です。
ついつい喋って使ってみたくなる、そんな機能ですので、ぜひ遊んでみてください。

今回この機能を実装するにあたり、大阪にある「天神橋ホームページ製作所」さんにご協力をいただきました。元となった機能のウェブサイト版はこちらになります。「関西弁変換にする予定だったのですが、よりベタな表現に変換をするので大阪弁変換としています。」と言うネイティブならではのこだわりが秀逸ですw