カテゴリー別アーカイブ: トピック

【トピック】音声認識で支援をすると言うこと

ここを見てらっしゃる方は聴覚障害者の情報支援・サポートとしてUDトークに注目しすでに活用をされている方も多いと思います。

また音声認識を実装したそういうツールも出てきましたので、ここで一つみなさんにちゃんと考えていただきたいことがあります。

無料版で支援をされる方たちへ
http://udtalk.jp/notice/

まずは上記のリンク先を読んでいただけたらと思います。「そういえばそうだ…」と思われる方も多いのではないでしょうか。

利用規約にも書かれてるようにUDトークの無料版は音声認識時のデータをサーバーに蓄積し精度向上のために再利用をしています。もちろんセキュリティは万全で、個人が特定できない状態で管理保存されています。これはGoogleやAppleも同じで同じように利用規約に書いてあります。

ここで「利用規約」ですが、これに同意しているのはあくまで使う人です。なので「支援をする側の人」がいくら同意をしても、「支援をされる側の人」も利用規約に同意をしている必要があります。少なくとも音声データの収集の部分だけは同意をとるべきでしょう。

みなさんに勘違いをしてほしくないのは、サーバーにデータが蓄積され再利用されることは悪いことや怖いことではないということです。実際みなさんがやっているLINEやFacebookだって無料で提供される代わりにいろんなデータが学習素材として再利用されています。もちろんプライバシーはちゃんと保護された状態で。

ただ機密保持や守秘義務の観点で考えると「当事者が知らない間に個人情報が再利用に回されてた」と言うのはトラブルを招く可能性があることだとすぐにわかると思います。そのため、これからはクラウドやIT機器を利用して支援を受ける時、支援をする時はちゃんと双方でデータの行き所を把握しておく必要があります。

UDトークは法人向けプランではサーバーに音声データを保存しない、再利用しないモードで動作します。なので法人向けプランを使っている時は特に同意を取らなくとも、聞かれたときも「法人向けプランを使っています」と応えていただければUDトークがそれを保証します。法人向けプランは「プレミアムプラン」「スタンダードプラン」「教育機関向けプラン」「支援団体向けプラン」とアドオンで買える「コンパクトプラン」になります。

UDトークは無料のアプリでも十分支援ができますし、「連続発話の時間制限を解除(240円/月)」を購入すると講演等でも使用することができます。もちろん無償で業務ではない範囲です、がそういうところは何が行われているのがが非常にグレーな状態でシステムが運用されています。

今回、このことについて記載したページには「同意書」のテンプレートをご用意しました。こうしたことを気にして行くことが大事ですし、提供側としてはすべてクリアにして安心して活用していただくことが責務であると考えております。

なんか難しい話になってきた、とお思いかもしれませんが、至ってシンプルです(笑)。運用パターンとしては、

・無料版のアプリで支援→支援を受ける方に対し「同意を得る」
・法人向けプランで支援→法人向けプランの使用を明確に伝える

この2つしかありません。このケースでの法人向けプランは「支援団体向けプラン(4,800円/月)」「コンパクトプラン(9,800円/月)」となります。もしこれが過度の負担になるようなケースになってくると、UDトークでの支援ができなくなってきてしまいます。

ですので、支援を受ける方たちも積極的に同意をして無料版で支援を受けていただきたく思います。そうするとこちらで音声が大量に集まり、認識率の向上につながります。

正しい理解とともに安心してUDトークをぜひお使いください。

iOS版 ver.5.6.5リリース「連続発話の時間制限を解除」のアドオンを販売開始

iOS版 ver.5.6.5をリリースにて「連続発話の時間制限を解除」のアドオンを販売開始しました。現在無料版では一回の発話の時間が3分と言う制限がありました。これは無料版は会話で使用するということを想定しており、1人の人が3分以上話す主導権を持たないことを前提としております。この時間制限は法人向けプランやコンパクトプランで解除されます。一人の人が話し続けるシチュエーションというのはそういった業務利用がメインであると考えていました。

ですが、最近はこの連続発話の機能が欲しく個人でもコンパクトプランを購入されてる方も増え、問い合わせも多くなんとか提供をしたいなと考えておりました。課題としては「サーバーの負荷」だったのですが、無料アプリで使用するサーバーを増強する目処も立ちましたので今回のアドオンの販売の開始に至りました。無料アプリでも連続で使用できることでテレビやラジオと合わせて使うなど活用の幅はぐんと広がると思います。(利用規約やデータ収集のポリシーは無料アプリに準ずるので業務利用はダメですよ!)

月額240円の自動更新課金アドオンです。iOSのみの提供となります(Androidでの提供予定はいまのところありません)。

(9:00現在、まだリリースしたばかりで購入ができないようです。昼過ぎにはできる、かな?)

アプリ起動→左上の「設定」→アドオンの購入

その他、5.6.5には

・ノイズが多い発話には「ノイズマーク」を表示(認識率の信憑性の基準にできる、かもしれない)

・「以上です。」と言うと自動的に音声認識が停止(トーク設定内、初期状態ではオフ)

などの実験的な機能を追加しております。

ぜひご利用ください。

【トピック】専門用語や固有名詞はどこまで認識するの?

音声認識を使っていて気になるところだと思います。まず結論から言うと「音声認識辞書に入っていない単語は認識しません」です。

頑張って喋っても「ない」ものは「でない」のです(笑)

ここが音声認識が人工知能と勘違いされているところなのですが、単語は自動的に増えていくわけではありません。基本的なものはサーバー側で随時増えております。もしかしたら近い将来この部分が人工知能化されるかもしれませんが、現在は「人の手で精査して」行っております。

辞書にない単語はどうしたらいいか?サーバー側で追加されるのを待つのも気が長い話しだし、自分たちだけの造語などいつまでたっても追加されません。

簡単な話で「登録」をすればよいのです。

現在、UDトークには2つの単語登録方法が用意されています。

1.アプリ内で単語登録
https://teachme.jp/contents/870775

ここに登録することで「その端末でのみ」単語登録が有効になります。まず自分の名前とか登録すると良いと思います。名前は一番身近で気が付きにくい固有名詞です。

2.サーバーに単語登録
https://teachme.jp/contents/774039

法人向けプランのみの機能ですが、同一アカウントで動作している端末全てで有効にすることができます。CSVによる一括登録や保存もできるので管理が楽になります。

アプリ内で有効な単語登録は「アプリ内+サーバーへ」の合わせたものとなります。

単語登録をするとまず間違いなく単語は出るようになります。ただし1文字とか逆に長過ぎるものとかだと音声認識のバランスが崩れ誤認識になるケースがあります。

単語登録の方針としては「必要最小限」です。実際に使ってみて出なかった単語を登録していくと言う運用がおすすめです。

ぜひやってみてください。

【トピック】音声翻訳アプリとしてのUDトーク

ここ最近、にわかに盛り上がってきている音声翻訳アプリと言う分野。代表的なのはNICTがリリースしている「VoiceTra」と言うアプリでしょうか。テレビや雑誌でも取り上げられてますね。

UDトークは聴覚障害者支援のアプリとしてかなりシェアを伸ばしつつありますが、この音声翻訳アプリとしても負けていませんよ!
トーク画面でメニューから「翻訳と音声認識の言語設定」を選ぶと言語が選択できます。まずはここで「相手の言語」を設定するとUDトークが音声翻訳アプリになります。

例えば事前に何かを伝えたい時などは喋って画面に文字を出して準備しておけばいいですよね。UDトークは何度も喋って追記ができるのがいいところです。例えば書き置きを残したい場合の文章作りとかいいですよね。写真は最近海外旅行に行ってきた開発者のリアルに使用した写真とスクショです。

翻訳モードにしておくと相手に喋ってもらうこともできます。ですが実際の旅行となるとやはりそれはこのアプリが何なのかの説明をする必要があるので喋ってもらうのはハードルが高いです。まずは自分のところで相手に対する要望をしっかりと文章で作って準備してから会話を始めるといいですよね。アプリ画面にUDトーク自体の説明を吹き込んでおくのもいいかもしれません。

キーボードで文字を打っても翻訳できますのでいろいろ活用できます。例えばわからない英単語を入力して意味を調べるとか。でもそういう時は「Google翻訳」のリアルタイムカメラモードが便利です。

ちなみにこの内容を読み上げることもできるので「音声+表示」でコミュニケーションを行えるのもポイントです。原文と翻訳が見れるので確認もしやすいですね。

いろんなアプリがある中でシーンによって組み合わせることで海外でもいろんな情報を得て楽しむことができます。
ぜひお試しください!

【トピック】法人向けプラン述べ導入件数200件を突破!

UDトークの法人向けプラン(スタンダード/プレミアム/教育機関/支援団体向け)の述べ導入件数が4月からで200件を超えました。

本日から新年度での業務開始と言うこともあり、準備を進められていたところも多く対応させていただきました。お申込みをされていてたところはほぼ問題なく今日からお使いいただけると思います。

2016年度だけで150〜160件決まったことになります。UDトークの場合はよくソフトウェアにありがちな「端末」ライセンスではなく「拠点」や「使用場所」にライセンスされます。つまり仕様台数は何台でもOKです。これはいくつか用意されてる端末のうち「これとこれはUDトークが使える」と言うのは体験を損なうと言う考えです。どの端末を手にしてもすぐに使うことができると言うのがコミュニケーションツールとして活用される条件だと思います。

ご利用されてる中には従業員の方の端末にどんどんUDトークをインストールしていつでも業務で使えるようにしてあるところもあります(アプリにアカウントとパスワードを入れることで法人向けプランで動作します)。もちろん無料版のアプリとしても利用数は伸びており毎日たくさんの方にご利用いただいております。

ここ1〜2年で「音声認識をコミュニケーション活用する」と言うのが可能になりました。デバイスの登場や技術革新やその他いろんな要素がありますが、なによりニーズとか使用者の理解とかそう言ったところが実用化を推し進めてきた気がします。

2017年度もfacebookページやホームページ等でいろいろな使用例やトピックなど情報発信をしていきたいと思います。よろしくお願いします!

【リリース】「中国語(簡体字)」の音声認識でAmiVoice Cloud が使用可能になりました

「中国語(簡体字)」の音声認識でAmiVoice Cloud が使用可能になりました。

現在、「日本語」と「英語(北米)」はAmiVoice Cloudによる連続発話音声認識、他の言語についてはAppleやGoogleの単発話音声認識で提供していますが、「中国語(簡体字)」についてもAmiVoice Cloudによる連続発話音声認識の提供をはじめました。「タップして話す」を押してから止めるまでの間を連続で音声認識できます(無料版は3分間、法人版は制限なし)。

また「中国語(簡体字)」は法人向けにも提供されます。3月末まで法人向けの音声を保存しない「英語(北米)」は無料キャンペーンで提供していましたが、4月からは共用サーバーであれば法人向けプランの範囲内で「英語(北米)」と「中国語(簡体字)」を標準で提供いたします。日本語同様サーバーに音声データが残らないセキュリティ重視の仕様になっております。

音声認識は

連続発話音声認識:スピーチ、会話
単発話音声認識:機器操作、検索、会話

と、一回の発話の長さで用途が変わってきます。「Hey Siri」や「OK Google」などで始めるのは単発話音声認識になり数秒の言葉(単語)を精度良く認識するように最適化されています。連続発話音声認識をアプリで提供できているのはおそらくUDトークが唯一と言っていいと思います。全文を文字で打つことが不可能な日本語ならではの特殊なニーズとも言えます。

今回の「中国語(簡体字)」、ぜひテレビや動画のニュースなどで翻訳と組み合わせて一度お試しください。

iOS版とAndroid版ともに提供されます(アプリのバージョンは…新しめのですw)

iOS版 ver.5.6.0をリリースしました

今回は法人向けの機能がメインとなります。

【マルチアカウント機能】
複数の法人アカウントをアプリ内に入力して切り替えて使用することができるようになりました。法人アカウントは単語辞書の単位でもあるので、例えばサブアカウントを部署ごとに作っておくとか学校で教科ごとに作っておくなどして簡単に切り替えて使用することができます。

【内容】
・編集中に画面更新がもたつくのを改善しました。
・初回のキーボード書き込みができなかった不具合を修正しました。
・読みを振る時、もともとの音声認識結果の読みをもとにするようにしました。
・翻訳結果の日本語に漢字かな設定と読みを振るようにしました。
・法人アカウントをマルチアカウント管理できるようにしました。
・読み仮名設定の場所をトーク設定内から漢字かな設定に移動しました。
・漢字かな設定のオンオフで読み仮名のオンオフができるようになりました。
・HTML書き出しでルビを振るようにしました。

オンラインマニュアルはこちら

【お知らせ】法人向けプランの内容変更

UDトークはこの1年間で非常にたくさんの法人向けプランの導入をすることができました。

順調ではありましたが、1年たっていろいろ改善点も見えてきました。それを踏まえて4月からですが、法人向けプランについて幾つか変更することがあります。
現在、導入を検討されている企業・団体様もこちらをご参考にされるようよろしくお願いします。

■スタンダードプランの利用を「3箇所」まで
現在共用サーバーを使う「スタンダードプラン」と「プレミアムプラン」があります。この2つには利用範囲に明確な区別がなく運用環境をアリングをして決めておりました。4月からは明確に「3箇所」として申込時に申請をしてもらうようにします。それに伴いホームページや利用規約の更新しました。

なお、教育機関向けプランと支援団体向けプランに関しては今まで通り個別に対応いたします。

■プレミアムプランの初期費用を20万円に値下げ
プレミアムプランの初期費用を29万円から20万円に値下げをいたしました。

■トライアルを2週間にしました
トライアルを2週間から一ヶ月としておりましたが、ここをまず最初は2週間と明確に設定することにしました。

よろしくお願いします。

【トピック】YouTubeの字幕作成機能とUDトーク


YouTubeの字幕作成機能ってご存知ですか?YouTubeはYouTubeの音声認識を使って自動的に字幕が出る機能がありますが、場合によってはしっかり出るときもありますが、大体の動画は収録音響環境が悪くちゃんとでません。

自動ではなく打ち込んで作成する機能があります。でもこれ文字をうって時間を調整してと言うのをやっていくのでそれはそれでで結構大変なんです(2〜3分のならちゃちゃっとできますが)

そこでUDトークの出番です!

UDトークはCSV形式で時間情報とともに出力できます。それをもとにSubViewer形式(拡張子.sbv)と言うのに加工してYouTubeにアップすると、写真のようにピタッと全部に張り付きます。あとは長すぎるところを分割したり、必要ないところをカットしたりするだけです。

いまこの方法をもっと簡単にできるようにいろいろ手順を考えております。例えばUDトークの出力にSubViewer形式を追加しちゃうとか。そしてやってみて現在時間情報が時々ずれる不具合も分かっておりそれも修正対応中です(次バージョンで直ってるかも…)。

また、メディア・アクセス・サポートセンターが出している「おこ助」と言うソフト(Win版)でもYouTubeに入力できるファイルを書き出すことができます。
http://okosuke.jp

いまこのあたりはノウハウを知っていればできると言う感じなので、皆さんに簡単にできるように手順を明確にするのとこちらで「YouTubeに字幕つけます!」ってのを有料でやろうかとも検討中です。ただしその時は講演イベント等で「UDトークを同時に運用して編集まである程度いれてくださいね」が条件になりますけどね(あと法人契約もw)
もうわりと字幕を付けるツールは揃ってきました。ここをいかにシームレスにして配信側の負担なく良いコンテンツが作れるか、がポイントになってくると思います。

参考までに作業したYouTube動画です。だいたい中2日くらいでここまでできます。

UDトーク講習会 in 北海道(帯広編:前半)

UDトーク講習会 in 北海道(帯広編:後半)

【不具合報告】編集をすると全部ひらがなになってしまう

iOS ver.5.5.5である設定下のもとで編集すると全部ひらがなになってしまう不具合が見つかりました。現在修正してすぐにver.5.5.6を申請しております。

トーク設定で「読み仮名を表示する」がオンを入れていると内容を編集したタイミングで全部ひらがなになってしまいます。

この現象の回避策ですが

読み仮名を出さなくてもいい場合
(方法1)「読み仮名を表示する」をオフにする。

読み仮名を出したい場合
(方法2)「読み仮名を表示する」をオンにしたあと、メニューの「漢字かな設定」で適当な学年を選んだ後、左下に出て来るアイコンで漢字かな設定をオフにする。

このどちらかになります。
ver.5.5.6がリリースされたらすぐにバージョンアップお願いします。