shamrock1976 のすべての投稿

【リリース】「中国語(簡体字)」の音声認識でAmiVoice Cloud が使用可能になりました

「中国語(簡体字)」の音声認識でAmiVoice Cloud が使用可能になりました。

現在、「日本語」と「英語(北米)」はAmiVoice Cloudによる連続発話音声認識、他の言語についてはAppleやGoogleの単発話音声認識で提供していますが、「中国語(簡体字)」についてもAmiVoice Cloudによる連続発話音声認識の提供をはじめました。「タップして話す」を押してから止めるまでの間を連続で音声認識できます(無料版は3分間、法人版は制限なし)。

また「中国語(簡体字)」は法人向けにも提供されます。3月末まで法人向けの音声を保存しない「英語(北米)」は無料キャンペーンで提供していましたが、4月からは共用サーバーであれば法人向けプランの範囲内で「英語(北米)」と「中国語(簡体字)」を標準で提供いたします。日本語同様サーバーに音声データが残らないセキュリティ重視の仕様になっております。

音声認識は

連続発話音声認識:スピーチ、会話
単発話音声認識:機器操作、検索、会話

と、一回の発話の長さで用途が変わってきます。「Hey Siri」や「OK Google」などで始めるのは単発話音声認識になり数秒の言葉(単語)を精度良く認識するように最適化されています。連続発話音声認識をアプリで提供できているのはおそらくUDトークが唯一と言っていいと思います。全文を文字で打つことが不可能な日本語ならではの特殊なニーズとも言えます。

今回の「中国語(簡体字)」、ぜひテレビや動画のニュースなどで翻訳と組み合わせて一度お試しください。

iOS版とAndroid版ともに提供されます(アプリのバージョンは…新しめのですw)

iOS版 ver.5.6.0をリリースしました

今回は法人向けの機能がメインとなります。

【マルチアカウント機能】
複数の法人アカウントをアプリ内に入力して切り替えて使用することができるようになりました。法人アカウントは単語辞書の単位でもあるので、例えばサブアカウントを部署ごとに作っておくとか学校で教科ごとに作っておくなどして簡単に切り替えて使用することができます。

【内容】
・編集中に画面更新がもたつくのを改善しました。
・初回のキーボード書き込みができなかった不具合を修正しました。
・読みを振る時、もともとの音声認識結果の読みをもとにするようにしました。
・翻訳結果の日本語に漢字かな設定と読みを振るようにしました。
・法人アカウントをマルチアカウント管理できるようにしました。
・読み仮名設定の場所をトーク設定内から漢字かな設定に移動しました。
・漢字かな設定のオンオフで読み仮名のオンオフができるようになりました。
・HTML書き出しでルビを振るようにしました。

オンラインマニュアルはこちら

【お知らせ】法人向けプランの内容変更

UDトークはこの1年間で非常にたくさんの法人向けプランの導入をすることができました。

順調ではありましたが、1年たっていろいろ改善点も見えてきました。それを踏まえて4月からですが、法人向けプランについて幾つか変更することがあります。
現在、導入を検討されている企業・団体様もこちらをご参考にされるようよろしくお願いします。

■スタンダードプランの利用を「3箇所」まで
現在共用サーバーを使う「スタンダードプラン」と「プレミアムプラン」があります。この2つには利用範囲に明確な区別がなく運用環境をアリングをして決めておりました。4月からは明確に「3箇所」として申込時に申請をしてもらうようにします。それに伴いホームページや利用規約の更新しました。

なお、教育機関向けプランと支援団体向けプランに関しては今まで通り個別に対応いたします。

■プレミアムプランの初期費用を20万円に値下げ
プレミアムプランの初期費用を29万円から20万円に値下げをいたしました。

■トライアルを2週間にしました
トライアルを2週間から一ヶ月としておりましたが、ここをまず最初は2週間と明確に設定することにしました。

よろしくお願いします。

【運用レポート】長野大学(卒業証書・学位記授与式)

長野大学の卒業生のみなさま、ご卒業おめでとうございます!

長野大学から卒業証書・学位記授与式の情報支援をUDトークで行った運用レポートをいただきました。
音声認識や事前原稿出力などをオペレーション側で切り替えながらその時に適した情報を表示していきます。レポート中にもありますが「その場の空気・一体感を共有できるよう」というのはそこに関わる人達の思いで実現できることだと思います。

これから卒業式や入学式で活用されていくことを期待しています。

ーーーー
長野大学には聞こえない学生が在籍しており、2017年度からの公立大学法人化にむけ、合理的配慮を積極的に推進しております。

去る2017年3月20日、2016年度の卒業証書・学位記授与式を長野県上田にあるサントミューゼにおいて実施しました。なるべくその場の空気・一体感を共有できるよう、会場の音響設備をUDトークと接続しリアルタイム字幕化を行いました。また、QRコード配信機能を用いて、学生個人の端末にも字幕を送っており、字幕を読み逃したり、訂正が入ったりした場合にも遡って情報を追うことができるようになりました。実際に利用学生からも好評でした。
また、静岡福祉大学で開発されている「まあちゃん」と混在させて運用することにより、原稿に沿った文章を出したい場合や、音声認識しづらいケースにおいても素早く手入力に切り替えることができ、その場の情報保障を実践することができました。

今回は卒業式会場の雰囲気に溶け込む字幕提供をするため、ビデオミキサーを通して背景合成・画面切り替えにもチャレンジしています。このような配慮をすることで、字幕を自然に提供することができることも分かりました。このような応用がしやすいのも、UDトークの利点といえます。
本学では、今後も学生のニーズに応じた情報保障・提供方法を模索し、負担なく字幕を提供していくことを心掛けていきます。

【トピック】YouTubeの字幕作成機能とUDトーク


YouTubeの字幕作成機能ってご存知ですか?YouTubeはYouTubeの音声認識を使って自動的に字幕が出る機能がありますが、場合によってはしっかり出るときもありますが、大体の動画は収録音響環境が悪くちゃんとでません。

自動ではなく打ち込んで作成する機能があります。でもこれ文字をうって時間を調整してと言うのをやっていくのでそれはそれでで結構大変なんです(2〜3分のならちゃちゃっとできますが)

そこでUDトークの出番です!

UDトークはCSV形式で時間情報とともに出力できます。それをもとにSubViewer形式(拡張子.sbv)と言うのに加工してYouTubeにアップすると、写真のようにピタッと全部に張り付きます。あとは長すぎるところを分割したり、必要ないところをカットしたりするだけです。

いまこの方法をもっと簡単にできるようにいろいろ手順を考えております。例えばUDトークの出力にSubViewer形式を追加しちゃうとか。そしてやってみて現在時間情報が時々ずれる不具合も分かっておりそれも修正対応中です(次バージョンで直ってるかも…)。

また、メディア・アクセス・サポートセンターが出している「おこ助」と言うソフト(Win版)でもYouTubeに入力できるファイルを書き出すことができます。
http://okosuke.jp

いまこのあたりはノウハウを知っていればできると言う感じなので、皆さんに簡単にできるように手順を明確にするのとこちらで「YouTubeに字幕つけます!」ってのを有料でやろうかとも検討中です。ただしその時は講演イベント等で「UDトークを同時に運用して編集まである程度いれてくださいね」が条件になりますけどね(あと法人契約もw)
もうわりと字幕を付けるツールは揃ってきました。ここをいかにシームレスにして配信側の負担なく良いコンテンツが作れるか、がポイントになってくると思います。

参考までに作業したYouTube動画です。だいたい中2日くらいでここまでできます。

UDトーク講習会 in 北海道(帯広編:前半)

UDトーク講習会 in 北海道(帯広編:後半)

【トピック】音声認識でいわゆる文字や文章作成に関わる仕事はどうなるのか?

音声認識でいわゆる文字や文章作成に関わる仕事はどうなるのか?よくいろんなところで議論される内容だと思います。

結論から言うと間違いなく仕事は「増えます」です。これは明らかです。どのカテゴリでもそうですが、機械化が進むと「人間にしかできない仕事」と言うのを担当することになります。

なので仕事の内容は変わってきます。音声から文字にする部分、ここは音声認識の仕事になるでしょう。音声認識でやるようになるとそれ前提で音を収録するようになるので認識率は高くなります。むしろ人が手で打った方が間違いが多くなります。(もう現在でも音声認識の方が正しいときが多いですが)

じゃ「人間にしかできない仕事」とはなにか?と言うと、その結果が「正しいかどうか」を精査する仕事になります。「適切かどうか」の判断も人間の仕事になります。音声認識や翻訳で自動化され始めるとデータの量が膨大になり、より人間がやるべき仕事が増えます。「要約」をする仕事もここに含まれてきます。もちろん将来的は要約も自動化されますが、された結果がいいかどうかを判断できるのは人間の仕事ということになります。なのでどれだけ技術が進歩しても人間の仕事は「人間にしかできない仕事」と言うような形を変えて残り続け、データ量が増えるにつれて仕事も増えていきます。

面白いことに自動化が進んでくると、人間の手を使う仕事は非常に「贅沢である」と言うことになってきます。例えば音声認識を使わないで全部人力でタイピングしてやることはお金をかけた贅沢な運用となります。「あそこは全部人手でやっててなんて贅沢なのかしら」なんて(笑)。例えば手書きで紙に起こすってなるとほんとに贅沢なことになります。パソコンのデータなのであればそれを手で打とうが音声認識でやろうが同じになり、人間の手でやったのと自動でやったの比べると10倍以上コストが違うでしょう。その後に人が見て直すと言う仕事が入るなら同じことなので安い方を選択する人が増えてくると言うことになります。

そうすると「コストが下がって仕事にならなくなる」と言う人もいますが、上がってくるデータ量が膨大になるので仕事は溢れかえります。「文字を起こす仕事」は確実になくなりますが、「間違いを訂正して適切にする仕事」はビジネスとして成り立つほどになるでしょう。

去年から音声認識が実用化され、UDトークもビジネスシーンで一気に普及しました。そして今年がまさに転換期で、文字に関わる仕事に携わっている人たちは色々な選択を迫られると思います。それにワクワクする人もいれば恐れる人もいるでしょう。でもこれはむしろ人間にしかできないことに価値を見出せるいいチャンスでもあると言うことなのです。

【不具合報告】編集をすると全部ひらがなになってしまう

iOS ver.5.5.5である設定下のもとで編集すると全部ひらがなになってしまう不具合が見つかりました。現在修正してすぐにver.5.5.6を申請しております。

トーク設定で「読み仮名を表示する」がオンを入れていると内容を編集したタイミングで全部ひらがなになってしまいます。

この現象の回避策ですが

読み仮名を出さなくてもいい場合
(方法1)「読み仮名を表示する」をオフにする。

読み仮名を出したい場合
(方法2)「読み仮名を表示する」をオンにしたあと、メニューの「漢字かな設定」で適当な学年を選んだ後、左下に出て来るアイコンで漢字かな設定をオフにする。

このどちらかになります。
ver.5.5.6がリリースされたらすぐにバージョンアップお願いします。

「発見!体験!工夫がいっぱい ユニバーサルデザイン」

学研から「発見!体験!工夫がいっぱい ユニバーサルデザイン」にUDトークが掲載、出版されました。
アプリの紹介で見開きとさらに山梨県駿台甲府中学の本山くんの特集で見開き、なんと4ページです。
子供向けの本とのことですが、内容は実に充実していて、昨年開館したユニバーサルシアター「シネマ・チュプキ・タバタ」さんも掲載(ここにもUDトークが!)
ぜひご覧になってください!

p.s
東洋大学ライフデザイン学部教授の川内美彦先生監修でのユニバーサルデザインの書籍は多数出ています。その中の一つにこのアプリを取り上げていただきほんとに嬉しく思います!

購入はこちらから

【運用レポート】「みんなに知ってほしいソフトバンクのこと」

「みんなに知ってほしいソフトバンクのこと」。2018年度のソフトバンク障害者採用パンフレットにUDトークが掲載されました。現在、全国の多数の拠点でUDトークを導入してご活用いただいております。さまざまな取組の中の一つにこのUDトークも加えていただきとてもうれしく思います。

今後ともよろしくお願いします!

【トピック】新アプリリリース「UDコネクト」

UDトークで記録しやすくなる連携アプリをリリースしました。

UDトークで、QRコードを作成してトークの公開/参加をしたとき、トークを作成した端末(親)を起動しておかないと記録が保存できません。あと記録は翌日には消えているので「あ!保存し忘れた」などのこともあると思います。

そんなときにこのアプリです。

・トークを公開してQRコードを作成できます。
・公開停止時に内容をすべて保存します。
・日付で履歴管理ができます。
・いつでも選択して書き出せます。

ピンポイントで利用に適したケースがあると思います。特に同じ名称で繰り返し打ち合わせをするケースや、文字支援でサポートに入る時や、遠隔サポートでの記録の管理など。

ピンと来たらお使いください!

オンラインマニュアルはこちら
https://teachme.jp/contents/1918002

App Store
https://itunes.apple.com/jp/app/udコネクト/id1209720461?mt=8