東京デフリンピックの会場となっていた駒沢オリンピック公園内では
色んなブースやステージが有り、盛り上がっていました。
そんな中、自分が気になったブースをご紹介。それがこれ
「YYSystem」というブース
簡単に説明すると、AIが判断して周囲の音を文字化してくれるという
そういうアプリなのですが、同じようなアプリが沢山有る中で
レベルが抜けているというか、とても高性能なアプリでした。
実際に何が凄かったのか?実例を挙げると・・・
・音声の変換レベルが高い!
音声を最後までしっかり聞いて、文脈を理解して文字起こしをしているようで
同音異義語に惑わされず、変換してくれていました。
実際に人が聞いて入力を行うPCでの要約筆記には敵わずとも、それにかなり近い
レベルにまで達しているんじゃないでしょうか?
例としてよくクイズ番組であるシーンを、文字化するとして・・・
Q:田中さんがサッカーを始めたのは何歳の頃でしょう?
1.11歳 2.12歳 3.13歳 4.14歳
よく有るダメな変換パターンとして
「1 、11歳 、22歳 、33歳 、44歳」となってしまうパターン
そして正解は12歳でした~なんて時に
司会者というか、お話する人が正解をドキドキさせるために
「せいかいは、じゅう・・・(ため、間)・・・にさいでした~」なんて
演出をすると文字変換画面には
「正解は、102歳でした~」と表示されてしまうパターン(^^;
じゅうを10と一度変換されてしまうと、その後のに(2)に
対応が出来ないんですねぇ~?
↑この正解のやつは、実際に会場で他の変換システムが
これ系の表示をやらかしてました(笑)。
機械的に聞こえた音をそのままどんどん文字化すると、やはり多くの場合は
こうなってしまうようです。
しかし、さすがそこはAIでの変換、そういうちょっとしたミスに流されず
YYsystemは問題無く変換されているように感じました。
・その場の雰囲気を可視化してくれる
音声だけではなく、マイクが拍手の音を拾うと拍手のアイコンが
笑い声を拾うと笑いの絵文字が画面に表示されていました。
アイコンで雰囲気まで伝える事が出来るなんて、最高ですよねぇ~
会場ではお試し出来ませんでしたが、音声ではなく音にも反応しているため
救急車のサイレンや踏切の音、そういった大切な音も拾ってくれるとか・・・
これはろう者にとって、ありがたい機能では無いでしょうか?
・翻訳の機能が有る
これは音声の文字変換とはまた別の技術なのですが、拾った音を
30ヵ国以上の言葉に変換して表示されていました。
まぁ、海外の言葉は自分は苦手ですのでどこまで正確なのか?は
わかりませんが、日本語をしっかり意味まで理解して
文字起こしをしていますので、海外の言葉もそのクオリティで
翻訳してくれてるだろうという安心感は有りました。
・修正が出来る。
一般的な文字起こしのアプリや製品は、一度変換してしまうと
そのまま表示されて完了ですが、このYYSystemでは表示された文字が
もしも、それでも違ってるよ!なんてなった時に後から修正が出来るようです。
これ、よく有るのが同音異義語とかそういうのではなく
どちらも正解のパターンですよねぇ~?それを直せるのは強み?
名前や地名の漢字とか、完全一致は難しいですからねぇ~
例 かずや(一也?和也?和哉?),さかいし(坂井市?堺市?)
・両側から読める。
スマホ画面を上下に分割して、お相手と向き合っていても
同時に読める(鏡写し?)表示が可能でした。
見やすさの問題ですが、アプリを使う状況を色々と想定しているのは
凄いですよねぇ
・AIが文章を補完してくれる。
これも凄い機能でした。ある程度、これだ!という正解がある
文章を話す時に、思い浮かばなくてもAIが導いてくれます。
これは、ブースの担当者の方が見せてくれたのですが・・・
「学問のすゝめ」を書いた福沢ほにゃららが~
なんて発言をしても、画面には「学問のすゝめ」を書いた福澤諭吉が~
と表示してくれてました!漢字まで完璧!
とまぁ、こんな音声文字変換システム。今はまだ
月80時間までは無料で利用出来るそうです。使う使わないは別として
0 件のコメント:
コメントを投稿