微妙な筋肉の動きを使えば言葉を口にしなくても音声を認識するツールが発明されたとのこと。これは凄い、欲しいです。 オススメ記事 頭の中でつぶやいた「内言」を顔の筋肉から読み取って会話できるシステムをMITが開発 by Gigazine 人間は声に出して外に発する言葉の他に、自分の脳(あるいは心)の中だけに存在して思考の道具などとして用いられる言葉「内言」を持っています。この内言は自分以外にはまったく伝わらないものなのですが、マサチューセッツ工科大学(MIT)内の研究所「MITメディアラボ」では、顔と顎の筋肉の微細な電気信号を読み取って人工知能(AI)で解析することで内言の内容を読み取って音声として発することができる装置の研究開発が進められています。 Computer system transcribes words users “speak silently” | MIT News http://news.mit.edu/2018/computer-system-transcribes-words-users-speak-silently-0404 内言を読み取れる装置は、以下の写真のように耳から顎のラインに沿って装着されるデザインになっています。唇の下あたりと顎に接触する部分には4つの電極が内蔵されており、人間が内言を発した時に起こる筋肉の微細な動きを電気信号で検知できるようになっています。この筋肉の動きは人間の目には全く見えないものですが、機械学習を行わせたAIで電気信号を解析することで、簡単な単語であれば解読できるレベルに達しているそうです。 また、この装置は骨伝導ヘッドセットの役目も兼ねています。外部から送られてきた音声はトランスデューサーによって振動に変換され、頭蓋骨を介して内耳を直接振動させることで音が聞こえるようにします。つまり、この装置はマイクの代わりに4つの電極で人間の心の中で話された言葉を音声に変換し、相手から返ってきた言葉をスピーカーの代わりに骨伝導によって耳に届けることで、会話によるコミュニケーションを可能にする装置というわけです。 写真のモデルで、実際のこの装置を開発しているArnav Kapur氏は「モチベーションになったのは、『インテリジェント拡張デバイス』を創りたいというアイデアでした」と語っています。「コンピューターによる解析技術を用いることで、人間の意識とコンピューターが溶け合って1つに融合し、自分の認知を内部で拡張する装置が作れないか?」という発想からこの研究が始まったといいます。 内言が人間の筋肉の動きに現れることについては1950年代から研究が進められてきており、1960年に広まった速読術の中で大きく注目されることになりました。速読では、目に入った文字を心の中で音読してしまう「サブボーカリゼーション」を排除することが目標の1つとされており、その影響が顔の筋肉の微細な動きに現れます。 便利な音声入力 使ったことのある人はよくわかると思いますが、スマートフォンやパソコンについている音声入力機能は物凄いスピードで進化しています。いまや、自分が独り言のように話す内容についてはかなりの精度で読み取ってくれますし、前後の文脈を理解して漢字変換も後から修正したりして正しいものを出すようになってきています。 例えば「ハシをつかってご飯を食べる」といったとき、最初にはハシは橋として変換されるかもしれませんが、ご飯や食べるといったキーワードに対応して後から箸に変換を変更することもあるのです。これは本当に凄いですし、数年前まではこのレベルではまったくなかったので技術の進歩というのは本当に凄いと思います。 実際、私自身様々なシーンで口述筆記をします。もはや手を使って打つよりさほど遅くないし、なにより手が疲れないからです。まだまだインタビューなど複数の人が話すときなどは入力がうまくいかなかったり、雑音が多いと機能しなかったりするので人間の耳がいかに優れているのかよく分かるなと思いつつも、今後の技術に期待出来る素晴らしい分野が音声入力です。 外では出来ない しかし、なんといってもこの音声入力の最大の課題は周りに人がいないことが前提であることです。人が近くにいるとき何かをブツブツ話すというのもぞっとしない話ですし、なによりそれが私的な情報であることも多いわけですから、人には聞かれたくないこともたくさんありますよね。そういう意味で、今回の発明は本当に凄い。 もはや音として外に出さなくても、頭に考えていることが微弱な形で顔を動かしているその情報を用いて、話しているのと同じように入力することが出来るのですから。外でも気軽に音声入力が出来ますし、まさに「思考をそのままテキスト化する」ことが出来るわけです。これは物凄く便利ですよ。自分も欲しいです、普段色んな場所で考え事をしているので、それを手を使わずどんどん保存していけるのですから。 しかしちょっとSFチックですが、人が考えていることを盗み見るためにこういうアイテムを使うことも可能なのかもしれませんよね。本当にこれからどんな技術が社会を変えていくんでしょうか。楽しみです。