麻省理工新科技:不開口就能說話的耳機(jī)
這樣一個(gè)耳機(jī),幾乎是我們過去幻想中存在的東西,現(xiàn)在卻離我們不再遙遠(yuǎn)。
不用開口就能互相交流,我相信你一定在一些小說或電影中看到過類似的橋段,最近,來自麻省理工的一個(gè)研究團(tuán)隊(duì)開發(fā)出了一項(xiàng)新的技術(shù),讓這種愿望得以成真。
這個(gè)被稱為 AlterEgo 的裝置由計(jì)算機(jī)和可穿戴設(shè)備兩部分組成,計(jì)算機(jī)部分負(fù)責(zé)信息計(jì)算,而可穿戴部分負(fù)責(zé)信息采集以及傳送。如你所見,和我們?nèi)粘R姷降目纱┐髟O(shè)備差別很大。雖說是原型機(jī),但它看起來倒更像是用來矯正人臉部肌肉的儀器。
這個(gè)儀器實(shí)際上也有兩部分,一部分是用于捕捉面部和下頜神經(jīng)肌肉信號的傳感器,通過貼合面部部位從而感知神經(jīng)運(yùn)動;另一部分是骨傳導(dǎo)耳機(jī),用于將信號處理結(jié)果反饋給佩戴者。
按照官方說法,研究人員發(fā)現(xiàn),人的語言信號實(shí)際上是內(nèi)部開始觸發(fā),也就是當(dāng)你要張嘴說話之前,神經(jīng)信號就已經(jīng)出現(xiàn),并到達(dá)下頜部位。這種人眼無法察覺到的信號是可以被捕捉到的,也因此,只要能讓機(jī)器理解這種電信號的意義,它就會“理解”你說的話,按照這一思路,你就不難理解為何原型機(jī)這樣設(shè)計(jì)。
雖然聽上去不好理解,但只要看看它能做什么你就會知道有多神奇了。在研究人員設(shè)想中,這一設(shè)備是一種新的人機(jī)交流平臺,可以讓你在不開口說話的情況下進(jìn)行三種操作。
第一種是物聯(lián)網(wǎng)操控,比如你看電視或者聽音樂時(shí),只需要腦海中想要進(jìn)行操作,就能不張嘴,直接控制這些操作,像換電視頻道,切歌這些操作就非常簡單,這時(shí)的 AlterEgo 相當(dāng)于如今的智能音箱,當(dāng)你不再需要張嘴就能控制家電了。
第二種功能是充當(dāng)個(gè)人助理,語音助手出現(xiàn)這么多年,可我們還是不太習(xí)慣在公共場合喚醒并操控,但有了這個(gè)儀器,你只需要在心里默念一些任務(wù),計(jì)算機(jī)就會“聽懂”并告訴你結(jié)果,比如查詢時(shí)間,或者詢問天氣,甚至于在超市買東西算總價(jià),都可以直接心里默念,讓 AlterEgo 的內(nèi)置計(jì)算器告訴你結(jié)果,按照官方設(shè)想,這個(gè)不用開口的個(gè)人助理可以為你翻譯,幫你搜索,查單詞,進(jìn)行運(yùn)算,以及設(shè)定鬧鐘,你甚至可以在下棋時(shí)讓計(jì)算機(jī)告訴你下一步要怎樣走最合適。
第三種功能是社交。雖然聽上去有點(diǎn)夢幻,但事實(shí)上,當(dāng)身邊的人都佩戴上 AlterEgo 設(shè)備時(shí),不用開口就能聽到對方想表達(dá)的東西也是可以實(shí)現(xiàn)的事情,這就相當(dāng)于將原本要說的話直接傳遞到對方的耳機(jī)里,和第一種方式物聯(lián)網(wǎng)的交流有點(diǎn)類似。
設(shè)想當(dāng)中適合的場景很多
以上三種,都是借助于肌肉傳遞出的電信號,通過人工智能對于電信號的理解做出相應(yīng)的判斷,說到底,這和人工智能助手理解語音操作的邏輯類似,但卻并不容易。
麻省理工學(xué)院媒體實(shí)驗(yàn)室(MIT Media Lab)學(xué)生 Arnav Kapur 表示這個(gè)原型最初目的是構(gòu)建一個(gè)“IA 設(shè)備”,即“ intelligence-augmentaTIon”設(shè)備,正如它的英文名 AlterEgo 所代表的意義“另一個(gè)自己”一樣,他們設(shè)想這一設(shè)備將來會成為人類真正的助手,或者用 Kapur 的話說,“在某些方面融合人與計(jì)算機(jī),并讓我們認(rèn)知擴(kuò)展。”
從現(xiàn)實(shí)意義出發(fā),項(xiàng)目指導(dǎo)老師 PatTIe Maes 教授認(rèn)為,隨著當(dāng)前人與智能手機(jī)越來越密切的關(guān)系,也帶來了一定的破壞性。比如在人和人交流時(shí)一旦需要搜索某些結(jié)果或者查詢信息,交流就會被手機(jī)強(qiáng)制打斷,而新的交互體驗(yàn)無疑可以改變這種破壞性,它未必會替代手機(jī),但它可以做的更好。
當(dāng)然,從目前的研究來看,AlterEgo 也存在不小挑戰(zhàn),盡管自 19 世紀(jì)以來研究者就發(fā)現(xiàn)了身體語言表達(dá)和神經(jīng)肌肉信號之間存在關(guān)聯(lián),但這種關(guān)聯(lián)究竟怎樣表達(dá),如何能讓計(jì)算機(jī)將神經(jīng)肌肉信號轉(zhuǎn)化成正確的語言,這些都是困難之處。即便目前,研究人員發(fā)現(xiàn)了下頜的特定位置具有可以傳達(dá)電信號的能力,但要徹底將這種可能性放大到完全可用的情況,還需要很多努力。
另外,你可能會好奇設(shè)備的準(zhǔn)確率,研究人員對 10 名測試者進(jìn)行了 15 分鐘的測試,讓他們通過配搭設(shè)備計(jì)算數(shù)學(xué)題,發(fā)現(xiàn)經(jīng)過 AlterEgo 的系統(tǒng),目前在這項(xiàng)目上的準(zhǔn)確度為 92%,這聽上去是一個(gè)不錯(cuò)的消息。
而說到不用張嘴就能傳遞信號的其它運(yùn)用方式,來自佐治亞理工學(xué)院的教授 Thad Starner 說,“比如在機(jī)場的停機(jī)坪上要控制飛機(jī),那時(shí)候的巨大噪音通常無法用語音交流,想象一下在類似情況下,當(dāng)周圍環(huán)境是高噪聲時(shí),航空母艦、發(fā)電廠、印刷機(jī)等地方,這都是一個(gè)有意義的系統(tǒng)。”他還認(rèn)為在一些身體有殘疾的人群中,這個(gè)設(shè)備能幫助他們實(shí)現(xiàn)更好的生活。
盡管 AlterEgo 還處在原型階段,外形也很夸張,不適合佩戴在公共場合。但這項(xiàng)研究無疑為我們展現(xiàn)了把人工智能技術(shù)的另一種用途,并嘗試讓人和機(jī)器進(jìn)一步“融合”,當(dāng)相關(guān)技術(shù)不斷迭代并成熟時(shí),相信終有一天,我們會看到令人大吃一驚的消費(fèi)品。





