国产精品无码制服丝袜-亚洲中文久久精品无码ww16-欧美大片aaaaa免费观看-亚洲日韩欧美内射姐弟

仿生系列3--機(jī)器人的聽(tīng)力系統(tǒng)

仿生系列3--機(jī)器人的聽(tīng)力系統(tǒng)

 

 

我們的耳朵是一個(gè)高度復(fù)雜的系統(tǒng),同時(shí)也是一個(gè)高精度的測(cè)量儀器。普通人的每只耳朵都有約15 500個(gè)毛細(xì)胞,可以分辨出400 000余種音調(diào)。經(jīng)過(guò)專(zhuān)門(mén)訓(xùn)練的人甚至可以直接判斷他所聽(tīng)到聲音的音調(diào)值。但是,人類(lèi)的聽(tīng)覺(jué)有一定的頻率范圍限制。舉例來(lái)說(shuō),在水下負(fù)責(zé)錄制鯨詠(又名鯨歌)的潛水員需要佩戴專(zhuān)業(yè)的擴(kuò)音收音裝置,因?yàn)轹L詠的頻率最高可達(dá)280KHz,而人類(lèi)可以聽(tīng)見(jiàn)的頻率范圍是16Hz~20KHz。雖然專(zhuān)業(yè)的擴(kuò)音收音裝置可以錄制到更廣的聲音頻率范圍,但是只有人類(lèi)可以專(zhuān)注于某種特定的聲音,并且準(zhǔn)確定位聲音的來(lái)源。

耳朵:立體聲定位

無(wú)論聲音來(lái)自前面、后面,還是側(cè)面,雙耳都可以迅速定位其來(lái)源和距離。人耳的兩種關(guān)鍵能力正在被科學(xué)家們遷移到機(jī)器人身上,一種是對(duì)于耳間時(shí)間差(Interaural Time Difference,ITD)的處理,一種是對(duì)于耳間聲壓差(Interaural Intensity Difference,IID)的處理。由于人的雙耳分布在頭部?jī)蓚?cè),所以頭部在聲音傳遞的過(guò)程中形成了天然的障礙。因此兩只耳朵會(huì)獲得不同的聲壓,而且大部分聲音不會(huì)同時(shí)進(jìn)入雙耳,例如來(lái)自左側(cè)的聲音會(huì)先進(jìn)入左耳,然后繼續(xù)以340m/s的速度進(jìn)入右耳,形成時(shí)間差。在聲學(xué)上,這種現(xiàn)象被稱(chēng)為頭影效應(yīng)Head-Shadow Effect)。慕尼黑科技大學(xué)仿生學(xué)教授Werner Hemmert博士表示:人耳可以分辨出0.01ms的時(shí)差,但是由于軟件的處理速度較慢,所以目前的機(jī)器人只能精確到10ms級(jí)別。

柏林洪堡大學(xué)神經(jīng)機(jī)器人實(shí)驗(yàn)室主任Manfred Hild博士對(duì)CHIP雜志表示:人的立體聲聽(tīng)覺(jué)也受到耳朵肌肉和肩膀的影響??茖W(xué)家們已經(jīng)有意識(shí)地將人耳的完整結(jié)構(gòu)運(yùn)用于人工智能系統(tǒng)。因此,很多機(jī)器人的頭部設(shè)計(jì)與人的大小和形狀相當(dāng),盡可能地以人類(lèi)的方式利用頭部?jī)蓚?cè)的麥克風(fēng)獲取立體聲信號(hào)。

當(dāng)機(jī)器人身處預(yù)先專(zhuān)門(mén)準(zhǔn)備好的測(cè)試環(huán)境中時(shí),可以利用立體聲定位功能,像人一樣快速定位聲源。但是,當(dāng)機(jī)器人身處同人一樣的真實(shí)日常生活環(huán)境中時(shí),聲源定位就不是一件簡(jiǎn)單的事情了。機(jī)器人與人類(lèi)最關(guān)鍵的區(qū)別就是缺乏環(huán)境適應(yīng)和理解能力。一個(gè)我們熟知的現(xiàn)象就是雞尾酒效應(yīng):當(dāng)許多人在聚會(huì)場(chǎng)所聊天,同時(shí)還伴隨著從音響中散播出來(lái)的背景音樂(lè)的時(shí)候,人類(lèi)依然可以?xún)H專(zhuān)注于某一個(gè)對(duì)話。但是這種場(chǎng)合對(duì)于機(jī)器而言就是難以逾越的挑戰(zhàn)了。由于機(jī)器人無(wú)法確定哪個(gè)聲源是真正需要關(guān)注的而無(wú)法快速過(guò)濾掉所有無(wú)關(guān)的頻率,所以此時(shí)的環(huán)境里只有一種不可識(shí)別的聲音——噪音。

人工智能:聽(tīng)覺(jué)的妥協(xié)

科學(xué)家們根據(jù)應(yīng)用需求的不同,使用了很多巧妙的方法使機(jī)器人獲得更好的聽(tīng)覺(jué)表現(xiàn)。其中,很多人工智能研究中使用到的成熟方法,已經(jīng)成功轉(zhuǎn)換為市場(chǎng)上的可行解決方案。有幾項(xiàng)優(yōu)秀的音頻過(guò)濾方案已經(jīng)開(kāi)始在移動(dòng)終端設(shè)備、車(chē)載免提裝置和遠(yuǎn)程會(huì)議系統(tǒng)上嶄露頭角。但是柏林洪堡大學(xué)的機(jī)器人專(zhuān)家Hild告訴我們:目前來(lái)看效果并非總是令人滿(mǎn)意,例如汽車(chē)發(fā)動(dòng)機(jī)的聲音會(huì)干擾到車(chē)廂內(nèi)的整個(gè)聲音頻帶,所以無(wú)法通過(guò)頻率過(guò)濾技術(shù)簡(jiǎn)單地將其消除掉,必須配合聲源定位技術(shù)才可以更好地工作。

最新解決方案就是使用盲信號(hào)分離(Blind Signal Separation)技術(shù),制造商采用多個(gè)分散放置的麥克風(fēng)協(xié)助錄制令人煩惱的噪音,然后將其過(guò)濾掉,只留下司機(jī)的聲音。智能手機(jī)制造商也使用這個(gè)原理,通過(guò)機(jī)身背部的麥克風(fēng)與機(jī)身正面的麥克風(fēng)配合過(guò)濾掉雜音。慕尼黑科技大學(xué)仿生學(xué)教授Hemmert說(shuō):我們目前的研究遇到了瓶頸,雖然新的解決方案取得了很大的進(jìn)步,但是距離真正突破性的進(jìn)展,還有很長(zhǎng)的路要走。其實(shí),最關(guān)鍵的原因是日常生活中的噪音幾乎是無(wú)規(guī)律的,而通過(guò)人工智能實(shí)現(xiàn)的機(jī)器耳朵無(wú)法適應(yīng)不同的情景。

對(duì)于語(yǔ)音識(shí)別程序而言,這個(gè)過(guò)程并沒(méi)有什么障礙,通常只要將麥克風(fēng)至于嘴下即可,此時(shí)系統(tǒng)可以識(shí)別最大的聲源。但是語(yǔ)音識(shí)別程序,尤其是非特定語(yǔ)音識(shí)別系統(tǒng),比如導(dǎo)航系統(tǒng)面臨著另一個(gè)很有難度的問(wèn)題,就是它們需要識(shí)別講話者的嗓音,保證輸入的準(zhǔn)確度,然后結(jié)合龐大的語(yǔ)義數(shù)據(jù)庫(kù)和糾錯(cuò)能力,將語(yǔ)音轉(zhuǎn)換為可理解的文字。

結(jié)論

Hild對(duì)目前的進(jìn)展并不樂(lè)觀,他說(shuō):我們必須回頭審視過(guò)去的發(fā)展歷程,理解只有機(jī)器人可以并行處理所有信號(hào)數(shù)據(jù),并根據(jù)這些數(shù)據(jù)進(jìn)行綜合判斷的時(shí)候才可能取得重大的突破。其實(shí),即使這樣也遠(yuǎn)遠(yuǎn)不夠,因?yàn)槲覀儾⒎莾H通過(guò)耳朵聽(tīng)聲音,還會(huì)通過(guò)眼睛定位對(duì)話者、移動(dòng)自己的頭部找到最好的試聽(tīng)位置。因此人工智能機(jī)器人必須將動(dòng)力系統(tǒng)、聲音信號(hào)和視覺(jué)信號(hào)結(jié)合起來(lái),才能有機(jī)會(huì)擁有人類(lèi)這樣敏銳的耳朵。


最新消息
 

然而,據(jù)最新消息,由日本研制的“聽(tīng)力理解分析機(jī)器人HEARBO已經(jīng)很好地突破了技術(shù)瓶頸,據(jù)稱(chēng)該機(jī)器人能同時(shí)區(qū)分出四種不同類(lèi)型的聲音,并作分析。舉個(gè)例子:當(dāng)4個(gè)人同時(shí)說(shuō)話,機(jī)器人通過(guò)分析音頻,能區(qū)分出哪個(gè)聲音來(lái)源于哪個(gè)人;3個(gè)人在玩石頭,剪刀,布的游戲,當(dāng)3個(gè)人同時(shí)說(shuō)話,機(jī)器人則可以判斷出贏家是誰(shuí)。

可見(jiàn),仿生機(jī)器人技術(shù)已經(jīng)越來(lái)越先進(jìn),但離我們的預(yù)期效果還差很遠(yuǎn),相信在不久的將來(lái),智能機(jī)器人能夠達(dá)到電影中《我,機(jī)器人》那樣智能,并且能和人類(lèi)并肩作戰(zhàn)。

 

 

澳博機(jī)器人微信公眾號(hào)
掃一掃
分享到朋友圈
或者
手機(jī)上繼續(xù)看