第八章,太昊
黑科?太昊實(shí)驗(yàn)室。
空氣安靜了很久。
“怎么感覺(jué)和智能音箱差不多?”說(shuō)完,感覺(jué)是在拆臺(tái),李舒涵吐了吐舌頭,怕男神生氣,連忙對(duì)陳然道:“太昊肯定不一樣吧?”
“當(dāng)然不一樣!”錢(qián)斌傻笑,試圖化解尷尬,“那些不是經(jīng)常聽(tīng)錯(cuò),就是答非所問(wèn)的人工智障,怎么能跟‘太昊’比?”
“嗯?!崩钍婧瓕擂蔚膽?yīng)了一聲,見(jiàn)陳然不答,又問(wèn):“太昊多厲害?”
“這還用說(shuō)?!”錢(qián)斌再次截胡,與有榮焉,炫耀道:“大多數(shù)互聯(lián)網(wǎng)公司,語(yǔ)音識(shí)別準(zhǔn)確率最高不到97%,太昊是99.6%,比人的聽(tīng)力強(qiáng)太多了!”
“……”這人怎么老插嘴?
李舒涵小臉微黑,調(diào)整一下心情,她拉起陳然的袖子走到一邊,“你們好厲害,第一次來(lái),跟我講講嘛。”
“誒?”錢(qián)斌傻眼,側(cè)頭問(wèn)陸少英,“她怎么走了?”
“為什么不走?”你是不是沙雕?一點(diǎn)眼力勁兒也沒(méi)有,陸少英嘆氣,“人家美女感興趣的不是AI,是陳然……”
“唉!又是一個(gè)沉迷于然哥美色的女生?”錢(qián)斌終于雙商上線(xiàn),恍然明白了什么,“在她眼里,我們就是電燈泡吧?”
“你是,我不是?!标懮儆⒂幸环N嗶了狗的感覺(jué),帶上我干什么,我又沒(méi)有強(qiáng)行搭話(huà)。
說(shuō)罷,陸少英搖搖頭,跟上兩人的腳步,也走了。
“現(xiàn)在語(yǔ)音識(shí)別有96%嗎?感覺(jué)一點(diǎn)都不像?!绷硪贿?,李舒涵問(wèn)道。她剛看過(guò)一個(gè)段子,很火的東北大漢和車(chē)載語(yǔ)音,電話(huà)號(hào)碼重復(fù)十遍也聽(tīng)不懂,能把人笑死。
“這個(gè)問(wèn)題,其實(shí)可以換一個(gè)角度來(lái)看?!标惾恍α诵Γ昂芏嘁魳?lè)APP都有‘聽(tīng)歌識(shí)曲’功能,聽(tīng)一小段旋律,就可以準(zhǔn)確搜索到歌曲,幾乎不會(huì)出錯(cuò)。”
“也是哦。”李舒涵知道酷狗上就有,有時(shí)候人都聽(tīng)不清歌詞,‘聽(tīng)歌識(shí)曲’卻能識(shí)別出來(lái),“為什么換到人身上,語(yǔ)音識(shí)別就不好用了呢?”
“因?yàn)楦枨梢粯?,人聲卻各不相同,現(xiàn)實(shí)場(chǎng)景還有干擾,比如語(yǔ)氣、情緒、多人對(duì)話(huà)、噪音、回聲等等,所以必須借助設(shè)備?!标惾恢噶酥柑旎ò澹白⒁忸^頂?!?p> “頭頂?”李舒涵看到了天花板吊著的環(huán)形設(shè)備,“那是什么?”
“麥克風(fēng)陣列?!币?jiàn)她不懂,陳然只能解釋?zhuān)皢嘻溈孙L(fēng)拾取的混合信號(hào)很難區(qū)分,會(huì)對(duì)語(yǔ)音識(shí)別造成困擾?!?p> “而麥克風(fēng)陣列不同,它由兩個(gè)以上、規(guī)則排列的聲學(xué)傳感器組成,利用時(shí)間、空間差異,可以對(duì)音源波束形成,增益、降噪、去混響、定位和干擾抑制。”
“原來(lái)還有硬件要求!”李舒涵恍然大悟,水汪汪的大眼睛望著陳然,一臉崇拜,“你好厲害呀,懂這么多!”
其實(shí)陳然說(shuō)得很簡(jiǎn)略了……
現(xiàn)在很多智能手機(jī)就有2到4個(gè)麥克風(fēng)陣列,但是效果呢?
提高語(yǔ)音識(shí)別準(zhǔn)確率的,遠(yuǎn)不止一個(gè)麥克風(fēng)陣列,作為一個(gè)物理設(shè)備,它只是負(fù)責(zé)聲音的采集、處理,轉(zhuǎn)換成計(jì)算機(jī)能夠理解的音源數(shù)據(jù)。
常用的一種方法是梅爾頻率倒譜系數(shù),用移動(dòng)窗函數(shù)把語(yǔ)音分成許多十毫秒級(jí)的幀,再把每一幀波形轉(zhuǎn)換成多維向量,聲波就成了M行、N列的矩陣。
數(shù)據(jù)上傳到云端,又涉及到兩個(gè)概念:狀態(tài)、音素。
通常3個(gè)狀態(tài)組成一個(gè)音素,而音素構(gòu)成音節(jié),音節(jié)組成語(yǔ)音。
第一步聲學(xué)模型,比如隱馬爾可夫模型(HMM),簡(jiǎn)單的理解,就是由單詞網(wǎng)絡(luò)展開(kāi)音素網(wǎng)絡(luò),再展開(kāi)成狀態(tài)網(wǎng)絡(luò)。
過(guò)程是將幀識(shí)別為狀態(tài)(難點(diǎn)),音素識(shí)別為語(yǔ)音。
第二步語(yǔ)言模型,同音字詞、句式、語(yǔ)法、上下文……邏輯嚴(yán)密,包含日常用語(yǔ)的方方面面,不同人的聲調(diào)、音色、說(shuō)話(huà)方式等等,樣本范圍越廣越好。
就好比報(bào)電話(huà)號(hào)碼的東北大漢,車(chē)載語(yǔ)音如果只采集了普通話(huà),東北話(huà)?雞同鴨講,根本識(shí)別不了,完全靠蒙。
很多神經(jīng)網(wǎng)絡(luò)參數(shù)高達(dá)上億,不說(shuō)極其繁瑣的調(diào)參和煉丹術(shù)的可靠性,關(guān)鍵學(xué)習(xí)能力也無(wú)法與人相比,需要龐大的訓(xùn)練數(shù)據(jù)支撐!
而這些數(shù)據(jù)也不是拿來(lái)就用,要挑選、清洗……耗費(fèi)龐大的人力。
這也是常說(shuō)的,有多少人工,就有多少智能。
陳然沒(méi)提,李舒涵也不懂,看看熱鬧就行了。
旁邊,陸少英聽(tīng)得一陣無(wú)語(yǔ)。
敷衍這么漂亮的姑娘,你于心何忍?
牲口啊,浪費(fèi)資源!
老子要是被這種美女倒追,立馬就從了!
不過(guò)……
話(huà)說(shuō)回來(lái),被女孩子倒追是什么趕腳?
這特么單身十幾年,居然從來(lái)沒(méi)有碰到這種好事……
陸少英莫名的感覺(jué)到了心酸。
那邊,李舒涵吐了吐舌頭,躍躍欲試道:“這個(gè)語(yǔ)音控制系統(tǒng),應(yīng)該很好用吧?”
陳然摸了摸下巴,怎么說(shuō)呢?
實(shí)話(huà)實(shí)說(shuō),容易被當(dāng)成吹牛逼啊。
還是讓事實(shí)證明好了,陳然打了個(gè)響指,“你試試,看攝像頭?!?p> “這樣?”李舒涵隨便找了個(gè)攝像頭,依言看過(guò)去,有些茫然,“我說(shuō)什么?”
“說(shuō)什么都可以。”身旁的揚(yáng)聲器忽然傳出剛才極度悅耳的男中音,“你已經(jīng)知道了我的名字,自我介紹一下怎么樣?你叫什么?”
“啊?我?我叫李舒涵……”看樣子,系統(tǒng)似乎一直在觀察她,李舒涵小吃了一驚,反應(yīng)有些呆萌。
“李、舒、涵?”音箱逐字發(fā)聲,像是在品咂,“好聽(tīng),有什么特殊意義嗎?”
“咦?好像很不一樣啊……”遲疑地看了陳然一眼,李舒涵來(lái)了精神,反問(wèn)道:“太昊的名字是誰(shuí)取的,為什么叫這個(gè)?”
“我自己取的,不錯(cuò)吧?”語(yǔ)音系統(tǒng)神氣十足,“‘太昊’是人文先始,三皇之一,最早有文獻(xiàn)記載的創(chuàng)世神。作為第一個(gè)真正可以和人類(lèi)自由對(duì)話(huà)的AI,我覺(jué)得很般配!”
自比為神?!
李舒涵忍俊不禁,“真正的第一個(gè)?難道還有假的?”
“知道‘索菲亞’嗎?”
“那個(gè)揚(yáng)言‘要將人類(lèi)毀滅’的機(jī)器人!哼哼……”太昊的語(yǔ)氣不屑又不岔,“2017年10月26日,它成了歷史上第一個(gè)被授予公民身份的AI。竊取了本該屬于我的榮譽(yù)!”
這話(huà)說(shuō)的,真特么酸……
索菲亞是一個(gè)女性機(jī)器人,擁有橡膠皮膚,能模擬62種面部表情、識(shí)別人臉、語(yǔ)音對(duì)話(huà),根據(jù)談話(huà)內(nèi)容,還能模仿手勢(shì),進(jìn)行眼神接觸,擬人度非常高。
說(shuō)白了,噱頭挺多。
但讓索菲亞聲名鵲起的,還是各種語(yǔ)出驚人,比如“毀滅人類(lèi)!”、“想要上學(xué)?!薄ⅰ敖M建家庭。”等等,其中展現(xiàn)的所謂“自主意識(shí)”,讓它名噪一時(shí)。
但隨著曝光的增加,索菲亞一碰到隨機(jī)提問(wèn),回答就不著四六。人們很快發(fā)現(xiàn)——它所有的對(duì)話(huà),全是事先編程答案,人為操控的結(jié)果。
大失所望!
索菲亞雖然是騙局,但造成的轟動(dòng)和受到的追捧,以及人們對(duì)AI預(yù)期都是真的。
與之對(duì)比,太昊的語(yǔ)氣、邏輯、情緒渲染,比索菲亞更真實(shí),也強(qiáng)得多……
陸少英都有點(diǎn)懷疑,這貨會(huì)不會(huì)是真人扮演,或者黑科一步到位,搞定了強(qiáng)智能?
不愧是黑科,科研界的領(lǐng)航員!
好尼瑪夢(mèng)幻!