最近,美國加州大學(xué)舊金山分校的科研團隊使用人工智能解碼系統(tǒng),把人的腦電波轉(zhuǎn)譯成英文句子,最低平均錯誤率只有3%。這項研究發(fā)表在《自然·神經(jīng)科學(xué)》雜志上。
參加實驗的4名志愿者都是癲癇患者,他們由于治療需要在大腦表面植入了數(shù)百個微電極。研究人員正是利用這些微電極陣列來記錄其腦電波信號,然后借助人工智能系統(tǒng)進行解碼。
正確率勝過人工速記員
論文顯示,10年前,科學(xué)家首次從人類大腦信號中解碼出語音,但是解碼的精度和速度遠低于自然語速。
低到什么程度呢?
研究團隊介紹,迄今為止,在直接從腦電波中解碼語音的研究中,腦機接口系統(tǒng)僅限于解碼單音節(jié),或在志愿者連續(xù)念出約100個單詞的情況下,只能正確解碼不到40%的單詞。
為提升解碼精確度,研究團隊從機器翻譯中獲得啟發(fā),訓(xùn)練了一種循環(huán)神經(jīng)網(wǎng)絡(luò)。研究中,4名志愿者被要求大聲重復(fù)朗讀30至50句話。他們大腦外側(cè)皮質(zhì)上分布著大量微電極,可以監(jiān)測到相應(yīng)的大腦神經(jīng)活動。這些腦電波數(shù)據(jù)輸入人工智能系統(tǒng)后,先被編碼成一串序列,然后解碼成相應(yīng)的英文句子。
研究人員表示,這項研究展示了以高精度和自然語速來解碼皮層腦電圖。在對其中一個志愿者的腦電波解碼任務(wù)中,平均每句話只有3%需要糾正——低于專業(yè)人工速記員平均5%的錯誤率。
但研究團隊也強調(diào),該研究涉及的句子量比較少。“如果你嘗試不使用這50個句子的數(shù)據(jù)集,解碼就會糟糕很多。”論文第一作者約瑟夫·馬金接受媒體采訪時說。
展示AI解讀神經(jīng)信號的潛力
“這項研究的創(chuàng)新之處在于,采用端到端的深度學(xué)習(xí)網(wǎng)絡(luò)實現(xiàn)神經(jīng)信號翻譯,從工程角度展示了人工智能技術(shù)應(yīng)用于神經(jīng)信號解讀的潛力。”清華大學(xué)醫(yī)學(xué)院神經(jīng)工程實驗室、清華大學(xué)人工智能研究院教授洪波在接受科技日報記者采訪時評價說。
洪波分析,這項研究的難點在于兩個方面。
首先是采用了高密度微電極陣列,間距4毫米,多達256個電極,覆蓋大腦皮層表面的關(guān)鍵腦區(qū),獲取了足夠的神經(jīng)信息用于解碼。這種電極在國內(nèi)尚沒有可用于臨床的產(chǎn)品。
另外,研究中深度循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,除了采用時間軸上的卷積操作提高特征提取能力,還把語音頻譜特征也作為訓(xùn)練目標,大大降低了對神經(jīng)數(shù)據(jù)量的需求。
“腦機接口的一個核心難題是神經(jīng)信息的解碼和翻譯,腦電信號噪聲大,背后的神經(jīng)編碼機制復(fù)雜未知,這些都是挑戰(zhàn)。”洪波認為,以深度學(xué)習(xí)為代表的人工智能技術(shù)發(fā)展,為腦機接口打開一條應(yīng)對該挑戰(zhàn)的新路徑。
不過,在洪波看來,人工智能與腦機接口結(jié)合,也帶來新難題:如何獲得大量的訓(xùn)練數(shù)據(jù)?來自人腦的高精度神經(jīng)數(shù)據(jù)通常只在臨床條件下才能獲得,這會使神經(jīng)網(wǎng)絡(luò)訓(xùn)練陷入困境。
現(xiàn)實應(yīng)用仍存技術(shù)障礙
“這項技術(shù)目前主要用于癲癇外科的臨床,幫助外科醫(yī)生在切除癲癇病灶之前,確定關(guān)鍵的語言功能區(qū)。要讓漸凍人、高位截癱等殘疾患者用上這樣的腦機接口,還要繼續(xù)解決長效電極和解碼效率的問題。”洪波說。
他認為,相關(guān)技術(shù)在未來實際應(yīng)用中,仍然有很大的技術(shù)障礙,例如高密度的微電極陣列目前還無法長期植入,難以作為未來腦機接口的標準電極。
洪波團隊也在和材料、微電子以及臨床團隊合作,開發(fā)可以長期植入的微創(chuàng)解決方案。他告訴記者,根本上說,人工智能應(yīng)用于腦機接口,關(guān)鍵門檻還是長期可靠的神經(jīng)電極和清晰準確的神經(jīng)解碼規(guī)律。
“人們所期待的戴上腦電帽就能讀出心里話,從科學(xué)和工程角度來看還有很遠的距離。但腦科學(xué)和人工智能技術(shù)的結(jié)合,有可能加速這些探索和研發(fā)的進程。”洪波說。
關(guān)鍵詞: 人工智能解碼系統(tǒng)