美國加州大學(xué)戴維斯分校團(tuán)隊開發(fā)出一種研究性腦機(jī)接口,有望幫助因神經(jīng)系統(tǒng)疾病而失去說話能力的人重新“發(fā)聲”。這項成果發(fā)表在最新一期《自然》雜志上,展示了該技術(shù)如何在人嘗試說話時,立即將大腦活動轉(zhuǎn)化為語音,從而創(chuàng)建出一種“數(shù)字聲帶”。

  這項技術(shù)已在一名患有肌萎縮側(cè)索硬化癥(俗稱“漸凍癥”)的參與者身上測試成功。他通過植入式腦機(jī)接口,借助計算機(jī)與家人實(shí)時對話,不僅可以控制語調(diào),還能唱出簡單的旋律。

  此前的語音腦機(jī)接口主要將神經(jīng)活動翻譯成文本,類似于發(fā)送短信,存在延遲并影響自然交流。而這種新型實(shí)時語音合成系統(tǒng)則更接近于語音通話,使用戶能夠更自然地參與對話。

  新植入式腦機(jī)接口系統(tǒng)由4個微電極陣列組成,電極通過手術(shù)植入大腦中負(fù)責(zé)語音生成的區(qū)域。當(dāng)參與者試圖說話時,電極記錄下神經(jīng)元的活動,并將信號傳輸?shù)酵獠坑嬎銠C(jī)進(jìn)行解碼,最終重建語音輸出。團(tuán)隊還開發(fā)了一種新算法,能將每一時刻的大腦活動精確轉(zhuǎn)換為對應(yīng)的語音,參與者可通過調(diào)整音高來表達(dá)不同的情感或意圖,比如提問、發(fā)出感嘆或強(qiáng)調(diào)某個詞語。

  新技術(shù)的速度非常快,從神經(jīng)信號采集到語音合成僅需1/40秒——這個延遲時間幾乎等同于人們正常說話時聽到自己聲音所需的時間。

  參與者還能用該系統(tǒng)“唱”出簡短的旋律,顯示出語音合成的靈活性。聽眾對合成語音的理解率達(dá)到近60%,而在不使用該系統(tǒng)的情況下,他的語音僅能聽懂約4%。

  實(shí)現(xiàn)這一過程的關(guān)鍵在于先進(jìn)的人工智能算法。通過對數(shù)百個神經(jīng)元放電模式的分析,團(tuán)隊成功地將這些模式與參與者試圖產(chǎn)生的語音同步。這使得算法能在沒有語音輸入的情況下,僅憑神經(jīng)信號就準(zhǔn)確重建他想要表達(dá)的聲音。

  這項研究標(biāo)志著腦機(jī)接口技術(shù)在恢復(fù)自然語言能力方面邁出的重要一步,為因疾病或損傷而失語的人群帶來了新的希望。未來,其有望應(yīng)用于更多患者,推動神經(jīng)假體領(lǐng)域邁向更加智能化和人性化。(記者張夢然)

編輯:馮儀
更多精彩資訊請在應(yīng)用市場下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時報料熱線400-800-0088;消費(fèi)者也可通過央廣網(wǎng)“啄木鳥消費(fèi)者投訴平臺”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責(zé)任。
長按二維碼
關(guān)注精彩內(nèi)容