計(jì)算模型通過(guò)預(yù)測(cè)對(duì)語(yǔ)音進(jìn)行解碼
很多文章的報(bào)道都是由微觀而宏觀 , 今日小編講給大家?guī)?lái)的關(guān)于計(jì)算模型通過(guò)預(yù)測(cè)對(duì)語(yǔ)音進(jìn)行解碼的資訊也不例外,希翼可以在一定的程度上開闊你們的視野!y有對(duì)計(jì)算模型通過(guò)預(yù)測(cè)對(duì)語(yǔ)音進(jìn)行解碼這篇文章感興趣的小伙伴可以一起來(lái)看看
大腦通過(guò)識(shí)別音節(jié)來(lái)分析口語(yǔ) 。日內(nèi)瓦大學(xué)(UNIGE)和不斷進(jìn)展的語(yǔ)言國(guó)家能力研究中心(NCCR)的科學(xué)家設(shè)計(jì)了一種計(jì)算模型,該模型再現(xiàn)了中樞神經(jīng)系統(tǒng)執(zhí)行此操作所采納的復(fù)雜機(jī)制 。該模型匯合了兩個(gè)獨(dú)立的理論框架,使用等效于大腦活動(dòng)產(chǎn)生的神經(jīng)元振動(dòng)來(lái)處理關(guān)聯(lián)語(yǔ)音的延續(xù)聲音流 。

該模型根據(jù)稱為預(yù)測(cè)編碼的理論起作用,從而大腦通過(guò)不斷嘗試基于候選假設(shè)(此模型中的音節(jié))來(lái)預(yù)測(cè)感覺(jué)信號(hào)來(lái)優(yōu)化感知 。結(jié)果模型在《自然通訊》雜志上進(jìn)行了描述,該模型有助于實(shí)時(shí)識(shí)別以自然語(yǔ)言說(shuō)出的數(shù)百個(gè)句子中包含的數(shù)千個(gè)音節(jié) 。這證實(shí)了神經(jīng)元振動(dòng)可以用來(lái)協(xié)調(diào)我們聽到的音節(jié)流與大腦預(yù)測(cè)的想法 。
UNIGE醫(yī)學(xué)院基礎(chǔ)神經(jīng)科學(xué)系教授,不斷進(jìn)展的語(yǔ)言NCCR聯(lián)合主任Anne-Lise Giraud說(shuō):“腦部活動(dòng)會(huì)產(chǎn)生可通過(guò)腦電圖測(cè)量的神經(jīng)元振蕩 。”這些是電磁波,是由整個(gè)神經(jīng)元網(wǎng)絡(luò)的相干電活動(dòng)產(chǎn)生的 。有幾種類型,根據(jù)它們的頻率定義 。它們被稱為α,β,θ , δ或γ波 。這些節(jié)奏單獨(dú)或疊加在一起 , 與不同的認(rèn)知功能相關(guān) , 例如感知,記憶,注意力,機(jī)敏性等 。

但是,神經(jīng)科學(xué)家尚不知道他們是否對(duì)這些功能做出積極貢獻(xiàn)以及如何發(fā)揮作用 。在2015年發(fā)表的一項(xiàng)較早研究中,Giraud教授的團(tuán)隊(duì)表明,theta波(低頻)和gamma波(高頻)相互配合,對(duì)音節(jié)中的音流進(jìn)行排序,并分析其內(nèi)容,以便對(duì)其進(jìn)行識(shí)別 。
總部位于日內(nèi)瓦的科學(xué)家根據(jù)這些生理節(jié)律開辟了一種突跳的神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)模型 , 該模型在現(xiàn)場(chǎng)(在線)音節(jié)排序方面的性能優(yōu)于傳統(tǒng)的自動(dòng)語(yǔ)音識(shí)別系統(tǒng) 。
【計(jì)算模型通過(guò)預(yù)測(cè)對(duì)語(yǔ)音進(jìn)行解碼】在他們的第一個(gè)模型中,theta波(介于4赫茲與8赫茲之間)使尾隨系統(tǒng)感知的音節(jié)節(jié)奏成為可能 。伽馬波(大約30赫茲)用于將聽??覺(jué)信號(hào)切成較小的切片并進(jìn)行編碼 。這會(huì)產(chǎn)生一個(gè)鏈接到每個(gè)聲音序列的“音素”配置文件 , 可以將其與后一個(gè)音節(jié)進(jìn)行比較 , 并與已知音節(jié)庫(kù)進(jìn)行比較 。這種類型的模型的優(yōu)點(diǎn)之一是,它可以自發(fā)地適應(yīng)語(yǔ)音速度,語(yǔ)音速度可能因人而異 。

在這篇新文章中,為了更接近生物學(xué)現(xiàn)實(shí),Giraud教授和她的團(tuán)隊(duì)開辟了一種新模型,其中結(jié)合了來(lái)自另一個(gè)理論框架的元素,而與神經(jīng)元振蕩無(wú)關(guān):“預(yù)測(cè)編碼” 。
“該理論認(rèn)為,大腦的功能是如此之好,因?yàn)樗騺?lái)在使用外界事件如何產(chǎn)生感官信號(hào)的學(xué)習(xí)模型來(lái)不斷嘗試預(yù)測(cè)和解釋環(huán)境中正在發(fā)生的事情 。就口語(yǔ)而言,它試圖找到最有效的方法 。根據(jù)已學(xué)到的,并且正在不斷更新的一組心理表征,可能會(huì)隨著聲音的進(jìn)展而使耳朵感知到的聲音的可能原因 。” Giraud小組的計(jì)算神經(jīng)科學(xué)家Itsaso Olasagasti博士說(shuō) 。模型實(shí)施 。
“我們開辟了一種模擬這種預(yù)測(cè)編碼的計(jì)算機(jī)模型,”基礎(chǔ)神經(jīng)科學(xué)系研究員,該論文的第一作者Sevada Hovsepyan解釋說(shuō) 。“而且我們通過(guò)引入振蕩機(jī)制來(lái)實(shí)現(xiàn)它 。”
進(jìn)入系統(tǒng)的聲音首先由類似于神經(jīng)元種群產(chǎn)生的θ(慢)波調(diào)制 。這樣就可以發(fā)信號(hào)通知音節(jié)的輪廓 。然后,(快速)伽馬波序列有助于在音節(jié)被感知時(shí)對(duì)音節(jié)進(jìn)行編碼 。在此過(guò)程中,系統(tǒng)會(huì)建議可能的音節(jié),并在必要時(shí)更正選擇 。在兩個(gè)級(jí)別之間來(lái)回幾次后 , 它會(huì)發(fā)現(xiàn)正確的音節(jié) 。隨后 , 系統(tǒng)在每個(gè)音節(jié)結(jié)束時(shí)將其重置為零 。
該模型已成功使用220個(gè)句子中的2888個(gè)不同音節(jié)以英語(yǔ)自然語(yǔ)言進(jìn)行了測(cè)試 。Giraud教授說(shuō):“一方面 , 我們成功地將兩個(gè)非常不同的理論框架整合到一個(gè)計(jì)算機(jī)模型中 。”“另一方面,我們已經(jīng)表明,神經(jīng)元振蕩很可能在節(jié)奏上使大腦的內(nèi)源性功能與通過(guò)感覺(jué)器官?gòu)耐獠總魅氲男盘?hào)對(duì)齊 。如果將其放回預(yù)測(cè)編碼理論中 , 則意味著這些振蕩可能使大腦大腦在正確的時(shí)機(jī)做出正確的假設(shè) 。”
猜你喜歡
- 12123手機(jī)號(hào)更換多久審核通過(guò)
- AI通過(guò)觀看正在播放的游戲從零開始創(chuàng)建了《吃豆人》
- 我國(guó)的公攤面積的標(biāo)準(zhǔn)是多少 房屋公攤率計(jì)算公式
- 圓面積計(jì)算公式 圓面積計(jì)算公式推導(dǎo)過(guò)程
- 微軟團(tuán)隊(duì)通過(guò)全天免費(fèi)視頻通話擊敗Zoom的感恩節(jié)禮物
- 想衡量您的企業(yè)AI計(jì)劃嗎 那你應(yīng)該從模型債務(wù)開始
- 三星希望通過(guò)600MP攝像頭傳感器與人眼匹敵
- Razer通過(guò)泄露服務(wù)器意外暴露客戶數(shù)據(jù)
- IBM通過(guò)AI和開源ML項(xiàng)目吸引開發(fā)人員
- 勞動(dòng)局確認(rèn)工齡是怎樣計(jì)算的 勞動(dòng)局如何認(rèn)定工齡
