| 創(chuàng)澤機(jī)器人 |
| CHUANGZE ROBOT |
特定人的語(yǔ)音識(shí)別系統(tǒng)指識(shí)別字、短語(yǔ)、句子,而不管說話人是誰(shuí)。目 前已經(jīng)能夠識(shí)別4000個(gè)甚至更多個(gè)單詞及由它們所組成的簡(jiǎn)單句子。
由于上述識(shí)別系統(tǒng)都是針對(duì)非特定人的,所以它與特定人的語(yǔ)音識(shí)別系統(tǒng) 相比,一般性要求較高。語(yǔ)言識(shí)別系統(tǒng)可以懂得話音的含義。這種系統(tǒng)先要把 話音分割成單詞(或音素),然后進(jìn)行語(yǔ)法分析,Z后辨識(shí)出話音的含義,可見 這種系統(tǒng)是相當(dāng)復(fù)雜的。在小詞匯量語(yǔ)音識(shí)別方面,用得Z多的是模式匹配方 法,實(shí)用的系統(tǒng)已經(jīng)出現(xiàn);基于統(tǒng)計(jì)模型的隱 Markov 模型,則在大詞匯量的語(yǔ) 音識(shí)別上取得了很大的進(jìn)展,但目前尚在研究發(fā)展之中,可靠性有待進(jìn)一步提 高。實(shí)現(xiàn)非特定人語(yǔ)音識(shí)別的流程如圖4-19所示。相比之下,數(shù)字音識(shí)別系統(tǒng) 比較簡(jiǎn)單。這種語(yǔ)音識(shí)別系統(tǒng)的工作原理與特定人的語(yǔ)音識(shí)別系統(tǒng)有很多相同之 處,這里只介紹連續(xù)數(shù)字音識(shí)別系統(tǒng)。
除此之外,還要發(fā)現(xiàn)很多語(yǔ)言中的規(guī)律,在這些規(guī)律中,重要的有:
①字的起點(diǎn)可能發(fā)生在如下處:“靜”和“無(wú)振”時(shí)間段的銜接處,幅度 隨時(shí)間陡升處,過零率隨時(shí)間陡升處;“有振”、“無(wú)振”時(shí)間段銜接處和幅度 與時(shí)間關(guān)系曲線的凹陷處。
②字的終點(diǎn)可能發(fā)生在如下處:“有振”和“靜”的時(shí)間段銜接處;“無(wú) 振”和“靜”的時(shí)間段銜接處及幅度隨時(shí)間陡降處。
③在“無(wú)振”和“有振”的銜接處。如果同時(shí)出現(xiàn)幅度隨時(shí)間陡升和過零 率隨時(shí)間陡降,那么這里不是字的起、終點(diǎn)的分界。
接下來(lái),把各個(gè)短時(shí)間段的各個(gè)特征按照上面的分割方法劃分成三個(gè)組(即 將每個(gè)字的字音分成一個(gè)組),分別送進(jìn)“音的識(shí)別”部分去作每個(gè)字的識(shí)別。 然而,在“音的識(shí)別”部分中,事先存儲(chǔ)有十個(gè)數(shù)目字話音(0~9),在每個(gè)短 時(shí)間段的判別量設(shè)為:g₁(x₁,x₂,x₃)、82(x,x₂,x₃)、g₃(x₁,x₂,x₃), 其 中 x₁代表幅度,x₂ 代表過零率,x₃ 代表線性預(yù)測(cè)系數(shù)等。當(dāng)?shù)玫酱R(shí)別的數(shù)目字 話音的各個(gè)特征時(shí),把它們與事先存儲(chǔ)的判別量進(jìn)行比較,找出Z接近的字作為 判別結(jié)果。
和特定人的語(yǔ)音識(shí)別系統(tǒng)一樣,在作比較之前也要經(jīng)過“時(shí)間對(duì)應(yīng)步 驟”,把待識(shí)別字的各個(gè)短時(shí)間段在一定范圍內(nèi)作些調(diào)整,使調(diào)整后的短時(shí)間段 數(shù)目和存儲(chǔ)在“音的識(shí)別”部分的字的短時(shí)段數(shù)目一樣,再把調(diào)整后的短時(shí)間段 的特征代入判別函數(shù)里。在這種模板匹配法的語(yǔ)音識(shí)別系統(tǒng)中,標(biāo)準(zhǔn)模板是否具 有代表性,直接影響識(shí)別的精度。即使是同一個(gè)人說同一個(gè)單詞,其發(fā)音也會(huì)有 差異,這就是發(fā)音的離散性。這種離散性造成了產(chǎn)生標(biāo)準(zhǔn)模板的困難。假設(shè)這種 離散性使語(yǔ)音特征分布在一個(gè)區(qū)域里面而不是集中在一個(gè)點(diǎn),那么我們應(yīng)當(dāng)找出 這個(gè)區(qū)域中心點(diǎn)并將其作為標(biāo)準(zhǔn)特征值,這個(gè)過程稱為語(yǔ)音識(shí)別中的樣本優(yōu)化。
還應(yīng)當(dāng)指出,在正確提取語(yǔ)音特征的前提下,如何減少計(jì)算量是一個(gè)重要 問題,它關(guān)系到語(yǔ)音識(shí)別系統(tǒng)的復(fù)雜程度、成本和實(shí)時(shí)性。聽覺系統(tǒng)除了用于識(shí)別人的聲音之外,還可以在工作現(xiàn)場(chǎng)利用傳聲器捕捉音響來(lái)證實(shí)一個(gè)工序的開始 與結(jié)束、檢測(cè)異常聲音等。利用超聲波的聽覺系統(tǒng)還可以測(cè)量對(duì)象物的位置和尺 寸。超聲波聽覺系統(tǒng)在測(cè)量、檢測(cè)等方面有廣泛的應(yīng)用。
![]() |
| 機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人 講解機(jī)器人 迎賓機(jī)器人 移動(dòng)機(jī)器人底盤 商用機(jī)器人 智能垃圾站 智能服務(wù)機(jī)器人 大屏機(jī)器人 霧化消毒機(jī)器人 展廳機(jī)器人 服務(wù)機(jī)器人底盤 具身智能教育機(jī)器人 智能配送機(jī)器人 導(dǎo)覽機(jī)器人 |