專利名稱:一種窄帶語音子帶清濁音度參數(shù)的量化方法
技術(shù)領(lǐng)域:
本發(fā)明屬于語音編碼技術(shù)領(lǐng)域,特別是涉及低速率及超低速率參數(shù)語音編碼方法。
背景技術(shù):
語音編碼在通信系統(tǒng)、語音存儲回放系統(tǒng)、具有語音功能的消費(fèi)類產(chǎn)品中有廣泛的應(yīng)用。近些年來國際電信聯(lián)盟(ITU)、ー些區(qū)域組織和ー些國家相繼制定了一系列語音壓縮編碼標(biāo)準(zhǔn),并在編碼速率為2. 4kb/s到16kb/s上得到了令人滿意的語音質(zhì)量。目前國內(nèi)外的研究主要集中在2.4kb/s以下速率高質(zhì)量語音壓縮編碼上,主要用于無線通信、保密通信、大容量語音存儲回放等。低速率語音編碼中激勵信號的合成非常重 要,而多帶激勵信號合成是目前激勵信號合成的重要手段,混合激勵線性預(yù)測編碼算法等均采用了多帶激勵模型。多帶激勵信號合成主要依靠于子帶清濁音度參數(shù),因此子帶清濁音度參數(shù)的高效量化傳輸對合成語音質(zhì)量具有重要意義。目前子帶清濁音度參數(shù)的量化方法如下
(O對輸入語音信號米樣點(diǎn)按時(shí)間順序分巾貞;
(2)按幀提取子帶清濁音度參數(shù);
(3)聯(lián)合多個語音幀組成超幀,多個語音幀的子帶清濁音度參數(shù)組成超幀子帶清濁音度參數(shù);
(4)對超幀子帶清濁音度參數(shù)進(jìn)行矢量量化,將其量化索引值進(jìn)行編碼傳輸,量化碼本的訓(xùn)練方法可參照楊行峻等人著《語音信號數(shù)字處理》矢量量化一章中所采用的LBG算法;
(5)解碼端根據(jù)索引值搜索碼本得到超幀子帶清濁音度參數(shù);
(6)根據(jù)超幀子帶清濁音度參數(shù),得到每個語音幀的子帶清濁音度參數(shù),送入激勵信號合成端生成激勵信號。上述已有技術(shù)對子帶清濁音度參數(shù)進(jìn)行矢量量化,在編碼速率進(jìn)ー步降低時(shí),用于子帶清濁音度參數(shù)量化的比特?cái)?shù)減少,從而無法高效量化子帶清濁音度參數(shù),進(jìn)ー步使合成語音質(zhì)量受到較大影響。實(shí)際上,連續(xù)語音幀的子帶清濁音度參數(shù)具有較強(qiáng)的相關(guān)性,因而連續(xù)超幀的子帶清濁音度參數(shù)間也具有較強(qiáng)的相關(guān)性,現(xiàn)有技術(shù)并未考慮或利用到這種相關(guān)性,從而無法進(jìn)ー步提高子帶清濁音度參數(shù)的量化效率。
發(fā)明內(nèi)容
本發(fā)明利用連續(xù)語音幀或超幀間子帶清濁音度參數(shù)的相關(guān)性,提供ー種窄帶語音子帶清濁音度參數(shù)的量化方法,以提高量化效率,進(jìn)ー步改善合成語音質(zhì)量。本發(fā)明采用以下技術(shù)方案
一種窄帶語音子帶清濁音度參數(shù)的量化方法,編解碼端分別設(shè)定退出計(jì)數(shù)器戰(zhàn)em = O ,挑ぉ=O ,設(shè)定退出間隔為し然后通過以下步驟進(jìn)行量化;
編碼端1)編碼端對輸入的語音信號樣點(diǎn)按時(shí)間順序分幀,按幀提取子帶清濁音度參數(shù);
2)聯(lián)合多個語音幀組成超幀,對應(yīng)的多個語音幀的子帶清濁音度參數(shù)組成超幀子帶清濁音度參數(shù);
3)對當(dāng)前超幀判斷是否為L的整數(shù)倍,若是,則采用初始碼本對所述超幀子帶清濁音度參數(shù)進(jìn)行矢量量化;若不是,則將上一超幀量化后的子帶清濁音度參數(shù)采用初始碼本進(jìn)行量化,并以量化值《為索引從條件碼本中選取該索引所對應(yīng)的碼本Q,利用該碼本Cs對當(dāng)前超幀子帶清濁音度參數(shù)進(jìn)行量化并得到索引值index ;
4)將索引值進(jìn)行編碼傳輸,訊雛+1,轉(zhuǎn)至步驟3);
解碼端5)解碼端判斷Wlfc是否為L的整數(shù)倍,若是,則根據(jù)所述索引值index捜索初 始碼本得到超幀子帶清濁音度參數(shù);若不是,利用初始碼本對上ー超幀量化后的子帶清濁音度參數(shù)進(jìn)行量化,得到索引值《,并依據(jù)該索引值從條件碼本集中選取匹配的碼本Q,根據(jù)索引值index搜索碼本Cs得到超巾貞子帶清池音度參數(shù);
6)根據(jù)步驟5)得到的超幀子帶清濁音度參數(shù),得到每個語音幀的子帶清濁音度參數(shù),送入激勵信號合成端生成激勵信號,,轉(zhuǎn)至步驟5)。依據(jù)本發(fā)明的上述窄帶語音子帶清濁音度參數(shù)的量化方法,考慮到了連續(xù)超幀子帶清濁音度參數(shù)的相關(guān)性,采用狀態(tài)轉(zhuǎn)移機(jī)的原理,對當(dāng)前超幀子帶清濁音度量化時(shí),考慮到了上一超幀的子帶清濁音度參數(shù),因此提高了子帶清濁音度參數(shù)的量化效率。在提高效率的同時(shí),通過誤碼擴(kuò)散抑制,也就是通過定時(shí)退出機(jī)制,防止誤碼擴(kuò)散,降低因采用參數(shù)相關(guān)性而導(dǎo)致的誤碼擴(kuò)散范圍。上述窄帶語音子帶清濁音度參數(shù)的量化方法,所述初始碼本和所述條件碼本均為離線訓(xùn)練得到。上述窄帶語音子帶清濁音度參數(shù)的量化方法,所述條件碼本的個數(shù)依賴于子
帶清濁音度參數(shù)的量化比特?cái)?shù)M ,即外=#。
圖I為已知的ー種子帶清濁音度參數(shù)量化流程框圖。圖2為依據(jù)本發(fā)明的ー種子帶清濁音度參數(shù)量化流程框圖。
具體實(shí)施例方式下面結(jié)合說明書附圖以具體實(shí)施例的方式詳述本發(fā)明的技術(shù)方案。依據(jù)本發(fā)明的實(shí)施例,基于子帶清濁音度參數(shù)的幀間相關(guān)性,對當(dāng)前超幀子帶清濁音度參數(shù)進(jìn)行量化時(shí),考慮其前一超幀的子帶清濁音度參數(shù),選擇不同的碼本,對其進(jìn)行更加精細(xì)的量化,提高其量化效率。若信道有誤碼存在,當(dāng)某一超幀的子帶清濁音度參數(shù)傳輸出錯時(shí),其后續(xù)所有超幀子帶清濁音度參數(shù)的碼本信息將發(fā)生錯誤,導(dǎo)致誤碼擴(kuò)散,為了防止誤碼擴(kuò)散,采用了定時(shí)退出機(jī)制。即設(shè)定退出間隔L,每當(dāng)L的整數(shù)倍個超幀編碼結(jié)束后,則重新采用初始碼本對超幀子帶清濁音度參數(shù)進(jìn)行矢量量化。采用定時(shí)退出的方案,即使某一超幀的子帶清濁音度參數(shù)傳輸出錯,只會對不超過L個語音幀產(chǎn)生影響。從而,采用合適的量化方案,充分利用連續(xù)語音幀或超幀間子帶清濁音度參數(shù)的相關(guān)性,提高其量化效率,從而進(jìn)一歩改善合成語音質(zhì)量,解決低速率、超低速率語音編碼中子帶清濁音度參數(shù)量化效率低下的問題。參照說明書附圖2所示子帶清濁音度參數(shù)量化流程,其包括以下步驟
1)編解碼端分別設(shè)定退出計(jì)數(shù)器《雙=O, 如=O ,設(shè)定退出間隔為L,從而,每當(dāng)L的
整數(shù)倍個超幀編碼結(jié)束后,則重新采用初始碼本對超幀子帶清濁音度參數(shù)進(jìn)行矢量量化;
2)在編碼端,對輸入語音信號樣點(diǎn)按時(shí)間順序分幀;(此處的分幀不是超幀!)
3)按幀提取子帶清濁音度參數(shù);應(yīng)知步驟2)和步驟3)在順序上沒有邏輯上的關(guān)聯(lián)性;
4)聯(lián)合況個語音幀組成超幀,N個語音幀的子帶清濁音度參數(shù)組成超幀子帶清濁音度參數(shù),如果每個語音幀提取た個子帶清濁音度參數(shù),則每超幀共有Nxk個子帶清濁音度參數(shù);
5)判斷是否為L的整數(shù)倍,若是,采用初始碼本對超幀子帶清濁音度參數(shù)進(jìn)行矢量量化;若不是,將上一超幀量化后的子帶清濁音度參數(shù)采用初始碼本進(jìn)行量化,假設(shè)量化得到的索引值為》,根據(jù)量化索引值《從條件碼本集合中選取該索引對應(yīng)的碼本Q,利用碼本Cm對當(dāng)前超幀子帶清濁音度參數(shù)進(jìn)行量化并得到索引值index ;
6)將索引值進(jìn)行編碼傳輸,轉(zhuǎn)至步驟5);應(yīng)知,這里的邏輯式
是計(jì)算機(jī)學(xué)中的賦值,而非數(shù)學(xué)表達(dá)式。本步驟中的初始碼本和條件碼本集均為離線訓(xùn)練得到,降低所獲得碼本所受到外界干擾因素;
7)解碼端判斷《* 是否為L的整數(shù)倍。若是,根據(jù)索引值index捜索初始碼本得到超幀子帶清濁音度參數(shù);若不是,利用初始碼本對上ー超幀量化后的子帶清濁音度參數(shù)進(jìn)行量化,得到索引值《,根據(jù)索引值ぃ從條件碼本集中選取碼本C;,根據(jù)解碼端收到的索引
值index搜索碼本Cfs得到超巾貞子帶清池音度參數(shù);
8)根據(jù)步驟7)得到的超幀子帶清濁音度參數(shù),得到每個語音幀的子帶清濁音度參數(shù),送入激勵信號合成端生成激勵信號,,轉(zhuǎn)至步驟7)。ー個更具體實(shí)施例詳細(xì)說明如下
上述方法步驟I)中退出間隔L根據(jù)超幀大小決定,一般時(shí)長為Is左右,比如語音分析
幀為25ms,若連續(xù)4個語音幀組成ー個超幀,則可以取值£ =,= 10個超幀;
25.4
對輸入語音信號樣點(diǎn)按時(shí)間順序分幀的實(shí)施例是按8kHz頻率采樣、已經(jīng)過高通濾波去除エ頻干擾的語音樣點(diǎn)。每25ms,也就是200個語音樣點(diǎn)構(gòu)成ー幀。按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法提取子帶清濁音度參數(shù),記為ぶ。
權(quán)利要求
1.一種窄帶語音子帶清濁音度參數(shù)的量化方法,其特征在于,編解碼端分別設(shè)定退出計(jì)數(shù)器=O , =0 ,設(shè)定退出間隔為L,然后通過以下步驟進(jìn)行量化; 編碼端1)編碼端對輸入的語音信號樣點(diǎn)按時(shí)間順序分幀,按幀提取子帶清濁音度參數(shù); 2)聯(lián)合多個語音幀組成超幀,對應(yīng)的多個語音幀的子帶清濁音度參數(shù)組成超幀子帶清濁音度參數(shù); 3)對當(dāng)前超幀判斷是否為L的整數(shù)倍,若是,則采用初始碼本對所述超幀子帶清濁音度參數(shù)進(jìn)行矢量量化;若不是,則將上一超幀量化后的子帶清濁音度參數(shù)采用初始碼本進(jìn)行量化,假設(shè)量化值為^ ,根據(jù)量化索引值從條件碼本中選取所對應(yīng)的碼本Q,利用碼本Cs對當(dāng)前超幀子帶清濁音度參數(shù)進(jìn)行量化并得到索引值index ; 4)將索引值進(jìn)行編碼傳輸, = ,+!,轉(zhuǎn)至步驟3); 解碼端5)解碼端判斷《-是否為L的整數(shù)倍,若是,則根據(jù)索引值index搜索初始碼本得到超幀子帶清濁音度參數(shù);若不是,利用初始碼本對上一超幀量化后的子帶清濁音度參數(shù)進(jìn)行量化,得到索引值《,并依據(jù)該索引值從條件碼本集中選取匹配的碼本Q,根據(jù)索引值index搜索碼本Cs得到超巾貞子帶清池音度參數(shù); 6)根據(jù)步驟5)得到的超幀子帶清濁音度參數(shù),得到每個語音幀的子帶清濁音度參數(shù),送入激勵信號合成端生成激勵信號,爾缸=m奴+1 ,轉(zhuǎn)至步驟5)。
2.根據(jù)權(quán)利要求I所述的窄帶語音子帶清濁音度參數(shù)的量化方法,其特征在于,所述初始碼本和所述條件碼本均為離線訓(xùn)練得到。
3.根據(jù)權(quán)利要求2所述的窄帶語音子帶清濁音度參數(shù)的量化方法,其特征在于,所述條件碼本的個數(shù)Atc依賴于子帶清濁音度參數(shù)的量化比特?cái)?shù)M ,即Nc = 2^。
全文摘要
本發(fā)明公開了一種窄帶語音子帶清濁音度參數(shù)的量化方法,考慮到了連續(xù)超幀子帶清濁音度參數(shù)的相關(guān)性,采用狀態(tài)轉(zhuǎn)移機(jī)的原理,對當(dāng)前超幀子帶清濁音度量化時(shí),考慮到了上一超幀的子帶清濁音度參數(shù),因此提高了子帶清濁音度參數(shù)的量化效率。在提高效率的同時(shí),通過誤碼擴(kuò)散抑制,也就是通過定時(shí)退出機(jī)制,防止誤碼擴(kuò)散,降低因采用參數(shù)相關(guān)性而導(dǎo)致的誤碼擴(kuò)散范圍。
文檔編號G10L19/038GK102855878SQ20121035230
公開日2013年1月2日 申請日期2012年9月21日 優(yōu)先權(quán)日2012年9月21日
發(fā)明者李曄, 馬曉鳳, 樊燕紅, 姜競賽, 郝秋赟 申請人:山東省計(jì)算中心