日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

文本語(yǔ)音播報(bào)方法及系統(tǒng)與流程

文檔序號(hào):11097679閱讀:2832來(lái)源:國(guó)知局
文本語(yǔ)音播報(bào)方法及系統(tǒng)與制造工藝

本發(fā)明涉及人工智能語(yǔ)音領(lǐng)域,尤其涉及文本語(yǔ)音播報(bào)方法及系統(tǒng)。



背景技術(shù):

文本語(yǔ)音播報(bào)應(yīng)用于電信、銀行、交通運(yùn)輸及智能機(jī)器人等,主要是對(duì)給定的文本進(jìn)行語(yǔ)言學(xué)分析,逐句進(jìn)行詞匯的、語(yǔ)法的和語(yǔ)義的分析,以確定句子的低層結(jié)構(gòu)和每個(gè)字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略語(yǔ)的處理等,把文本所對(duì)應(yīng)的單字或短語(yǔ)從語(yǔ)音合成庫(kù)中提取,把語(yǔ)言學(xué)描述轉(zhuǎn)化成言語(yǔ)波形。目前市面上有不少類(lèi)似的功能,但大多效果不佳,主要表現(xiàn)為播出的語(yǔ)音吐字生硬,音色單一。



技術(shù)實(shí)現(xiàn)要素:

為了克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供文本語(yǔ)音播報(bào)方法及系統(tǒng),其能對(duì)任意文本進(jìn)行流暢圓潤(rùn)的播報(bào)。

本發(fā)明的目的采用以下技術(shù)方案實(shí)現(xiàn):

文本語(yǔ)音播報(bào)方法,包括:

采集文本信息;

分析所述文本信息,并提取出文本特征;

基于所述文本特征以及神經(jīng)網(wǎng)絡(luò)韻律模型預(yù)測(cè)所述文本信息對(duì)應(yīng)的韻律特征參數(shù);

根據(jù)所述韻律特征參數(shù)進(jìn)行語(yǔ)音合成并播放。

優(yōu)選的,所述分析文本信息,具體為:

根據(jù)預(yù)先添加的添加語(yǔ)法知識(shí)庫(kù)和語(yǔ)法詞典,利用最大匹配算法對(duì)文本信息進(jìn)行切分。

優(yōu)選的,所述提取出文本特征,具體為:

根據(jù)詞語(yǔ)的屬性計(jì)算詞語(yǔ)權(quán)重,提取出文本關(guān)鍵詞;將切分得到的字和/或詞對(duì)應(yīng)的詞性以及關(guān)鍵詞及關(guān)鍵詞對(duì)應(yīng)的詞性作為文本信息對(duì)應(yīng)的文本特征。

優(yōu)選的,所述神經(jīng)網(wǎng)絡(luò)韻律模型是預(yù)先通過(guò)對(duì)語(yǔ)音材料庫(kù)基于神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練得到的。

優(yōu)選的,所述語(yǔ)音材料庫(kù)包括:用于語(yǔ)調(diào)短語(yǔ)修正的韻律詞匯庫(kù)以及用于參數(shù)解碼音變規(guī)則的編碼數(shù)據(jù)庫(kù)和音變規(guī)則庫(kù)。

本發(fā)明還涉及文本語(yǔ)音播報(bào)系統(tǒng),包括:采集模塊、分析模塊、預(yù)測(cè)模塊和合成模塊;

所述采集模塊,用于采集文本信息;

所述分析模塊,用于分析所述文本信息,并提取出文本特征;

所述預(yù)測(cè)模塊,用于基于所述文本特征以及神經(jīng)網(wǎng)絡(luò)韻律模型預(yù)測(cè)所述文本信息對(duì)應(yīng)的韻律特征參數(shù);

所述合成模塊,用于根據(jù)所述韻律特征參數(shù)進(jìn)行語(yǔ)音合成并播放。

優(yōu)選的,還包括:切分模塊;

所述切分模塊,根據(jù)預(yù)先添加的添加語(yǔ)法知識(shí)庫(kù)和語(yǔ)法詞典,利用最大匹配算法對(duì)文本信息進(jìn)行切分。

優(yōu)選的,還包括:提取模塊;

所述提取模塊,用于根據(jù)詞語(yǔ)的屬性計(jì)算詞語(yǔ)權(quán)重,提取出文本關(guān)鍵詞;將切分得到的字和/或詞對(duì)應(yīng)的詞性以及關(guān)鍵詞及關(guān)鍵詞對(duì)應(yīng)的詞性作為文本信息對(duì)應(yīng)的文本特征。

優(yōu)選的,所述神經(jīng)網(wǎng)絡(luò)韻律模型是預(yù)先通過(guò)對(duì)語(yǔ)音材料庫(kù)基于神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練得到的。

優(yōu)選的,所述語(yǔ)音材料庫(kù)包括:用于語(yǔ)調(diào)短語(yǔ)修正的韻律詞匯庫(kù)以及用于參數(shù)解碼音變規(guī)則的編碼數(shù)據(jù)庫(kù)和音變規(guī)則庫(kù)。

相比現(xiàn)有技術(shù),本發(fā)明的有益效果在于:根據(jù)神經(jīng)網(wǎng)絡(luò)韻律模型預(yù)測(cè)所述文本信息對(duì)應(yīng)的韻律特征參數(shù)進(jìn)行語(yǔ)音合成,文本語(yǔ)音播報(bào)自然流暢。

附圖說(shuō)明

圖1為本發(fā)明一實(shí)施例提供的文本語(yǔ)音播報(bào)方法流程示意圖;

圖2為本發(fā)明一實(shí)施例提供的文本語(yǔ)音播報(bào)系統(tǒng)結(jié)構(gòu)示意圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

如圖1所示,本發(fā)明一實(shí)施例提供的文本語(yǔ)音播報(bào)方法,包括以下步驟:

步驟S101:采集文本信息。

具體的,智能設(shè)備上的應(yīng)用程序與文本播放模塊接口連接,應(yīng)用程序采集文本信息通過(guò)文本播放模塊接口將采集到的文本信息發(fā)送給對(duì)應(yīng)的文本播放模塊。文本播放模塊對(duì)文本進(jìn)行分析處理、特征提取已經(jīng)合成。

步驟S102:分析所述文本信息,并提取出文本特征。

具體的,文本播放模塊預(yù)先添加語(yǔ)法知識(shí)庫(kù)和語(yǔ)法詞典,本發(fā)明實(shí)施例中根據(jù)最大匹配算法確定分詞,并濾除不能反映主題的功能詞。

對(duì)采集到的文本信息,按照正向最大匹配算法,從左邊開(kāi)始取出等于預(yù)設(shè)最大詞長(zhǎng)數(shù)量的詞語(yǔ),查找語(yǔ)法知識(shí)庫(kù)和語(yǔ)法詞典中是否有所述詞語(yǔ),若沒(méi)有查找到,則去掉右邊第一個(gè)字繼續(xù)查找,依次循環(huán),直到從語(yǔ)法知識(shí)庫(kù)和語(yǔ)法詞典中查找到相應(yīng)的詞語(yǔ),則輸出詞語(yǔ),完成分詞過(guò)程。

能標(biāo)識(shí)文本特性的一般為文本中的名詞、動(dòng)詞、形容詞等,文本中的虛詞如感嘆詞、介詞、連詞等對(duì)標(biāo)識(shí)文本特性往往沒(méi)有貢獻(xiàn),不能反映主題,在提取文本特征前去掉不能反映主題的功能詞,提高文本特征提取的效率和準(zhǔn)確率。完成文本切分后,得到對(duì)應(yīng)的字和/或詞,將對(duì)應(yīng)的字和/或詞與其詞性關(guān)聯(lián)。

同時(shí),本發(fā)明實(shí)施例還根據(jù)詞語(yǔ)的屬性計(jì)算詞語(yǔ)權(quán)重,提取出文本關(guān)鍵詞。

詞語(yǔ)的詞性、詞語(yǔ)的長(zhǎng)度、詞語(yǔ)在文中出現(xiàn)的位置和頻率等多個(gè)因素影響詞語(yǔ)的權(quán)重,根據(jù)文本特征提取算法,將多種詞語(yǔ)影響因素引入評(píng)價(jià)函數(shù)計(jì)算詞語(yǔ)的權(quán)重提取出文本關(guān)鍵詞。

將得到的字和/或詞對(duì)應(yīng)的詞性以及關(guān)鍵詞及關(guān)鍵詞對(duì)應(yīng)的詞性作為文本信息對(duì)應(yīng)的文本特征。

步驟S103:基于所述文本特征以及神經(jīng)網(wǎng)絡(luò)韻律模型預(yù)測(cè)所述文本信息對(duì)應(yīng)的韻律特征參數(shù)。

具體的,本發(fā)明實(shí)施例中文本播放模塊包括預(yù)先建立的神經(jīng)網(wǎng)絡(luò)韻律模型。該神經(jīng)網(wǎng)絡(luò)韻律模型是通過(guò)對(duì)語(yǔ)音材料庫(kù)基于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練得到的,可以是基于現(xiàn)有的深度神經(jīng)網(wǎng)絡(luò)和雙向LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到。語(yǔ)音材料庫(kù)中的語(yǔ)句涵蓋了漢語(yǔ)中常見(jiàn)的句型、漢語(yǔ)中所有的語(yǔ)音、文字上下文的特性、聲調(diào)、重音等信息,使用語(yǔ)音材料庫(kù)中的句子對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和測(cè)試,合成的語(yǔ)音能體現(xiàn)不同的韻律特征,增加了系統(tǒng)的靈活性和風(fēng)格的多樣性。當(dāng)然具體的韻律模型也可以采用其他模型,比如隱馬克科夫韻律模型等。

在分析得到文本特征后,將對(duì)應(yīng)的文本特征輸入到神經(jīng)網(wǎng)絡(luò)韻律模型進(jìn)行預(yù)測(cè),得到對(duì)應(yīng)的字、詞的韻律特征參數(shù)。韻律特征參數(shù)包括譜參數(shù)以及基頻參數(shù)等。

優(yōu)選的,所述語(yǔ)音材料庫(kù)還包括:用于語(yǔ)調(diào)短語(yǔ)修正的韻律詞匯庫(kù)以及用于參數(shù)解碼音變規(guī)則的編碼數(shù)據(jù)庫(kù)和音變規(guī)則庫(kù)。用戶(hù)可以根據(jù)需要設(shè)置不同的音色,語(yǔ)音播報(bào)更多樣化。

步驟S104:根據(jù)所述韻律特征參數(shù)進(jìn)行語(yǔ)音合成并播放。

具體的,本發(fā)明實(shí)施例中,文本播報(bào)模塊的語(yǔ)音合成模塊,將韻律特征參數(shù)發(fā)送到聲碼器進(jìn)行語(yǔ)音合成,輸出音頻文件并發(fā)送到文本播報(bào)模塊的音頻播放器,完成語(yǔ)音播報(bào)的過(guò)程。

優(yōu)選的,步驟S104之前即在韻律特征參數(shù)發(fā)送給聲碼器進(jìn)行語(yǔ)音合成之前,還可以對(duì)神經(jīng)網(wǎng)絡(luò)韻律模型預(yù)測(cè)的韻律特征參數(shù)進(jìn)行優(yōu)化,比如對(duì)基頻參數(shù)進(jìn)行基頻重構(gòu),或者對(duì)譜參數(shù)以及重構(gòu)后的基頻參數(shù)進(jìn)行平滑處理。然后再將優(yōu)化后的韻律特征參數(shù)發(fā)送給聲碼器進(jìn)行語(yǔ)音合成。

本實(shí)施例提供的語(yǔ)音播報(bào)方法,克服了市面上類(lèi)似產(chǎn)品播報(bào)語(yǔ)音生硬不自然,音色單一的不足,讓文本的語(yǔ)音播報(bào)自然流暢,有更多不同的音色選擇,更大程度上接近于人的語(yǔ)言溝通。

本發(fā)明實(shí)施例還提供文本語(yǔ)音播報(bào)系統(tǒng),如圖2所示,包括:采集模塊11、分析模塊14、預(yù)測(cè)模塊15和合成模塊16;

所述采集模塊11,用于采集文本信息;

所述分析模塊14,用于分析所述文本信息,并提取出文本特征;

所述預(yù)測(cè)模塊15,用于基于所述文本特征以及神經(jīng)網(wǎng)絡(luò)韻律模型預(yù)測(cè)所述文本信息對(duì)應(yīng)的韻律特征參數(shù);

所述合成模塊16,用于根據(jù)所述韻律特征參數(shù)進(jìn)行語(yǔ)音合成并播放。

優(yōu)選的,還包括:切分模塊12;

所述切分模塊12,根據(jù)預(yù)先添加的添加語(yǔ)法知識(shí)庫(kù)和語(yǔ)法詞典,利用最大匹配算法對(duì)文本信息進(jìn)行切分。

優(yōu)選的,還包括:提取模塊13;

所述提取模塊13,用于根據(jù)詞語(yǔ)的屬性計(jì)算詞語(yǔ)權(quán)重,提取出文本關(guān)鍵詞;將切分得到的字和/或詞對(duì)應(yīng)的詞性以及關(guān)鍵詞及關(guān)鍵詞對(duì)應(yīng)的詞性作為文本信息對(duì)應(yīng)的文本特征。

優(yōu)選的,所述神經(jīng)網(wǎng)絡(luò)韻律模型是預(yù)先通過(guò)對(duì)語(yǔ)音材料庫(kù)進(jìn)行訓(xùn)練得到的。

優(yōu)選的,所述語(yǔ)音材料庫(kù)包括:用于語(yǔ)調(diào)短語(yǔ)修正的韻律詞匯庫(kù)以及用于參數(shù)解碼音變規(guī)則的編碼數(shù)據(jù)庫(kù)和音變規(guī)則庫(kù)。

本實(shí)施例中的系統(tǒng)與前述實(shí)施例中的方法是基于同一發(fā)明構(gòu)思下的兩個(gè)方面,在前面已經(jīng)對(duì)方法實(shí)施過(guò)程作了詳細(xì)的描述,所以本領(lǐng)域技術(shù)人員可根據(jù)前述描述清楚地了解本實(shí)施例中的系統(tǒng)的結(jié)構(gòu)及實(shí)施過(guò)程,為了說(shuō)明書(shū)的簡(jiǎn)潔,在此就不再贅述。

為了描述的方便,描述以上系統(tǒng)時(shí)以功能分為各種模塊分別描述。當(dāng)然,在實(shí)施本發(fā)明時(shí)可以把各模塊的功能在同一個(gè)或多個(gè)軟件和/或硬件中實(shí)現(xiàn)。

通過(guò)以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤(pán)等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。

本發(fā)明提供的語(yǔ)音播報(bào)方法及系統(tǒng),克服了市面上類(lèi)似產(chǎn)品播報(bào)語(yǔ)音生硬不自然,音色單一的不足,讓文本的語(yǔ)音播報(bào)自然流暢,有更多不同的音色選擇,更大程度上接近于人的語(yǔ)言溝通。

對(duì)本領(lǐng)域的技術(shù)人員來(lái)說(shuō),可根據(jù)以上描述的技術(shù)方案以及構(gòu)思,做出其它各種相應(yīng)的改變以及形變,而所有的這些改變以及形變都應(yīng)該屬于本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1