專(zhuān)利名稱(chēng):語(yǔ)音互動(dòng)系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)音互動(dòng)(Speech Interactive)系統(tǒng)與方法。
背景技術(shù):
目前許多的語(yǔ)音互動(dòng)系統(tǒng)或裝置的特色是使機(jī)器能自動(dòng)理解使用者的意圖而用 以達(dá)到某種特定標(biāo)的,例如通過(guò)語(yǔ)音命令方式來(lái)操控終端設(shè)備,使用語(yǔ)音對(duì)話來(lái)理解使用 者意圖,并回饋相對(duì)應(yīng)的信息或動(dòng)作。其要點(diǎn)在響應(yīng)與使用者的意圖相對(duì)應(yīng)的正確信息為 標(biāo)的,以符合使用者期望。另一類(lèi)的語(yǔ)音互動(dòng)系統(tǒng)或裝置的特色是用來(lái)學(xué)習(xí)語(yǔ)言,其應(yīng)用主 要是通過(guò)學(xué)習(xí)者所輸入的語(yǔ)音來(lái)進(jìn)行對(duì)話和響應(yīng)或進(jìn)行發(fā)音評(píng)量,以達(dá)到認(rèn)知學(xué)習(xí)標(biāo)的。 此類(lèi)的語(yǔ)音互動(dòng)系統(tǒng)或裝置的實(shí)現(xiàn)方式也常是以響應(yīng)與使用者的意圖相對(duì)應(yīng)的正確信息 為標(biāo)的來(lái)實(shí)施,其施行的學(xué)習(xí)策略大概含有以下幾個(gè)要點(diǎn)。(1)以直接教導(dǎo)來(lái)傳達(dá)信息,并通過(guò)練習(xí)來(lái)達(dá)到認(rèn)知學(xué)習(xí)標(biāo)的;⑵輔以可視化信 息,以問(wèn)題或回饋來(lái)達(dá)到認(rèn)知學(xué)習(xí)標(biāo)的;(3)以探究式或發(fā)現(xiàn)式學(xué)習(xí)策略,并搭配計(jì)算機(jī)仿 真信息或以虛擬實(shí)境的對(duì)象為探索對(duì)象來(lái)建構(gòu)知識(shí);(4)以評(píng)量問(wèn)卷來(lái)檢視學(xué)習(xí)成果以及 學(xué)習(xí)歷程,以激勵(lì)學(xué)習(xí)者的自律學(xué)習(xí)?;旧隙喟攵际且灾苯咏虒?dǎo)或以引導(dǎo)式做法來(lái)促進(jìn) 學(xué)習(xí)。語(yǔ)音互動(dòng)的現(xiàn)有文獻(xiàn)有很多,例如中國(guó)臺(tái)灣專(zhuān)利證書(shū)號(hào)11247249揭露的交互式 智能型語(yǔ)言教學(xué)玩偶,其利用因特網(wǎng)為基礎(chǔ)的數(shù)字內(nèi)容下載程序以及以虛擬玩偶為人機(jī)接 口,提供交互式智能型語(yǔ)言教學(xué)與導(dǎo)正。通過(guò)交互式玩偶提供語(yǔ)音辨識(shí)處理,并利用玩偶內(nèi) 建或自網(wǎng)絡(luò)上下載的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)庫(kù),實(shí)時(shí)判斷兒童的發(fā)音是否正確以及提供正確對(duì)話的 導(dǎo)引。而中國(guó)臺(tái)灣專(zhuān)利證書(shū)號(hào)M244956揭露的一種具有雙向?qū)υ捁δ艿恼Z(yǔ)音玩具,是將一 麥克風(fēng)、語(yǔ)音控制裝置、播放器及周邊裝置固設(shè)于一玩偶本體內(nèi),外界所輸入的語(yǔ)詞可通過(guò) 麥克風(fēng)而被傳輸至語(yǔ)音控制裝置,語(yǔ)音控制裝置判斷此輸入語(yǔ)詞并依據(jù)輸入語(yǔ)詞來(lái)發(fā)出執(zhí) 行指令,進(jìn)而控制播放器播報(bào)時(shí)間數(shù)據(jù)或輸出語(yǔ)詞,也可以控制周邊裝置投射絢爛光源或 擺動(dòng)玩偶本體,并且每一輸入語(yǔ)詞皆具有多個(gè)相對(duì)應(yīng)的輸出語(yǔ)詞。中國(guó)專(zhuān)利公開(kāi)號(hào)CN 1581130A揭露一種具語(yǔ)音辨識(shí)的交互式語(yǔ)言學(xué)習(xí)方法,包 括檢索并播放語(yǔ)音聲音數(shù)據(jù);辨識(shí)輸入的一個(gè)練習(xí)者的練習(xí)聲音信號(hào),并產(chǎn)生語(yǔ)音辨識(shí) 數(shù)據(jù);以及比對(duì)此兩數(shù)據(jù)以產(chǎn)生一個(gè)近似度值,并根據(jù)此近似度值來(lái)決定練習(xí)者練習(xí)此語(yǔ) 音聲音數(shù)據(jù)的正確性。而中國(guó)專(zhuān)利公開(kāi)號(hào)CN 101064070A揭露的交互式智能型語(yǔ)言教學(xué)玩 偶系統(tǒng)系利用可網(wǎng)絡(luò)連結(jié),可語(yǔ)音辨識(shí)的智能型玩偶進(jìn)行語(yǔ)言教學(xué),以玩偶當(dāng)系統(tǒng)前臺(tái),以 網(wǎng)絡(luò)服務(wù)器為后臺(tái)記錄與儲(chǔ)存系統(tǒng)相關(guān)的數(shù)據(jù),提供一個(gè)適合兒童的自動(dòng)化語(yǔ)言教學(xué)輔助 系統(tǒng)。美國(guó)專(zhuān)利案5,281,143揭露一種學(xué)習(xí)玩偶(Learning Doll) 100,如圖1所示,學(xué)習(xí) 玩偶包含一頭部(Head) 102和一本體(Body) 104。當(dāng)電源是關(guān)閉時(shí),可通過(guò)輕吻(Kiss) 106 此玩偶來(lái)觸動(dòng)開(kāi)關(guān)108以開(kāi)起電源,并且通知微處理器暨語(yǔ)音合成器(Microprocessor And Speech Synthesizer) 110觸動(dòng)檢測(cè)機(jī)制已經(jīng)被觸發(fā)了。微處理器暨語(yǔ)音合成器110通過(guò)電源放大器/濾波器(Power Amplifier/Filter) 116將聲音傳遞至麥克風(fēng)114。微處理器暨語(yǔ) 音合成器110通過(guò)傾聽(tīng)放大器(listen Amplifier) 120也會(huì)檢測(cè)出在麥克風(fēng)114發(fā)出的聲 音。微處理器暨語(yǔ)音合成器110也可以觸動(dòng)頭部102里的電子馬達(dá)(Electric Motor) 122, 使玩偶的嘴唇配合合成的語(yǔ)音間歇地振動(dòng),而更加栩栩如生。依此,玩偶可通過(guò)學(xué)習(xí)者語(yǔ)音 (Human Speech)與交互式接觸(Touch Interaction)的組合,進(jìn)行語(yǔ)言教學(xué)。
發(fā)明內(nèi)容
欲解決的技術(shù)問(wèn)題現(xiàn)有技術(shù)文獻(xiàn)中尚未見(jiàn)到以教學(xué)相長(zhǎng)(Learning By Teaching)為標(biāo)的來(lái)設(shè)計(jì)語(yǔ)音互動(dòng)的機(jī)制,以激勵(lì)學(xué)習(xí)者持續(xù)對(duì)該學(xué)習(xí)內(nèi)涵做正確的練習(xí), 以使被教導(dǎo)的虛擬或?qū)嶓w對(duì)象最后能做出正確的回應(yīng),讓學(xué)習(xí)者通過(guò)教導(dǎo)來(lái)達(dá)到學(xué)習(xí)目 的,為此,本發(fā)明的目的是提供一種語(yǔ)音互動(dòng)系統(tǒng)與方法。為達(dá)成所述目的,根據(jù)本發(fā)明所揭露的實(shí)施范例中,可提供一種語(yǔ)音互動(dòng)系統(tǒng)與 方法。在一實(shí)施范例中,所揭露的是有關(guān)于一種語(yǔ)音互動(dòng)系統(tǒng),此系統(tǒng)包含一目標(biāo)信息 接收模塊、一互動(dòng)模式設(shè)定與語(yǔ)音處理模塊、一互動(dòng)信息更新模塊、一決策模塊、以及一輸 出響應(yīng)模塊。目標(biāo)信息接收模塊接收目標(biāo)信息并設(shè)定相對(duì)應(yīng)的目標(biāo)文句信息?;?dòng)模式設(shè) 定與語(yǔ)音處理模塊接收使用者語(yǔ)音信號(hào),設(shè)定一互動(dòng)模式與決定語(yǔ)音的目標(biāo)文句信息,并 輸出目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果。互動(dòng)信息更新模塊在設(shè)定的互動(dòng)模式下,根據(jù)此目標(biāo)文句 信息以及一時(shí)間計(jì)數(shù),更新一互動(dòng)信息記錄表。決策模塊根據(jù)互動(dòng)模式設(shè)定與語(yǔ)音處理模 塊設(shè)定的互動(dòng)模式和互動(dòng)信息記錄表的信息來(lái)決定目標(biāo)文句信息的輸出模式。輸出響應(yīng)模 塊根據(jù)決策模塊決定的輸出模式和互動(dòng)信息記錄表的信息來(lái)輸出響應(yīng)信息。在另一實(shí)施范例中,所揭露的是有關(guān)于一種語(yǔ)音互動(dòng)方法,此方法包含準(zhǔn)備一互 動(dòng)信息記錄表來(lái)記錄語(yǔ)音互動(dòng)文句信息接收使用者輸入的語(yǔ)音信號(hào)并決定語(yǔ)音的目標(biāo)文 句信息或同時(shí)接收給定的目標(biāo)文句信息,以提供使用者以不同的互動(dòng)模式進(jìn)行語(yǔ)音互動(dòng)操 作;對(duì)目標(biāo)文句信息進(jìn)行語(yǔ)音評(píng)量并產(chǎn)生一語(yǔ)音評(píng)量結(jié)果;若同時(shí)接收給定的目標(biāo)文句信 息,則根據(jù)所產(chǎn)生的語(yǔ)音評(píng)量結(jié)果和一時(shí)間計(jì)數(shù),更新此互動(dòng)信息記錄表的信息;根據(jù)不同 的互動(dòng)模式和此互動(dòng)信息記錄表的信息來(lái)決定目標(biāo)文句信息的輸出模式;以及根據(jù)決定的 輸出模式和此互動(dòng)信息記錄表的信息來(lái)輸出響應(yīng)信息。
圖1是一種現(xiàn)有的學(xué)習(xí)玩偶的一個(gè)范例示意圖。圖2是一種語(yǔ)音互動(dòng)系統(tǒng)的一個(gè)范例示意圖,并且與本發(fā)明的某些揭露的實(shí)施范
例一致。圖3是互動(dòng)模式設(shè)定與語(yǔ)音處理模塊的一個(gè)范例示意圖,并且與本發(fā)明的某些揭 露的實(shí)施范例一致。圖4是一個(gè)范例流程圖,說(shuō)明語(yǔ)音評(píng)量的運(yùn)作,并且與本發(fā)明的某些揭露的實(shí)施 范例一致。圖5是互動(dòng)信息記錄表的一個(gè)范例示意圖,并且與本發(fā)明的某些揭露的實(shí)施范例一致。
圖6是一個(gè)范例示意圖,說(shuō)明互動(dòng)信息更新模塊與一時(shí)間計(jì)數(shù)器之間的運(yùn)作,并 且與本發(fā)明的某些揭露的實(shí)施范例一致。圖7是一個(gè)范例示意圖,說(shuō)明決策模塊的細(xì)部運(yùn)作,并且與本發(fā)明的某些揭露的 實(shí)施范例一致。圖8是一個(gè)范例示意圖,說(shuō)明輸出響應(yīng)模塊的細(xì)部運(yùn)作,并且與本發(fā)明的某些揭 露的實(shí)施范例一致。圖9是一個(gè)范例流程,說(shuō)明中間狀態(tài)輸出的運(yùn)作過(guò)程,并且與本發(fā)明的某些揭露 的實(shí)施范例一致。圖10是語(yǔ)音互動(dòng)系統(tǒng)在教學(xué)模式下的一個(gè)工作范例,并且與本發(fā)明的某些揭露 的實(shí)施范例一致。圖11是語(yǔ)音互動(dòng)系統(tǒng)在交談模式下的一的一個(gè)工作范例,并且與本發(fā)明的某些 揭露的實(shí)施范例一致。圖12是語(yǔ)音互動(dòng)系統(tǒng)應(yīng)用于一玩具本體上的一的一個(gè)范例示意圖,并且與本發(fā) 明的某些揭露的實(shí)施范例一致。圖13是一范例示意圖,說(shuō)明本揭露的語(yǔ)音互動(dòng)方法的主要步驟,并且與本發(fā)明的 某些揭露的實(shí)施范例一致。主要元件符號(hào)說(shuō)明
具體實(shí)施例方式茲配合下列圖標(biāo)、實(shí)施范例的詳細(xì)說(shuō)明及申請(qǐng)專(zhuān)利范圍,將上述及本發(fā)明的其它 特征與優(yōu)點(diǎn)詳述于后。本發(fā)明以教學(xué)相長(zhǎng)為標(biāo)的之一來(lái)設(shè)計(jì)語(yǔ)音互動(dòng)系統(tǒng)與方法。此教學(xué)相長(zhǎng)的內(nèi)涵 是,學(xué)習(xí)者先了解學(xué)習(xí)內(nèi)涵,并通過(guò)對(duì)該學(xué)習(xí)內(nèi)涵的認(rèn)知來(lái)對(duì)某一虛擬或?qū)嶓w對(duì)象進(jìn)行教 導(dǎo),通過(guò)該虛擬或?qū)嶓w對(duì)象的響應(yīng)來(lái)讓學(xué)習(xí)者了解該虛擬或?qū)嶓w對(duì)象的學(xué)習(xí)狀態(tài),以激勵(lì) 學(xué)習(xí)者持續(xù)對(duì)該學(xué)習(xí)內(nèi)涵做正確的練習(xí),以使該虛擬或?qū)嶓w對(duì)象最后能做出正確的回應(yīng), 讓學(xué)習(xí)者通過(guò)教導(dǎo)來(lái)達(dá)到學(xué)習(xí)目的。本揭露的實(shí)施范例中,創(chuàng)造出一種虛擬或?qū)嶓w系統(tǒng),讓學(xué)習(xí)者能通過(guò)語(yǔ)音與之互 動(dòng);建構(gòu)了一種可接收虛擬或?qū)嶓w學(xué)習(xí)標(biāo)的功能的機(jī)制,讓學(xué)習(xí)者能依照其需求設(shè)定學(xué)習(xí) 標(biāo)的;建構(gòu)了一種語(yǔ)音互動(dòng)機(jī)制,讓此虛擬或?qū)嶓w系統(tǒng)能接收并認(rèn)知學(xué)習(xí)者對(duì)此學(xué)習(xí)標(biāo)的 所輸入的語(yǔ)音并作語(yǔ)音評(píng)量;為此虛擬或?qū)嶓w系統(tǒng)建構(gòu)一種遺忘機(jī)制,來(lái)督促學(xué)習(xí)者能對(duì) 學(xué)習(xí)標(biāo)的做持續(xù)性的練習(xí);建構(gòu)了可輸出此虛擬或?qū)嶓w對(duì)象對(duì)學(xué)習(xí)標(biāo)的學(xué)習(xí)狀態(tài),讓學(xué)習(xí) 者或其它使用者通過(guò)此虛擬或?qū)嶓w對(duì)象的輸出響應(yīng)來(lái)了解學(xué)習(xí)者對(duì)學(xué)習(xí)標(biāo)的認(rèn)知情形。依此,圖2是一種語(yǔ)音互動(dòng)系統(tǒng)的一個(gè)范例示意圖,并且與本發(fā)明的某些揭露的 實(shí)施范例一致。參考圖2,語(yǔ)音互動(dòng)系統(tǒng)200包含一目標(biāo)信息接收模塊210、一互動(dòng)模式設(shè)定 與語(yǔ)音處理模塊220、一互動(dòng)信息更新模塊230、一決策模塊240、以及一輸出響應(yīng)模塊250。 目標(biāo)信息接收模塊210接收目標(biāo)信息210a并設(shè)定相對(duì)應(yīng)的目標(biāo)文句信息210b。互動(dòng)模式 設(shè)定與語(yǔ)音處理模塊220接收使用者語(yǔ)音信號(hào)220a,設(shè)定一互動(dòng)模式220b與決定語(yǔ)音的目 標(biāo)文句信息,并輸出目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果220c?;?dòng)信息更新模塊230根據(jù)來(lái)自互動(dòng) 模式設(shè)定與語(yǔ)音處理模塊220的目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果220c以及一時(shí)間計(jì)數(shù)230a,更新一互動(dòng)信息記錄表230b。決策模塊240根據(jù)互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220設(shè)定的互動(dòng) 模式220b和互動(dòng)信息記錄表230b的信息來(lái)決定目標(biāo)文句信息的輸出模式240b。輸出響應(yīng) 模塊250根據(jù)決策模塊240決定的輸出模式240b和互動(dòng)信息記錄表230b的信息來(lái)輸出響 應(yīng)信息250b。如此,讓學(xué)習(xí)者或其它使用者通過(guò)此響應(yīng)信息250b來(lái)了解學(xué)習(xí)者對(duì)學(xué)習(xí)標(biāo)的 認(rèn)知情形。時(shí)間計(jì)數(shù)230a可通過(guò)一時(shí)間計(jì)數(shù)器來(lái)產(chǎn)生?;?dòng)信息記錄表230b記錄語(yǔ)音互 動(dòng)文句的信息。根據(jù)本發(fā)明,語(yǔ)音互動(dòng)系統(tǒng)200可讓使用者以不同模式進(jìn)行語(yǔ)音互動(dòng)操作,也就 是說(shuō),互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220設(shè)定的互動(dòng)模式220b可以有不同的內(nèi)涵,例如其 內(nèi)涵可為教學(xué)模式或交談模式等。而互動(dòng)操作的標(biāo)的設(shè)定可由使用者所輸入的語(yǔ)音信號(hào)或 是同時(shí)給定目標(biāo)信息來(lái)進(jìn)行設(shè)定,此互動(dòng)操作的標(biāo)的設(shè)定可用下列式子來(lái)表示?;?dòng)標(biāo)的=f (輸入目標(biāo)i語(yǔ)音,輸入目標(biāo)j信息),其中若(i = j)或(j = NULL),則互動(dòng)標(biāo)的=目標(biāo)i,若(i乒j),則互動(dòng)標(biāo)的=目標(biāo)j,若(i= NULL),則互動(dòng)標(biāo)的=NULL。以上式子的含意為(a)當(dāng)僅有使用者語(yǔ)音信號(hào)輸入時(shí)(即j為NULL的情況),互 動(dòng)操作的標(biāo)的(即互動(dòng)標(biāo)的)為該語(yǔ)音信號(hào)所指述的目標(biāo)文句(Target Speech)信息(即 互動(dòng)標(biāo)的=目標(biāo)i) ; (b)當(dāng)有給定目標(biāo)信息和語(yǔ)音信號(hào)輸入時(shí),該語(yǔ)音信號(hào)所指述的目標(biāo) 文句信息必須與給定的目標(biāo)信息所對(duì)應(yīng)的目標(biāo)文句信息一致(即i = j的情況),互動(dòng)操作 的標(biāo)的始為上述該二者所指述的目標(biāo)文句信息(互動(dòng)標(biāo)的=即目標(biāo)i) ; (c)當(dāng)輸入的語(yǔ)音 信號(hào)所指述的目標(biāo)文句信息與給定的目標(biāo)信息所對(duì)應(yīng)的目標(biāo)文句信息不一致時(shí)(即i興j 的情況),則互動(dòng)操作的標(biāo)的為該給定的目標(biāo)信息所對(duì)應(yīng)的目標(biāo)文句信息(即互動(dòng)標(biāo)的= 目標(biāo)j) ; (d)當(dāng)無(wú)語(yǔ)音信號(hào)輸入時(shí)(即i為NULL的情況),則無(wú)互動(dòng)操作的標(biāo)的(即互動(dòng) 標(biāo)的=NULL)。而互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220的互動(dòng)模式220b的設(shè)定則端看是否給定目 標(biāo)信息210a而定。當(dāng)給定目標(biāo)信息210a時(shí),互動(dòng)模式220b的內(nèi)涵為教學(xué)模式,否則為交 談模式。對(duì)應(yīng)到上述互動(dòng)操作標(biāo)的設(shè)定,教學(xué)模式為上述(b)與(c)的情況,而交談模式為 上述(a)的情況?;?dòng)模式220b的內(nèi)涵為教學(xué)模式時(shí),此教學(xué)模式的信息是傳送給互動(dòng)信 息更新模塊230?;?dòng)模式220b的內(nèi)涵為交談模式時(shí),此交談模式的信息是傳送給決策模 塊 240。承上述,圖3是互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220的一個(gè)范例示意圖,并且與本 發(fā)明的某些揭露的實(shí)施范例一致。參考圖3,目標(biāo)信息接收模塊210于接收目標(biāo)信息210a 后,取得目標(biāo)信息210a所設(shè)定的目標(biāo)項(xiàng)目(Target Item)信息210b,并將此目標(biāo)項(xiàng)目信 息傳送給互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220。例如目標(biāo)信息接收模塊210接收到目標(biāo)信 息“Apple”,將目標(biāo)信息“Apple”傳送給互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220。目標(biāo)信息和 目標(biāo)信息接收模塊例如可以使用無(wú)線射頻識(shí)別(Radio Frequency Identification, RFID) 標(biāo)簽(Tag)和RFID讀取器(Reader)、或是條形碼(Barcode)和條形碼讀取器(Barcode Reader)、或是對(duì)象(Object)和對(duì)象圖像辨識(shí)(Object-Oriented Image identification)、 或是屏幕選單列舉(Screen Menu List)和選單點(diǎn)選、或是其它可能的技術(shù)手段來(lái)達(dá)成?;?dòng)模式設(shè)定與語(yǔ)音處理模塊220于接收目標(biāo)項(xiàng)目信息后,設(shè)定目前操作模式為
10教學(xué)模式301a,之后依照目標(biāo)項(xiàng)目信息自互動(dòng)信息記錄表取得對(duì)應(yīng)的互動(dòng)文句,并等待使 用者輸入語(yǔ)音信號(hào)。當(dāng)使用者輸入語(yǔ)音信號(hào)時(shí),依照該互動(dòng)文句對(duì)該語(yǔ)音信號(hào)進(jìn)行語(yǔ)音評(píng) 量310。當(dāng)使用者未給定目標(biāo)信息而僅有語(yǔ)音信號(hào)輸入互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220 時(shí),設(shè)定目前操作模式為交談模式301b后,語(yǔ)音辨識(shí)單元320以互動(dòng)信息記錄表里所有的 互動(dòng)文句為辨識(shí)標(biāo)的來(lái)辨識(shí)出該輸入的語(yǔ)音信號(hào)所對(duì)應(yīng)的目標(biāo)文句,并以該目標(biāo)文句和該 輸入語(yǔ)音信號(hào)進(jìn)行語(yǔ)音評(píng)量310。圖4是一個(gè)范例流程圖,說(shuō)明語(yǔ)音評(píng)量的運(yùn)作,并且與本發(fā)明的某些揭露的實(shí)施 范例一致。參考圖4,根據(jù)從互動(dòng)信息記錄表取得對(duì)應(yīng)的互動(dòng)文句410a,以一語(yǔ)句驗(yàn)證方 法(Utterance Verification) 410驗(yàn)證輸入的語(yǔ)音信號(hào),并取得一驗(yàn)證分?jǐn)?shù)410b。根據(jù)本 發(fā)明,也可使用其它可衡量輸入的語(yǔ)音信號(hào)與互動(dòng)文句410a的關(guān)聯(lián)性分?jǐn)?shù)作為驗(yàn)證分?jǐn)?shù) 410b來(lái)運(yùn)作,例如以語(yǔ)音辨識(shí)分?jǐn)?shù)作為驗(yàn)證分?jǐn)?shù)。取得驗(yàn)證分?jǐn)?shù)之后,將驗(yàn)證分?jǐn)?shù)410b與 一設(shè)定的門(mén)檻值做比較,如步驟420所示。當(dāng)該驗(yàn)證分?jǐn)?shù)大于該門(mén)檻值時(shí),則該輸入的語(yǔ)音 信號(hào)為一合格語(yǔ)音,否則為一不合格語(yǔ)音。當(dāng)輸入的語(yǔ)音信號(hào)為一合格語(yǔ)音時(shí),在目前操作模式為教學(xué)模式下,其后續(xù)的處 理依序包括進(jìn)行門(mén)檻調(diào)校、更新目前的互動(dòng)文句信息、以及進(jìn)入決策模塊做處理等。門(mén)檻 調(diào)校的用意是避免過(guò)高的門(mén)檻值設(shè)定可能造成使用者無(wú)法使用的問(wèn)題或是過(guò)低的門(mén)檻值 設(shè)定可能造成使用者任意輸入非該互動(dòng)文句的評(píng)量效果低落問(wèn)題。門(mén)檻值的設(shè)定也可以使 用一動(dòng)態(tài)調(diào)校方法做門(mén)檻值的調(diào)校,以使該門(mén)檻值能依照使用者的語(yǔ)音特性來(lái)進(jìn)行動(dòng)態(tài)調(diào) 整。門(mén)檻值的調(diào)整例如可以參考前幾次驗(yàn)證分?jǐn)?shù)做門(mén)檻調(diào)整,一開(kāi)始可設(shè)定一較低門(mén)檻值 (此門(mén)檻可事先收集訓(xùn)練信息取得),之后可取用高于設(shè)定門(mén)檻值的驗(yàn)證分?jǐn)?shù)或是參考其 數(shù)次驗(yàn)證分?jǐn)?shù)的線性組合,來(lái)進(jìn)行動(dòng)態(tài)調(diào)校。經(jīng)過(guò)門(mén)檻調(diào)校之后可得到一新的門(mén)檻調(diào)校值, 可作為下次語(yǔ)句驗(yàn)證門(mén)檻判斷使用并提供給互動(dòng)信息更新模塊參考使用。當(dāng)輸入的語(yǔ)音信號(hào)為一合格語(yǔ)音時(shí),而在目前操作模式為交談模式下,則直接進(jìn) 入決策模塊做處理。當(dāng)輸入的語(yǔ)音信號(hào)為不合格語(yǔ)音時(shí),也是直接進(jìn)入決策模塊做處理。互動(dòng)信息更新模塊230接收互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220所傳遞的目標(biāo)文句 信息后,依此更新互動(dòng)信息記錄表230b。此目標(biāo)文句信息可包括如輸入語(yǔ)音信號(hào)對(duì)應(yīng)于該 目標(biāo)文句的互動(dòng)文句、驗(yàn)證分?jǐn)?shù)以及門(mén)檻調(diào)校值。在本揭露的實(shí)施范例中,于互動(dòng)信息記錄 表230b里定義了幾個(gè)關(guān)于目標(biāo)詞語(yǔ)的相對(duì)應(yīng)的信息,例如互動(dòng)文句、累積教導(dǎo)成效、評(píng)量 門(mén)檻、難度、目標(biāo)詞語(yǔ)的響應(yīng)信息等。目標(biāo)詞語(yǔ)的響應(yīng)信息可以是多媒體信息如圖像或語(yǔ)音 等。圖5是互動(dòng)信息記錄表230b的一個(gè)范例示意圖,并且與本發(fā)明的某些揭露的實(shí)施范例 一致。圖5的范例中,一開(kāi)始尚未使用前的信息為默認(rèn)值,譬如目標(biāo)文句“Grape”的 互動(dòng)文句、累積教導(dǎo)成效、評(píng)量門(mén)檻、難度、目標(biāo)詞語(yǔ)的響應(yīng)信息的默認(rèn)值分別為Grape、 0.0、-5. 5、10.0、以及Grape的圖像和語(yǔ)音。而每一目標(biāo)文句的默認(rèn)值可以是不相同的設(shè) 定,譬如目標(biāo)文句“Apple”與目標(biāo)文句“This is a pencil ”的難度分為8. 0與30. 0,以強(qiáng) 調(diào)不同目標(biāo)文句的學(xué)習(xí)難度。由互動(dòng)模式設(shè)定與語(yǔ)音處理模塊所傳來(lái)的門(mén)檻調(diào)校值可以 直接取代目標(biāo)詞語(yǔ)的相對(duì)應(yīng)的評(píng)量門(mén)檻的信息,而累積教導(dǎo)成效可以用一個(gè)算式范例來(lái)得 出累積教導(dǎo)成效
11
=目前教導(dǎo)成效LC+之前的累積教導(dǎo)成效LT,其中,目前教導(dǎo)成效LC是驗(yàn)證分?jǐn)?shù)與評(píng)量門(mén)檻的函數(shù),例如是驗(yàn)證分?jǐn)?shù)與評(píng)量門(mén) 檻兩者的差值;而之前的累積教導(dǎo)成效LT若大于等于難度的話,則之前的累積教導(dǎo)成效LT
等于難度。例如,互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220傳遞目標(biāo)文句“Apple”的驗(yàn)證分?jǐn)?shù)以及 門(mén)檻調(diào)校值分別為-2. 0與-3. 0,而互動(dòng)信息記錄表中,此目標(biāo)文句“Apple”的累積教導(dǎo)成 效LT為2. 5,則利用此算式范例算出累積教導(dǎo)成效=(-2.0-(-3. 0))+2. 5 = 1. 0+2. 5 = 3. 5,也就是說(shuō),目標(biāo)文句“Apple”的累積教導(dǎo)成效為3. 5。換句話說(shuō),將使用者所發(fā)出來(lái)的語(yǔ)音評(píng)量分?jǐn)?shù)視為是使用者對(duì)互動(dòng)標(biāo)的教導(dǎo)成 效,并且是以使用者自己的語(yǔ)音特性所調(diào)校出來(lái)的評(píng)量門(mén)檻作為基礎(chǔ)所評(píng)出來(lái)的分?jǐn)?shù)。因 此,雖然不同使用者因?yàn)檎Z(yǔ)音特性的不同,可能會(huì)有不同評(píng)量門(mén)檻,但在教導(dǎo)成效的表現(xiàn)卻 是相似的,并且因?yàn)樵u(píng)量門(mén)檻會(huì)藉使用者過(guò)去的發(fā)音做動(dòng)態(tài)調(diào)整,經(jīng)過(guò)多次的調(diào)整之后,評(píng) 量門(mén)檻會(huì)逐漸趨向穩(wěn)定并符合使用者語(yǔ)音特性,也就迫使使用者必須要念出正確的發(fā)音始 能獲得好的教導(dǎo)成效(始能獲得正向的響應(yīng)信息)。如此,可期許使用者能通過(guò)正確的教導(dǎo) 帶來(lái)正確的學(xué)習(xí)效果。另一個(gè)關(guān)于累積教導(dǎo)成效的算式范例是與擱置時(shí)間AT有關(guān)。當(dāng)學(xué)習(xí)者有一段 時(shí)間沒(méi)有練習(xí)互動(dòng)文句,將會(huì)漸漸遺忘此互動(dòng)文句,本揭露的實(shí)施范例中,建立一種遺忘機(jī) 制,來(lái)督促學(xué)習(xí)者能對(duì)學(xué)習(xí)標(biāo)的做持續(xù)性的練習(xí)。根據(jù)本發(fā)明,遺忘信息與累積教導(dǎo)成效之 間的關(guān)系可以用下列的算式范例來(lái)表達(dá)累積教導(dǎo)成效LT+AT =累積教導(dǎo)成效LT-遺忘FT,若0 < LT <難度,則 FT = (1-LT/ 難度)Xw ;若LT 彡難度,或 LT = 0,則 FT = 0 ;若FT 彡 LT,則 FT = LT ;其中,擱置時(shí)間AT為距離上次更新學(xué)習(xí)目標(biāo)文句的單位時(shí)間,w為一權(quán)重。而每 到達(dá)AT時(shí),更新一次累積教導(dǎo)成效,權(quán)重w用來(lái)加強(qiáng)或降低因?qū)W習(xí)怠惰的懲罰。本揭露中,將LT/難度視為是學(xué)習(xí)者對(duì)目標(biāo)文句的習(xí)得程度,故此遺忘的算式 (1-LT/難度)視為是學(xué)習(xí)者對(duì)目標(biāo)文句尚未習(xí)得的程度,也就是說(shuō),此遺忘的算式(1-LT/ 難度)的值可經(jīng)由累積教導(dǎo)成效與難度此兩參數(shù)計(jì)算而得出,將此值視為是遺忘的因素。 依此,隨著時(shí)間增加,更新次數(shù)增加,累積教導(dǎo)成效LT也將隨著遞減,直到LT等于0為止。 所以,如圖6的范例所示,在教學(xué)模式下,除了從互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220傳遞到 互動(dòng)信息更新模塊230的信息會(huì)對(duì)互動(dòng)信息記錄表,如范例630b做更新之外,也會(huì)通過(guò)一 時(shí)間計(jì)數(shù)器630在每一個(gè)單位時(shí)間AT時(shí),對(duì)互動(dòng)信息記錄表引發(fā)一次更新。在實(shí)做上,單 位時(shí)間AT例如可以設(shè)定每一小時(shí)或每一天更新一次,或是可以在互動(dòng)信息記錄表里為每 一目標(biāo)文句增加一個(gè)記錄更新時(shí)間字段,以更仔細(xì)的依照更新時(shí)間進(jìn)行目標(biāo)文句的信息更 新。在教學(xué)模式下,互動(dòng)信息更新模塊230完成對(duì)互動(dòng)信息記錄表230b里的目標(biāo)文句 更新互動(dòng)信息之后,即進(jìn)入決策模塊240,以根據(jù)互動(dòng)信息記錄表230b的信息來(lái)輸出決策 240b,并由輸出響應(yīng)模塊250來(lái)輸出響應(yīng)信息250b。以下搭配圖7與圖8的范例,分別說(shuō)明
12決策模塊240與輸出響應(yīng)模塊250之間的細(xì)部運(yùn)作,并且與本發(fā)明的某些揭露的實(shí)施范例一致。圖7的范例中,決策模塊240判斷輸入語(yǔ)音是否為一合格語(yǔ)音,如標(biāo)號(hào)710所示。 若非合格語(yǔ)音,則依照不同的互動(dòng)模式來(lái)決定輸出響應(yīng)為“無(wú)目標(biāo)文句”或是“具目標(biāo)文句” 的疑惑輸出(Confused Output)。若互動(dòng)模式為交談模式,則其輸出方式為“無(wú)目標(biāo)文句” 的疑惑輸出,如范例741所示。若互動(dòng)模式為教學(xué)模式,則其輸出方式為“具目標(biāo)文句”的 疑惑輸出,如范例742所示。兩者的差異在于是否可表現(xiàn)出相對(duì)應(yīng)標(biāo)的文句的輸出響應(yīng),譬 如是否將標(biāo)的文句的對(duì)應(yīng)圖像(此范例圖像是一粒蘋(píng)果)呈現(xiàn)出來(lái)。而兩者的相同處在表 達(dá)對(duì)輸入語(yǔ)音的疑惑反應(yīng),以要求使用者重新作輸入的表達(dá)。在實(shí)作上,兩者的響應(yīng)可以視需要來(lái)做多樣化的設(shè)計(jì)或是簡(jiǎn)化的設(shè)計(jì),譬如以多 種輸出的圖像或語(yǔ)音來(lái)表達(dá)“無(wú)目標(biāo)文句”或是“具目標(biāo)文句”的疑惑輸出,以豐富響應(yīng)的 表現(xiàn)型式,或是不論何種操作模式皆用同一種疑惑反應(yīng)為輸出響應(yīng)來(lái)簡(jiǎn)化表現(xiàn)型式。對(duì)于 “具目標(biāo)文句”的疑惑輸出,也可以再加入該目標(biāo)文句的正確輸出響應(yīng)(Learned Output), 如范例743所示。此正確輸出響應(yīng)可以教導(dǎo)學(xué)習(xí)者對(duì)該目標(biāo)文句的正確表達(dá),也可以讓學(xué) 習(xí)者了解該目標(biāo)信息與正確輸出響應(yīng)之間的對(duì)應(yīng)關(guān)系,如此,學(xué)習(xí)者縱使在無(wú)旁人教導(dǎo)下 也能做自我學(xué)習(xí)。此教導(dǎo)學(xué)習(xí)者的引發(fā)動(dòng)作是出現(xiàn)在當(dāng)目標(biāo)信息和學(xué)習(xí)者的語(yǔ)音與實(shí)際發(fā) 音差異甚大時(shí),亦即輸入語(yǔ)音為不合格語(yǔ)音的情形。像無(wú)目標(biāo)信息情況(不易確實(shí)掌握學(xué) 習(xí)者實(shí)際意圖)或是合格的語(yǔ)音輸入(學(xué)習(xí)者已知如何發(fā)音無(wú)需再提示)就沒(méi)有必要也不 會(huì)出現(xiàn)此教導(dǎo)學(xué)習(xí)者的引發(fā)動(dòng)作。對(duì)于合格語(yǔ)音部分,決策模塊240取用互動(dòng)信息記錄表里該目標(biāo)文句的互動(dòng)信息 的累積教導(dǎo)成效和難度來(lái)判斷該目標(biāo)文句是否已被學(xué)習(xí)完成,如標(biāo)號(hào)720所示。若累積教 導(dǎo)成效為大于等于難度時(shí),表示該目標(biāo)文句已被學(xué)習(xí)完成,則輸出該目標(biāo)文句正確的輸出 響應(yīng),如范例743所示;否則表示尚未學(xué)習(xí)完成,并且由該目標(biāo)文句的累積教導(dǎo)成效可判定 其目標(biāo)詞語(yǔ)是否被學(xué)習(xí)過(guò),如標(biāo)號(hào)730所示。若累積教導(dǎo)成效為0(因過(guò)久未練習(xí)亦可能 因遺忘而使累積教導(dǎo)成效被遞減為0),此時(shí)決策模塊240判定其目標(biāo)詞語(yǔ)為尚未學(xué)過(guò)的文 句,可輸出“具目標(biāo)文句”的疑惑輸出,如范例742所示;或是可用如前所述與“無(wú)目標(biāo)文句” 的同一種疑惑反應(yīng)為輸出響應(yīng)來(lái)簡(jiǎn)化表現(xiàn)型式。因此,通過(guò)此輸出響應(yīng)可讓學(xué)習(xí)者了解虛擬或?qū)嶓w對(duì)象的學(xué)習(xí)狀態(tài),以激勵(lì)學(xué)習(xí) 者持續(xù)對(duì)學(xué)習(xí)內(nèi)涵做正確的練習(xí),以使此虛擬或?qū)嶓w對(duì)象最后能做出正確的回應(yīng),讓學(xué)習(xí) 者通過(guò)教導(dǎo)來(lái)達(dá)到學(xué)習(xí)目的。而對(duì)于其它已學(xué)習(xí)過(guò)但尚未學(xué)習(xí)完成的輸出響應(yīng),則依照該目標(biāo)文句的學(xué)習(xí)表現(xiàn) 制作學(xué)習(xí)過(guò)程信息來(lái)進(jìn)行輸出。因此,可讓學(xué)習(xí)者或其它使用者通過(guò)此虛擬或?qū)嶓w對(duì)象的 輸出響應(yīng)來(lái)了解學(xué)習(xí)者對(duì)學(xué)習(xí)標(biāo)的認(rèn)知情形,并且通過(guò)對(duì)該學(xué)習(xí)內(nèi)涵的認(rèn)知來(lái)對(duì)某一虛擬 或?qū)嶓w對(duì)象進(jìn)行教導(dǎo)。本揭露的實(shí)施范例中,將學(xué)習(xí)表現(xiàn)定義為一種累積教導(dǎo)成效與其學(xué)習(xí)難度的函 數(shù),也就是說(shuō),學(xué)習(xí)表現(xiàn)與累積教導(dǎo)成效、學(xué)習(xí)難度此兩參數(shù)有關(guān)。當(dāng)目標(biāo)文句的累積教導(dǎo) 成效等于其學(xué)習(xí)難度時(shí),表示該日標(biāo)文句已被學(xué)習(xí)完成,因此學(xué)習(xí)表現(xiàn)=1。當(dāng)累積教導(dǎo)成 效等于0時(shí),表示該目標(biāo)文句為尚未學(xué)過(guò),因此學(xué)習(xí)表現(xiàn)=0。而當(dāng)累積教導(dǎo)成效介于學(xué)習(xí) 完成與尚未學(xué)過(guò)之間時(shí),為一中間狀態(tài),此中間狀態(tài)的學(xué)習(xí)表現(xiàn)是介于0與1之間的值(0
13<學(xué)習(xí)表現(xiàn)< 1),可將學(xué)習(xí)表現(xiàn)定義為L(zhǎng)T/難度。中間狀態(tài)的輸出可以依照LT/難度的比例輸出與目標(biāo)文句相對(duì)應(yīng)的圖標(biāo)或圖像 來(lái)做響應(yīng),在語(yǔ)音的輸出響應(yīng)上,也可以比照?qǐng)D標(biāo)或圖像的輸出方式,以LT/難度的比例進(jìn) 行輸出與目標(biāo)文句相對(duì)應(yīng)的部分語(yǔ)音,如圖8的范例所示。圖8的范例中,以目標(biāo)文句Apple 為例,其難度為8,第一次輸出時(shí),累積教導(dǎo)成效LT等于2. 5,中間狀態(tài)的輸出是以圖像和相 對(duì)應(yīng)的部分語(yǔ)音來(lái)做響應(yīng),如范例841所示。第二次輸出時(shí),第二次的教導(dǎo)成效等于1,因此 連同原先的累積教導(dǎo)成效2. 5得到累積教導(dǎo)成效LT等于3. 5,其中間狀態(tài)的輸出響應(yīng),如范 例842所示。第三次輸出時(shí),第三次的教導(dǎo)成效等于4,因此連同原先的累積教導(dǎo)成效3. 5 得到累積教導(dǎo)成效LT等于7. 5,其中間狀態(tài)的輸出響應(yīng),如范例843所示。第四次輸出時(shí), 第四次的教導(dǎo)成效等于3,因此連同原先的累積教導(dǎo)成效7. 5得到累積教導(dǎo)成效LT為大于 難度,表示目標(biāo)文句Apple已被學(xué)習(xí)完成,則輸出目標(biāo)文句正確的輸出響應(yīng),如范例844所示.中間狀態(tài)的部分語(yǔ)音輸出可有許多種表現(xiàn)形式,例如直接檢索正確語(yǔ)音數(shù)據(jù)的 LT/難度的比例的數(shù)據(jù)作為中間狀態(tài)的語(yǔ)音輸出、檢索正確語(yǔ)音的LT/難度的比例的分辨 率作為中間狀態(tài)的語(yǔ)音輸出、或是其它檢索正確語(yǔ)音的LT/難度的比例的輸出表現(xiàn)等,都 是可實(shí)施的方式。以分辨率為例,若原本為每樣本16個(gè)位(16-bit/sample),可以降低其取 樣分辨率如每樣本的位數(shù)為16 X (LT/難度)的分辨率來(lái)進(jìn)行中間狀態(tài)的輸出。圖9是一個(gè)范例流程,說(shuō)明中間狀態(tài)輸出的運(yùn)作過(guò)程,并且與本發(fā)明的某些揭露 的實(shí)施范例一致。參考圖9,一開(kāi)始從一正確語(yǔ)音數(shù)據(jù),任選其中k個(gè)語(yǔ)音單元(Speech Unit)作為修改標(biāo)的,如步驟910所示。然后去除每一個(gè)語(yǔ)音單元的(1-LT/難度)比例的 語(yǔ)音數(shù)據(jù),如步驟920所示。每一修改后的語(yǔ)音數(shù)據(jù)拉長(zhǎng)為與原正確語(yǔ)音相同長(zhǎng)度,如步驟 930所示。將此拉長(zhǎng)后的語(yǔ)音數(shù)據(jù)做音調(diào)的調(diào)變,以產(chǎn)生學(xué)習(xí)之中間狀態(tài)的語(yǔ)音輸出,如步 驟940所示。此語(yǔ)音輸出的表現(xiàn)形式是以原始目標(biāo)文句相對(duì)應(yīng)的正確語(yǔ)音來(lái)對(duì)學(xué)習(xí)的中間 狀態(tài)做仿真輸出,當(dāng)系統(tǒng)有內(nèi)存容量的限制時(shí),可以用此范例流程的運(yùn)作來(lái)制作多種變化 的中間狀態(tài)語(yǔ)音數(shù)據(jù),以節(jié)省儲(chǔ)存學(xué)習(xí)中間狀態(tài)的語(yǔ)音數(shù)據(jù)的空間。若系統(tǒng)無(wú)內(nèi)存容量限 制,也可以預(yù)存用來(lái)表達(dá)學(xué)習(xí)的各種可能的中間狀態(tài)的數(shù)據(jù)。承上述,圖10是語(yǔ)音互動(dòng)系統(tǒng)200在教學(xué)模式下的一個(gè)工作范例,并且與本發(fā)明 的某些揭露的實(shí)施范例一致。其中,目標(biāo)信息210a以Apple為例,使用者語(yǔ)音輸入,互動(dòng)信 息記錄表的范例630b至少包括蘋(píng)果(Apple)、葡萄(Grape)、香蕉(Banana)、鉛筆(Pencil) 等以及決策模塊240的輸出范例等,如前所述,不再重復(fù)。如前所述,當(dāng)使用者未給定目標(biāo)信息時(shí),此時(shí)互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220 將互動(dòng)模式設(shè)定為交談模式。當(dāng)使用者語(yǔ)音信號(hào)輸入至互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220 后,語(yǔ)音辨識(shí)單元320以互動(dòng)信息記錄表里所有的互動(dòng)文句為辨識(shí)標(biāo)的,來(lái)辨識(shí)出該輸入 的語(yǔ)音信號(hào)所對(duì)應(yīng)的目標(biāo)文句。之后,互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220以該目標(biāo)文句和 該輸入語(yǔ)音信號(hào)進(jìn)行語(yǔ)音評(píng)量,以得出一驗(yàn)證分?jǐn)?shù),再將該驗(yàn)證分?jǐn)?shù)與前述設(shè)定的門(mén)檻值 做比較。當(dāng)該驗(yàn)證分?jǐn)?shù)大于該門(mén)檻值時(shí),則該輸入的語(yǔ)音信號(hào)為一合格語(yǔ)音,否則為一不合 格語(yǔ)音。兩者之后皆進(jìn)入決策模塊240進(jìn)行處理,并于輸出響應(yīng)模塊250做輸出響應(yīng)。決 策模塊與輸出響應(yīng)模塊的實(shí)施與展現(xiàn)同前述教學(xué)模式所示。圖11是語(yǔ)音互動(dòng)系統(tǒng)200在 交談模式下的一個(gè)工作范例,并且與本發(fā)明的某些揭露的實(shí)施范例一致。
語(yǔ)音互動(dòng)系統(tǒng)200也可以通過(guò)一種互動(dòng)信息外部更新模塊,來(lái)更新互動(dòng)信息記錄 表。此互動(dòng)信息外部更新模塊可以讓廠商在新增目標(biāo)信息時(shí),提供與該新增目標(biāo)信息相對(duì) 應(yīng)的互動(dòng)文句信息,來(lái)讓使用者操作使用,如此也可以豐富語(yǔ)音互動(dòng)系統(tǒng)200的內(nèi)涵。此互 動(dòng)信息外部更新模塊可置于一計(jì)算機(jī)系統(tǒng)中,以有線/無(wú)線方式聯(lián)機(jī)至語(yǔ)音互動(dòng)系統(tǒng)200, 來(lái)對(duì)語(yǔ)音互動(dòng)系統(tǒng)200內(nèi)的互動(dòng)信息記錄表230b的內(nèi)容做更新,也可以使用存儲(chǔ)裝置儲(chǔ)存 互動(dòng)信息記錄表230b,以抽換存儲(chǔ)裝置的方式來(lái)更新互動(dòng)信息記錄表。
另一種互動(dòng)信息外部更新方式為,當(dāng)語(yǔ)音互動(dòng)系統(tǒng)200接收學(xué)習(xí)者的目標(biāo)信息 時(shí),同時(shí)也讓該目標(biāo)信息相對(duì)應(yīng)的目標(biāo)文句信息傳入語(yǔ)音互動(dòng)系統(tǒng)200內(nèi)的互動(dòng)信息記錄 表中做檢核,若互動(dòng)信息記錄表中無(wú)相同的目標(biāo)文句信息時(shí),則將該目標(biāo)文句信息加入互 動(dòng)信息記錄表內(nèi),以更新互動(dòng)信息記錄表的內(nèi)容。換句話說(shuō),目標(biāo)信息相對(duì)應(yīng)的目標(biāo)文句信 息是由系統(tǒng)200的外部傳入語(yǔ)音互動(dòng)系統(tǒng)200內(nèi)的互動(dòng)信息記錄表中做檢核,進(jìn)而更新互 動(dòng)信息記錄表的內(nèi)容。圖12是語(yǔ)音互動(dòng)系統(tǒng)200應(yīng)用于一玩具本體上的一個(gè)范例示意圖,并且與本發(fā)明 的某些揭露的實(shí)施范例一致。參考圖12,語(yǔ)音互動(dòng)系統(tǒng)200里的模塊可內(nèi)嵌于一玩具1200 的本體(Body) 1210內(nèi)的一存儲(chǔ)裝置上。玩具本體1210還包括一中央處理單元(CPU) 1210a、 一麥克風(fēng)1210b、以及一播放器1210c。中央處理單元1210a執(zhí)行此存儲(chǔ)裝置上語(yǔ)音互動(dòng)系 統(tǒng)200的部分模塊,例如互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220、互動(dòng)信息更新模塊230、決策模 塊240。語(yǔ)音互動(dòng)系統(tǒng)200中的圖像信息部分可選擇不置入于存儲(chǔ)裝置,也可選擇不由中央 處理單元1210a來(lái)執(zhí)行。語(yǔ)音互動(dòng)系統(tǒng)200的目標(biāo)信息接收模塊210接收外來(lái)的目標(biāo)信息。麥克風(fēng)1210b 可接收語(yǔ)音輸入并傳送至互動(dòng)模式設(shè)定與語(yǔ)音處理模塊220。播放器1210c,例如喇叭,可 輸出對(duì)應(yīng)于前述教導(dǎo)成效的語(yǔ)音響應(yīng)?;?dòng)信息記錄表230b可通過(guò)一計(jì)算機(jī)1220或終端設(shè)備通過(guò)聯(lián)機(jī)裝置(有線/無(wú) 線信息傳輸)來(lái)進(jìn)行更新。其更新內(nèi)容可由廠商1230提供對(duì)應(yīng)信息,或者,互動(dòng)信息記錄 表也可以使用一存儲(chǔ)模塊,如存儲(chǔ)卡1240,更換方式來(lái)進(jìn)行更新,該互動(dòng)信息記錄表的內(nèi)容 可以由廠商提供對(duì)應(yīng)信息于該存儲(chǔ)模塊內(nèi),以方便使用者以手動(dòng)抽換方式進(jìn)行更新。也可 以通過(guò)內(nèi)含文句信息的目標(biāo)信息傳入語(yǔ)音互動(dòng)系統(tǒng)200內(nèi)的互動(dòng)信息記錄表中做檢核,來(lái) 做互動(dòng)信息記錄表內(nèi)容的更新。根據(jù)上述語(yǔ)音互動(dòng)系統(tǒng)200的實(shí)施范例的系統(tǒng)架構(gòu)與工作范例,圖13進(jìn)一步說(shuō)明 本揭露的語(yǔ)音互動(dòng)方法的主要步驟,并且與本發(fā)明的某些揭露的實(shí)施范例一致。參考圖13,準(zhǔn)備一互動(dòng)信息記錄表來(lái)記錄語(yǔ)音互動(dòng)文句信息,如步驟1310所示。 接收使用者輸入的語(yǔ)音信號(hào)并決定語(yǔ)音的目標(biāo)文句信息或同時(shí)接收給定的目標(biāo)文句信息, 以提供使用者以不同的互動(dòng)模式進(jìn)行語(yǔ)音互動(dòng)操作,如步驟1320所示。對(duì)目標(biāo)文句信息進(jìn) 行語(yǔ)音評(píng)量并產(chǎn)生一語(yǔ)音評(píng)量結(jié)果,如步驟1330所示。若同時(shí)接收給定的目標(biāo)文句信息, 則根據(jù)所產(chǎn)生的語(yǔ)音評(píng)量結(jié)果和一時(shí)間計(jì)數(shù),更新此互動(dòng)信息記錄表的信息,如步驟1340 所示。根據(jù)不同的互動(dòng)模式、語(yǔ)音評(píng)量結(jié)果、及此互動(dòng)信息記錄表的信息,決定目標(biāo)文句信 息的輸出模式,如步驟1350所示。根據(jù)決定的輸出模式和互動(dòng)信息記錄表的信息來(lái)輸出響 應(yīng)信息,如步驟1360所示。在前述語(yǔ)音互動(dòng)系統(tǒng)200的教學(xué)模式與交談模式的兩種互動(dòng)模式下,本揭露的語(yǔ)音互動(dòng)方法的細(xì)部運(yùn)作過(guò)程,如前所述,不再重復(fù)。綜上所述,本揭露的實(shí)施范例所提供的語(yǔ)音互動(dòng)系統(tǒng)與方法是以教學(xué)相長(zhǎng)為標(biāo)的 來(lái)設(shè)計(jì)語(yǔ)音互動(dòng)機(jī)制,以激勵(lì)學(xué)習(xí)者持續(xù)對(duì)該學(xué)習(xí)內(nèi)涵做正確的練習(xí),以使被教導(dǎo)的虛擬 或?qū)嶓w對(duì)象最后能做出正確的回應(yīng),讓學(xué)習(xí)者通過(guò)教導(dǎo)來(lái)達(dá)到學(xué)習(xí)目的。此語(yǔ)音互動(dòng)系統(tǒng) 也可以通過(guò)一種互動(dòng)信息外部更新模塊,來(lái)更新互動(dòng)信息記錄表。本揭露的實(shí)施范例也可 內(nèi)嵌于玩具上,以吸引使用者增加學(xué)習(xí)興趣和提高學(xué)習(xí)效果。但,以上所述的僅為本發(fā)明的實(shí)施范例,當(dāng)不能依此限定本發(fā)明實(shí)施的范圍。即大 凡本發(fā)明權(quán)利要求所作的均等變化與修飾,皆應(yīng)仍屬本發(fā)明專(zhuān)利涵蓋的范圍。
權(quán)利要求
一種語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該系統(tǒng)包含一目標(biāo)信息接收模塊,接收目標(biāo)信息并設(shè)定相對(duì)應(yīng)的目標(biāo)文句信息;一互動(dòng)模式設(shè)定與語(yǔ)音處理模塊,接收使用者語(yǔ)音信號(hào),設(shè)定一互動(dòng)模式與決定語(yǔ)音的目標(biāo)文句信息,并輸出目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果;一互動(dòng)信息更新模塊,根據(jù)該目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果和一時(shí)間計(jì)數(shù),更新一互動(dòng)信息記錄表的信息;一決策模塊,根據(jù)設(shè)定的該互動(dòng)模式和該互動(dòng)信息記錄表的信息來(lái)決定目標(biāo)文句信息的輸出模式;以及一輸出響應(yīng)模塊,根據(jù)該決定的輸出模式和該互動(dòng)信息記錄表的信息來(lái)輸出響應(yīng)信息。
2.如權(quán)利要求1所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,當(dāng)僅有使用者語(yǔ)音信號(hào)輸入該互 動(dòng)模式設(shè)定與語(yǔ)音處理模塊時(shí),該互動(dòng)模式被設(shè)定為一交談模式。
3.如權(quán)利要求1所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,當(dāng)使用者語(yǔ)音信號(hào)輸入該互動(dòng)模 式設(shè)定與語(yǔ)音處理模塊且同時(shí)提供該目標(biāo)項(xiàng)目信息給該互動(dòng)模式設(shè)定與語(yǔ)音處理模塊時(shí), 該互動(dòng)模式被設(shè)定為一教學(xué)模式。
4.如權(quán)利要求2所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該交談模式傳送給該決策模塊。
5.如權(quán)利要求3所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該教學(xué)模式傳送給該互動(dòng)信息更 新模塊。
6.如權(quán)利要求5所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,當(dāng)該輸入的使用者語(yǔ)音信號(hào)通過(guò) 一語(yǔ)句驗(yàn)證方法,而被判定為一不合格語(yǔ)音時(shí),該教學(xué)模式還傳送給該決策模塊。
7.如權(quán)利要求1所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該互動(dòng)信息記錄表記錄該語(yǔ)音互 動(dòng)文句的信息,該語(yǔ)音互動(dòng)文句的信息是選自該目標(biāo)文句的互動(dòng)文句、累積教導(dǎo)成效、評(píng)量 門(mén)檻、難度、目標(biāo)詞語(yǔ)的響應(yīng)信息的前述任一種組合。
8.如權(quán)利要求2所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該互動(dòng)模式設(shè)定與語(yǔ)音處理模塊 還包括一語(yǔ)音辨識(shí)單元,來(lái)接收使用者語(yǔ)音信號(hào)與決定語(yǔ)音的目標(biāo)文句信息。
9.如權(quán)利要求1所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該輸出響應(yīng)信息至少包括該目標(biāo) 文句正確的輸出響應(yīng)、該目標(biāo)文句疑惑反應(yīng)的輸出響應(yīng)、以及介于該目標(biāo)文句已學(xué)習(xí)過(guò)但 尚未學(xué)習(xí)完成的中間狀態(tài)的輸出回應(yīng)。
10.如權(quán)利要求7所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該系統(tǒng)建立一種遺忘算式,該遺 忘算式與一時(shí)間計(jì)數(shù)器搭配運(yùn)作。
11.如權(quán)利要求1所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該系統(tǒng)還通過(guò)一種互動(dòng)信息外部 更新模塊,來(lái)更新該互動(dòng)信息記錄表。
12.如權(quán)利要求11所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該系統(tǒng)以一存儲(chǔ)裝置來(lái)儲(chǔ)存該 互動(dòng)信息記錄表,并以一抽換該存儲(chǔ)裝置的方式來(lái)更新該互動(dòng)信息記錄表。
13.如權(quán)利要求1所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該系統(tǒng)內(nèi)嵌于一玩具本體。
14.如權(quán)利要求11所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該互動(dòng)信息外部更新模塊置于 一計(jì)算機(jī)系統(tǒng)中,并以一聯(lián)機(jī)方式聯(lián)機(jī)至該語(yǔ)音互動(dòng)系統(tǒng),來(lái)更新該語(yǔ)音互動(dòng)系統(tǒng)內(nèi)的該 互動(dòng)信息記錄表。
15.如權(quán)利要求10所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該遺忘算式的值經(jīng)由累積教導(dǎo)成效與難度兩參數(shù)計(jì)算而得出。
16.如權(quán)利要求13所述的語(yǔ)音互動(dòng)系統(tǒng),其特征在于,該玩具本體還包括一中央處理單元,執(zhí)行該語(yǔ)音互動(dòng)系統(tǒng)的部分模塊;一麥克風(fēng),接收語(yǔ)音輸入并傳送至該互動(dòng)模式設(shè)定與語(yǔ)音處理模塊;以及一播放器,輸出對(duì)應(yīng)于該累積教導(dǎo)成效的語(yǔ)音響應(yīng)。
17.一種語(yǔ)音互動(dòng)方法,其特征在于,該方法包含準(zhǔn)備一互動(dòng)信息記錄表來(lái)記錄語(yǔ)音互動(dòng)文句信息;接收使用者輸入的語(yǔ)音信號(hào)并決定語(yǔ)音的目標(biāo)文句信息、或同時(shí)接收給定的目標(biāo)文句 信息,以提供使用者以不同的互動(dòng)模式進(jìn)行語(yǔ)音互動(dòng)操作;對(duì)該目標(biāo)文句信息進(jìn)行語(yǔ)音評(píng)量,并產(chǎn)生一語(yǔ)音評(píng)量結(jié)果;若同時(shí)接收給定的目標(biāo)文句信息,則根據(jù)所產(chǎn)生的目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果和一時(shí)間 計(jì)數(shù),更新該互動(dòng)信息記錄表的信息;根據(jù)不同的互動(dòng)模式、該語(yǔ)音評(píng)量結(jié)果、及該互動(dòng)信息記錄表的信息,決定該目標(biāo)文句 信息的輸出模式;以及根據(jù)該決定的輸出模式和該互動(dòng)信息記錄表的信息,輸出響應(yīng)信息。
18.如權(quán)利要求17所述的語(yǔ)音互動(dòng)方法,其特征在于,該不同的互動(dòng)模式包括教學(xué)模 式和交談模式。
19.如權(quán)利要求17所述的語(yǔ)音互動(dòng)方法,其特征在于,該互動(dòng)信息記錄表記錄的語(yǔ)音 互動(dòng)文句的信息是選自該目標(biāo)文句的互動(dòng)文句、累積教導(dǎo)成效、評(píng)量門(mén)檻、難度、目標(biāo)詞語(yǔ) 的響應(yīng)信息的前述任一種組合。
20.如權(quán)利要求19所述的語(yǔ)音互動(dòng)方法,其特征在于,該累積教導(dǎo)成效與一擱置時(shí)間 有關(guān),該擱置時(shí)間是距離上次更新學(xué)習(xí)目標(biāo)文句的單位時(shí)間,并且該累積教導(dǎo)成效是通過(guò) 一種遺忘的算式來(lái)算出,而該遺忘的算式的值經(jīng)由累積教導(dǎo)成效與難度兩參數(shù)計(jì)算而得 出ο
21.如權(quán)利要求17所述的語(yǔ)音互動(dòng)方法,其特征在于,當(dāng)僅有接收使用者輸入的語(yǔ)音 信號(hào)時(shí),提供使用者以一交談模式來(lái)進(jìn)行語(yǔ)音互動(dòng)操作,并且以該互動(dòng)信息記錄表里所有 的互動(dòng)文句為辨識(shí)標(biāo)的來(lái)辨識(shí)出該輸入的語(yǔ)音信號(hào)所對(duì)應(yīng)的目標(biāo)文句信息,之后以該目標(biāo) 文句信息和該輸入的語(yǔ)音信號(hào)來(lái)進(jìn)行語(yǔ)音評(píng)量以得出一驗(yàn)證分?jǐn)?shù)。
22.如權(quán)利要求21所述的語(yǔ)音互動(dòng)方法,其特征在于,該方法參考至少一次的該驗(yàn)證 分?jǐn)?shù)的組合,動(dòng)態(tài)取得語(yǔ)句驗(yàn)證的一門(mén)檻調(diào)校值,并依該門(mén)檻調(diào)校值來(lái)更新該互動(dòng)信息記 錄表的信息。
23.如權(quán)利要求17所述的語(yǔ)音互動(dòng)方法,其特征在于,當(dāng)接收使用者輸入的語(yǔ)音信號(hào) 且同時(shí)接收給定的目標(biāo)文句信息時(shí),提供使用者以一教學(xué)模式來(lái)進(jìn)行語(yǔ)音互動(dòng)操作,并對(duì) 該目標(biāo)文句信息進(jìn)行語(yǔ)音評(píng)量,以產(chǎn)生該語(yǔ)音評(píng)量結(jié)果,并依該語(yǔ)音評(píng)量結(jié)果來(lái)更新該互 動(dòng)信息記錄表的信息。
24.如權(quán)利要求17所述的語(yǔ)音互動(dòng)方法,其特征在于,該輸出響應(yīng)信息至少包括該目 標(biāo)文句正確的輸出響應(yīng)、該目標(biāo)文句疑惑反應(yīng)的輸出響應(yīng)、以及介于該目標(biāo)文句已學(xué)習(xí)過(guò) 但尚未學(xué)習(xí)完成的中間狀態(tài)的輸出回應(yīng)。
25.如權(quán)利要求24所述的語(yǔ)音互動(dòng)方法,其特征在于,該中間狀態(tài)的輸出回應(yīng)是依照累積教導(dǎo)成效/難度的比例輸出與該目標(biāo)文句相對(duì)應(yīng)的圖標(biāo)或圖像 來(lái)做響應(yīng),在語(yǔ)音的輸 出響應(yīng)上,以累積教導(dǎo)成效/難度的比例進(jìn)行輸出與該目標(biāo)文句相對(duì)應(yīng)的部分語(yǔ)音。
全文摘要
本發(fā)明涉及一種語(yǔ)音互動(dòng)系統(tǒng)與方法,該系統(tǒng)包含一目標(biāo)信息接收模塊、一互動(dòng)模式設(shè)定與語(yǔ)音處理模塊、一互動(dòng)信息更新模塊、一決策模塊、及一輸出響應(yīng)模塊。目標(biāo)信息接收模塊接收目標(biāo)信息并設(shè)定相對(duì)應(yīng)的目標(biāo)文句信息?;?dòng)模式設(shè)定與語(yǔ)音處理模塊接收使用者語(yǔ)音信號(hào),設(shè)定一互動(dòng)模式與決定語(yǔ)音的目標(biāo)文句信息,并輸出目標(biāo)文句的語(yǔ)音評(píng)量結(jié)果?;?dòng)信息更新模塊在設(shè)定的互動(dòng)模式下,根據(jù)語(yǔ)音評(píng)量結(jié)果和一時(shí)間計(jì)數(shù),更新一互動(dòng)信息記錄表的信息。決策模塊根據(jù)此互動(dòng)模式和互動(dòng)信息記錄表的信息來(lái)決定目標(biāo)文句信息的輸出模式。輸出響應(yīng)模塊根據(jù)此決定的輸出模式和互動(dòng)信息記錄表的信息來(lái)輸出響應(yīng)信息。
文檔編號(hào)G09B19/06GK101840640SQ20091012764
公開(kāi)日2010年9月22日 申請(qǐng)日期2009年3月19日 優(yōu)先權(quán)日2009年3月19日
發(fā)明者張森嘉, 張耀元, 涂家章, 簡(jiǎn)世杰 申請(qǐng)人:財(cái)團(tuán)法人工業(yè)技術(shù)研究院