日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

使用樣例來翻譯語音輸入的設(shè)備和方法

文檔序號:6563064閱讀:180來源:國知局
專利名稱:使用樣例來翻譯語音輸入的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種使用樣例來翻譯語音輸入并輸出翻譯結(jié)果的設(shè)備和方法。
背景技術(shù)
近幾年,希望用于支持使用不同母語談話的人們之間進(jìn)行通信的語音翻譯設(shè)備能夠找到更實(shí)用的應(yīng)用。一般來說,這種語音翻譯設(shè)備需要依次進(jìn)行語音識(shí)別處理、翻譯處理和語音合成處理,其分別采用識(shí)別語音的手段、對語音識(shí)別后獲得的字符串進(jìn)行翻譯的手段、以及把翻譯后獲得的字符串合成為語音的手段。
識(shí)別用戶發(fā)出的語音并輸出字符信息的語音識(shí)別系統(tǒng)已經(jīng)以軟件包或類似的形式應(yīng)用到了實(shí)際應(yīng)用中。同樣,處理書面語言(文本)輸入的機(jī)器翻譯系統(tǒng)也找到了以軟件包或類似形式的應(yīng)用。語音合成系統(tǒng)也有實(shí)際的應(yīng)用。通過適當(dāng)?shù)剡\(yùn)用這些軟件產(chǎn)品,就能夠?qū)崿F(xiàn)一個(gè)語音翻譯設(shè)備。
然而,在這種情況下,語音識(shí)別很難達(dá)到100%的正確率。即使是書面語言的機(jī)器翻譯也面臨著這樣的問題由于源語言中可能包含翻譯詞的多義性或依賴性,所以翻譯結(jié)果不能像希望的那樣輸出。此外,語音輸入的語句經(jīng)常不符合語法規(guī)則,使得語音被錯(cuò)誤識(shí)別,這導(dǎo)致機(jī)器翻譯在輸入中就包含錯(cuò)誤。由于這些原因,仍未實(shí)現(xiàn)具有實(shí)用價(jià)值的語音翻譯設(shè)備。
尤其是,對于一個(gè)不懂目標(biāo)語言的源語言的說話者,他無法確認(rèn)該語音翻譯設(shè)備是否輸出了說話者想要的翻譯結(jié)果,從而制定一些處理語音識(shí)別和機(jī)器翻譯中的分析的錯(cuò)誤或多義性的對策是非常重要的。
機(jī)器翻譯是源語言(如日語)語句到目標(biāo)語言(如英語)語句的轉(zhuǎn)換,根據(jù)轉(zhuǎn)換策略,可以粗略地分為基于規(guī)則的機(jī)器翻譯、統(tǒng)計(jì)的機(jī)器翻譯,和基于樣例的機(jī)器翻譯。
基于規(guī)則的翻譯設(shè)備包括形態(tài)分析單元和結(jié)構(gòu)分析單元,在結(jié)構(gòu)分析單元中分析出源語言的語句結(jié)構(gòu),并基于該結(jié)構(gòu)將其轉(zhuǎn)換成目標(biāo)語言的語句結(jié)構(gòu)。這些結(jié)構(gòu)分析和轉(zhuǎn)換的處理知識(shí)都以規(guī)則的形式提前登記,翻譯設(shè)備通過解釋這些規(guī)則來執(zhí)行翻譯處理。大部分以軟件包形式應(yīng)用的機(jī)器翻譯系統(tǒng)都是這種類型的。
基于規(guī)則的機(jī)器翻譯需要準(zhǔn)備大量的規(guī)則以實(shí)現(xiàn)可實(shí)用的、高準(zhǔn)確率的機(jī)器翻譯。人工準(zhǔn)備這些規(guī)則需要很高的成本。為了解決這些問題,建議了統(tǒng)計(jì)的機(jī)器翻譯,并已進(jìn)行了有力的研究和開發(fā)努力。
在統(tǒng)計(jì)的機(jī)器翻譯中,將源語言的語句和目標(biāo)語言的對應(yīng)語句以大尺度(稱為平行語料庫)進(jìn)行準(zhǔn)備,通過這個(gè)語料庫,確定翻譯的轉(zhuǎn)換規(guī)則和它的概率值。這種方法選取概率最高的轉(zhuǎn)換規(guī)則進(jìn)行翻譯。目前已經(jīng)構(gòu)建了使用統(tǒng)計(jì)的機(jī)器翻譯的語音翻譯原型系統(tǒng)。
另一方面,基于樣例的機(jī)器翻譯跟統(tǒng)計(jì)的機(jī)器翻譯一樣,也使用源語言和目標(biāo)語言的平行語料庫。從平行語料庫中搜索與輸入語句相似的源語言語句,將與這個(gè)檢測到的源語言語句對應(yīng)的目標(biāo)語言語句確定為翻譯結(jié)果?;谝?guī)則的機(jī)器翻譯和統(tǒng)計(jì)的機(jī)器翻譯在運(yùn)用轉(zhuǎn)換規(guī)則時(shí)容易造成多義性,從而不可避免的輸出與使用源語言的說話者意愿相背離的翻譯結(jié)果。
相反地,基于樣例的機(jī)器翻譯使用與從平行語料庫中檢測到的源語言語句所對應(yīng)的翻譯作為翻譯結(jié)果,并且通過搜索檢測到的源語言語句可以由源語言說話者進(jìn)行確認(rèn)。而且,由于目標(biāo)語言語句是事先由人工準(zhǔn)備的,所以在翻譯處理中出現(xiàn)錯(cuò)誤的比率相對比較小。然而,即使平行語料庫以大尺度準(zhǔn)備,也不可能覆蓋所有可能輸入的語句。在基于樣例的機(jī)器翻譯中,如果檢索不到與輸入語句相似的樣例,則翻譯將會(huì)失敗。因此基于樣例的機(jī)器翻譯需要基于規(guī)則的機(jī)器翻譯和統(tǒng)計(jì)的機(jī)器翻譯進(jìn)行補(bǔ)充,以適用于更廣泛的應(yīng)用。
在基于樣例的機(jī)器翻譯中,只要能夠從平行語料庫中檢索到與輸入語句相似的源語言語句,則實(shí)現(xiàn)正確翻譯的可能性就會(huì)增加。然而,一個(gè)給定的源語言語句并不總是只對應(yīng)著一種會(huì)話,而是根據(jù)會(huì)話的場景和上下文不同,需要進(jìn)行不同的翻譯。特別是,即使人工準(zhǔn)備了樣例,翻譯也可能包含多義性。在這種情況下,就有這樣一種方法,用戶從建議的多個(gè)翻譯中選取適當(dāng)?shù)囊粋€(gè)。然而,不懂目標(biāo)語言的源語言說話者也不能夠選擇一個(gè)合適的翻譯。
基于這一點(diǎn),提出了一種翻譯設(shè)備,其具有這樣的功能,它通過以源語言顯示關(guān)于翻譯的語言信息,來提供意見,使得不了解目標(biāo)語言的說話者能選擇一個(gè)源語言的正確的翻譯(如日本專利申請?zhí)亻_(JP-A)No.H05-128150)。
具體而言,例如,當(dāng)把包括一個(gè)具有多種意義(用法)的詞語的源語言的英語語句翻譯成日語并且生成多個(gè)日語的候選翻譯時(shí),將每個(gè)候選翻譯與一個(gè)對應(yīng)的英語語句樣例一起顯示,該樣例中包含與翻譯中具有相同用法的那個(gè)詞。然后,說話者選取與源語言語句具有相同用法的樣例語句,以便將與這個(gè)被選中的樣例語句對應(yīng)的語句選擇為正確的日語翻譯。
但是,在JP-A No.H05-128150中描述的方法中,需要通過參照包括詞的用法、時(shí)制或時(shí)態(tài)(時(shí)相)的語言信息來估計(jì)一個(gè)正確的翻譯。這樣,就出現(xiàn)了為選擇翻譯增加了決策負(fù)擔(dān)的問題。
具體而言,讀出多個(gè)與說話者想要表達(dá)的意思不同的樣例語句,并在選出正確的樣例語句之前確定任何部分是否包含多義性。這樣,決策負(fù)擔(dān)增加而同時(shí)在選擇和向另一方建議正確的翻譯之前又出現(xiàn)了處理時(shí)間更長的問題。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,基于樣例的翻譯設(shè)備包括存儲(chǔ)單元,其存儲(chǔ)第一語言的樣例以及與第一語言的樣例具有相同含義的第二語言的樣例,所述樣例相互關(guān)聯(lián);輸入接收單元,其接收第一語言的語句的輸入;第一樣例搜索單元,其基于第一語言的語句從存儲(chǔ)單元中搜索第一語言的第一樣例;第二樣例搜索單元,其搜索與第一樣例相對應(yīng)的第二語言的第二樣例;確定單元,其確定是否存在多個(gè)第二樣例;第一獲取單元,當(dāng)確定單元確定存在多個(gè)第二語言的第二樣例時(shí),第一獲取單元從存儲(chǔ)單元獲取與多個(gè)第二樣例的每一個(gè)相對應(yīng)的第一語言的第三樣例;第二獲取單元,其從存儲(chǔ)單元中獲取與第三樣例相對應(yīng)的第二語言的第四樣例;選項(xiàng)生成單元,其生成與最少數(shù)目的第四樣例相關(guān)聯(lián)的第三樣例的選項(xiàng);以及輸出控制單元,其輸出第三樣例的選項(xiàng)。
根據(jù)本發(fā)明的另一方面,基于樣例的翻譯設(shè)備包括通信單元,其將第一語言的語句、第一語言的樣例或第二語言的樣例通過網(wǎng)絡(luò)傳輸給與通信單元相連的樣例管理服務(wù)器,并接收樣例管理服務(wù)器返回的第一語言的樣例或第二語言的樣例,樣例管理服務(wù)器具有存儲(chǔ)單元,其相互關(guān)聯(lián)地存儲(chǔ)第一語言的樣例以及與第一語言的樣例具有相同含義的第二語言的樣例;輸入接收單元,其接收第一語言的語句的輸入;第一樣例搜索單元,其基于第一語言的語句,通過通信單元從樣例管理服務(wù)器的存儲(chǔ)單元中搜索第一語言的第一樣例;第二樣例搜索單元,其通過通信單元從樣例管理服務(wù)器的存儲(chǔ)單元中搜索與第一樣例相對應(yīng)的第二語言的第二樣例;確定單元,其確定是否存在多個(gè)第二樣例;第一獲取單元,當(dāng)確定單元確定存在多個(gè)第二樣例時(shí),第一獲取單元通過通信單元從存儲(chǔ)單元獲取與第二樣例的每一個(gè)相對應(yīng)的第一語言的第三樣例;第二獲取單元,其通過通信單元從存儲(chǔ)單元中獲取與第三樣例相對應(yīng)的第二語言的第四樣例;選項(xiàng)生成單元,其生成與最少數(shù)目的第四樣例相關(guān)聯(lián)的第三樣例的選項(xiàng);以及輸出控制單元,其輸出第三樣例的選項(xiàng)。
根據(jù)本發(fā)明的再一方面,基于樣例的翻譯方法包括接收第一語言的輸入語句;基于第一語言的語句,從存儲(chǔ)單元搜索第一語言的第一樣例,該存儲(chǔ)單元相互關(guān)聯(lián)地存儲(chǔ)第一語言的樣例,以及與第一語言的樣例具有相同含義的第二語言的樣例;搜索與第一樣例相對應(yīng)的第二語言的第二樣例;確定是否存在多個(gè)第二樣例;當(dāng)確定存在多個(gè)第二樣例時(shí),從存儲(chǔ)單元中獲取與第二樣例的每一個(gè)相對應(yīng)的第一語言的第三樣例;從存儲(chǔ)單元中獲取與第三樣例相對應(yīng)的第二語言的第四樣例;生成與最少數(shù)目的第四樣例相對應(yīng)的第三樣例的選項(xiàng);以及輸出第三樣例的選項(xiàng)。
根據(jù)本發(fā)明的再一方面,基于樣例的翻譯方法包括接收第一語言的輸入語句;基于第一語言的語句,通過通信單元從樣例管理服務(wù)器的存儲(chǔ)單元中搜索第一語言的第一樣例,該通信單元將第一語言的語句、第一語言的樣例或與第一語言的樣例具有相同含義的第二語言的樣例傳輸給樣例管理服務(wù)器,并接收由翻譯樣例管理服務(wù)器返回的第一語言的樣例或第二語言的樣例,該翻譯樣例管理服務(wù)器通過網(wǎng)絡(luò)連接,并且具有存儲(chǔ)單元用于相互對應(yīng)地存儲(chǔ)第一語言的樣例和第二語言的樣例;通過通信單元從樣例管理服務(wù)器的存儲(chǔ)單元中搜索與第一樣例相對應(yīng)的第二語言的第二樣例;確定是否存在多個(gè)第二樣例;當(dāng)確定存在多個(gè)第二樣例時(shí),通過通信單元從存儲(chǔ)單元中獲取與第二樣例的每一個(gè)相對應(yīng)的第三樣例;通過通信單元從存儲(chǔ)單元中獲取與第三樣例相對應(yīng)的第二語言的第四樣例;生成與最少數(shù)目的第四樣例相對應(yīng)的第三樣例的選項(xiàng);并輸出第三樣例的選項(xiàng)。


圖1是示出了根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備的配置的方框圖;圖2是示出了存儲(chǔ)在存儲(chǔ)單元中的平行語料庫的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的示意圖;圖3是示出了根據(jù)第一實(shí)施例的基于樣例的翻譯處理的一般流程的流程圖;圖4是示出了根據(jù)第一實(shí)施例的選項(xiàng)生成處理的一般流程的流程圖;圖5A和5B是示出了在源語言語句中的用法樣例和在對應(yīng)的翻譯中的用法樣例之間的關(guān)系的實(shí)例的圖;圖6A和6B是示出了顯示屏的內(nèi)容的實(shí)例的示意圖;圖7是示出了顯示屏的內(nèi)容的另一個(gè)實(shí)例的示意圖;圖8是示出了存儲(chǔ)在存儲(chǔ)單元中的平行語料庫的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的示意圖;
圖9是示出了根據(jù)第三實(shí)施例的基于樣例的翻譯設(shè)備的配置的方框圖;圖10是示出了根據(jù)第三實(shí)施例的基于樣例的翻譯處理的一般流程的流程圖;以及圖11是示出了根據(jù)第三實(shí)施例的選項(xiàng)生成處理的一般流程的流程圖。
具體實(shí)施例方式
以下將參照附圖,詳細(xì)描述根據(jù)本發(fā)明的基于樣例的翻譯設(shè)備和基于樣例的翻譯方法的示例性實(shí)施例。
根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備預(yù)先假設(shè)使用平行語料庫,該語料庫以多對多關(guān)系存儲(chǔ)了源語言語句的樣例和與之相對應(yīng)的目標(biāo)語言的翻譯樣例,并且當(dāng)對于一個(gè)源語言語句輸入存在多個(gè)翻譯樣例時(shí),將與該目標(biāo)語言的翻譯樣例相對應(yīng)的源語言語句的樣例中,具有較少多義性的一個(gè)作為選項(xiàng)提供給用戶。
以下的描述假設(shè)翻譯處理是以日語作為源語言,英語作為目標(biāo)語言來執(zhí)行的。但是,源語言和目標(biāo)語言可以是其他語言的任意組合。
圖1是示出了根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備100的配置的方框圖。如圖1所示,基于樣例的翻譯設(shè)備100包括存儲(chǔ)單元111、輸入接收單元101、樣例搜索單元102、多義性檢測單元103、選項(xiàng)生成單元104,和輸出控制單元105。
存儲(chǔ)單元111用于存儲(chǔ)源語言的語句和短語的樣例,以及與源語言語句的樣例相對應(yīng)的翻譯樣例,并可以配置為任何通用的存儲(chǔ)介質(zhì),包括HDD(硬盤驅(qū)動(dòng)器)、光盤、存儲(chǔ)卡,以及RAM(隨機(jī)訪問存儲(chǔ)器)。
圖2是示出了存儲(chǔ)在存儲(chǔ)單元111中的平行語料庫的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的示意圖。如圖2所示,存儲(chǔ)單元111在其中存儲(chǔ)了日語樣例,以及與之相對應(yīng)的具有相同含義的英語樣例。連接日語樣例和英語樣例的直線表示了對應(yīng)關(guān)系。
當(dāng)存在多個(gè)英語樣例具有與某個(gè)日語樣例相同的含義時(shí),通過多條從該日語樣例開始的直線將所述多個(gè)英語樣例與該日語樣例相連,以指示對應(yīng)關(guān)系。同樣地,當(dāng)存在多個(gè)日語樣例具有與某個(gè)英語樣例相同的含義時(shí),通過多條從所述多個(gè)日語樣例開始的直線將該英語樣例與所述多個(gè)日語樣例建立對應(yīng)關(guān)系。通過這種方式,日語樣例與英語樣例就建立起了多對多的對應(yīng)關(guān)系。
當(dāng)輸入語句是日語時(shí),源語言就是日語,與這個(gè)日語樣例相對應(yīng)的英語樣例就構(gòu)成了目標(biāo)語言的翻譯。另一方面,當(dāng)輸入語句是英語時(shí),源語言就是英語,與這個(gè)英語樣例相關(guān)聯(lián)的日語樣例就構(gòu)成了目標(biāo)語言的翻譯。具體而言,源語言和目標(biāo)語言是相對而言的,取決于翻譯的方向。為了方便理解,附圖和描述中都假設(shè)日語一英語翻譯。然而,對于英語-日語翻譯也執(zhí)行類似的處理以實(shí)現(xiàn)根據(jù)本實(shí)施例的基于樣例的翻譯設(shè)備。
輸入接收單元102用于接收用戶用鍵盤、鼠標(biāo)、按鈕等輸入裝置輸入的源語言語句。同時(shí),當(dāng)用戶從后面將描述的輸出控制單元105輸出的樣例的選項(xiàng)中選擇時(shí)接收到樣例的輸入。
根據(jù)本發(fā)明的翻譯設(shè)備還包括語音識(shí)別單元(未顯示),用于接收通過麥克風(fēng)等輸入的源語言的語音,聽覺識(shí)別所接收的語音,并輸出語音識(shí)別結(jié)果,其中輸入接收單元101接收語音識(shí)別單元輸出的語音識(shí)別結(jié)果作為源語言語句。
同樣,該翻譯設(shè)備還可以包括字符識(shí)別單元(未顯示),用于接收從筆輸入裝置等輸入的源語言字符信息,識(shí)別所接收的字符信息的字符,并輸出字符識(shí)別結(jié)果,其中輸入接收單元101接收字符識(shí)別單元輸出的字符識(shí)別結(jié)果作為源語言語句。
樣例搜索單元102用于從存儲(chǔ)單元111搜索與輸入接收單元101接收到的源語言語句相一致或相類似的樣例。之所以搜索相類似的樣例是因?yàn)橹粰z索與輸入語句完全一致的樣例不能有效地利用語義相似的樣例。然而,只有完全一致的樣例可以被檢索到。
樣例搜索單元102計(jì)算下面的方程(1)定義的字串的編輯距離dist,并且搜索編輯距離dist不超過預(yù)定閾值的樣例。
dist=(I+D+2∑SEMDIST)/(Linput+Lexample)(1)
其中Linput是構(gòu)成輸入語句的詞語個(gè)數(shù),Lexample是構(gòu)成源語言語句樣例的詞語個(gè)數(shù),I是插入的詞語個(gè)數(shù),D是刪除的詞語個(gè)數(shù),SEMDIST是替代詞的語義距離。
搜索相似樣例的方法并不僅僅局限于上面描述的方法,任何搜索與輸入語句具有相似內(nèi)容的樣例的方法都可以使用。
多義性檢測單元103參照存儲(chǔ)在存儲(chǔ)單元111中的翻譯關(guān)系,檢測源語言樣例的翻譯是否存在多義性。特別地,多義性檢測單元103通過確定是否有多個(gè)翻譯樣例設(shè)置得與樣例搜索單元102檢索到的源語言樣例相對應(yīng)來檢測翻譯是否是多義的。
例如,當(dāng)樣例搜索單元102搜索到圖2中所示的日語201時(shí),存在三個(gè)相對應(yīng)的英語樣例,于是就確定這個(gè)源語言樣例的翻譯存在多義性。
當(dāng)多義性檢測單元103檢測到源語言語句樣例的翻譯具有多義性時(shí),選項(xiàng)生成單元104生成向用戶建議的源語言語句樣例的選項(xiàng)以輸出最優(yōu)翻譯。
具體來說,首先,當(dāng)多義性檢測單元103檢測到存在多個(gè)翻譯樣例時(shí),選項(xiàng)生成單元104從存儲(chǔ)單元111中獲取與多個(gè)翻譯樣例的每一個(gè)相對應(yīng)的源語言樣例。然后,選項(xiàng)生成單元104從存儲(chǔ)單元111中獲取與所獲取的源語言語句的樣例相對應(yīng)的翻譯樣例。最后,選項(xiàng)生成單元104生成與最少數(shù)目的所獲取的翻譯樣例相關(guān)聯(lián)的源語言語句樣例作為選項(xiàng)。
輸出控制單元105用于將選項(xiàng)生成單元104生成的樣例選項(xiàng)輸出給用戶。輸入接收單元101接收到用戶選擇的樣例輸入后,輸出相應(yīng)的翻譯給用戶(對話中的另一方)。
輸出控制單元105中,把生成的源語言語句的樣例選項(xiàng)或者目標(biāo)語言的翻譯輸出到顯示裝置,以在屏幕上顯示字符串。
根據(jù)本發(fā)明的翻譯設(shè)備還可以包括語音合成單元(未顯示),用于將翻譯合成為目標(biāo)語言的語音,并且輸出控制單元105輸出由語音合成單元合成的目標(biāo)語言的語音。
下面,將介紹根據(jù)具有上述配置的第一實(shí)施例的基于樣例的翻譯設(shè)備100所執(zhí)行的基于樣例的翻譯處理。圖3是示出了根據(jù)第一實(shí)施例的基于樣例的翻譯處理的一般流程的流程圖。
首先,輸入接收單元101接收來自用戶的源語言的輸入語句(步驟S301)。然后,樣例搜索單元102從存儲(chǔ)單元111中搜索與輸入語句一致或者類似的源語言語句樣例(步驟S302)。
通常,搜索到多個(gè)樣例,這些樣例中的每一個(gè)都要經(jīng)過下面所描述的處理。另一方面,當(dāng)在步驟S302中沒有搜索到樣例時(shí),通過輸出來通知翻譯失敗并重新接收一個(gè)輸入。
首先,多義性檢測單元103從搜索結(jié)果中選擇一個(gè)樣例(步驟S303)。然后,多義性檢測單元103從存儲(chǔ)單元111中獲取與所選擇的樣例相對應(yīng)的翻譯樣例(步驟S304)。
然后,多義性檢測單元103確定是否獲取了多個(gè)翻譯樣例(步驟S305),當(dāng)未獲取多個(gè)翻譯樣例時(shí)(步驟S305否),生成由選項(xiàng)生成單元104所選擇的源語言語句樣例作為選項(xiàng)(步驟S306)。
另一方面,當(dāng)獲取了多個(gè)翻譯樣例時(shí)(步驟S305是),執(zhí)行選項(xiàng)生成處理以生成源語言語句樣例的選項(xiàng),其中該選項(xiàng)允許選擇多個(gè)翻譯樣例中的最優(yōu)的一個(gè)(步驟S307)。選項(xiàng)生成處理將在后面詳細(xì)描述。
接下來,多義性檢測單元103確定是否所有搜索到的樣例都已經(jīng)被處理(步驟S308),當(dāng)不是所有搜索到的樣例都被處理時(shí)(步驟S308否),選擇下一個(gè)樣例,并重復(fù)該處理(步驟S303)。
另一方面,當(dāng)所有搜索到的樣例都已被處理時(shí)(步驟S308是),輸出控制單元105將選項(xiàng)生成單元104生成的樣例選項(xiàng)輸出到屏幕(步驟S309)。
接著,輸入接收單元101從輸出到屏幕上的樣例選項(xiàng)中,接收用戶選擇的樣例輸入(步驟S310)。然后輸出控制單元105獲取與用戶所選擇的樣例相對應(yīng)的翻譯,并將其輸出到屏幕(步驟S311)。
下面將詳細(xì)描述步驟S307的選項(xiàng)生成處理。圖4是根據(jù)第一實(shí)施例的選項(xiàng)生成處理的一般流程的流程圖。
首先,選項(xiàng)生成單元104從多個(gè)翻譯樣例中選擇一個(gè)未處理的翻譯樣例(步驟S401)。接著,選項(xiàng)生成單元104訪問存儲(chǔ)單元111,從與所選擇的翻譯樣例相對應(yīng)的源語言語句樣例中選擇一個(gè)樣例,該樣例與最少數(shù)目的目標(biāo)語言翻譯相關(guān)聯(lián)(步驟S402)。
當(dāng)具有多個(gè)與最少數(shù)目的翻譯樣例相關(guān)聯(lián)的源語言語句樣例時(shí),例如選擇存儲(chǔ)單元111中的預(yù)定優(yōu)先級高的樣例。
接下來,選項(xiàng)生成單元104產(chǎn)生所選擇的源語言語句樣例作為樣例選項(xiàng)(步驟S403)。選項(xiàng)生成單元104確定是否所有翻譯樣例都已被處理(步驟S404)。當(dāng)不是所有翻譯樣例都已被處理時(shí)(步驟S404否),選擇下一個(gè)翻譯樣例,并重復(fù)該處理(步驟S401)。
另一方面,當(dāng)所有的翻譯樣例都已被處理時(shí)(步驟S404是),選項(xiàng)生成處理完成。
接著,將說明由多義性檢測單元103執(zhí)行的多義性檢測處理(步驟S305)和由選項(xiàng)生成單元104執(zhí)行的選項(xiàng)生成處理(步驟S307)的一個(gè)具體實(shí)例。圖5A和圖5B是多義性檢測處理和選項(xiàng)生成處理中參照的源語言語句樣例和翻譯樣例之間關(guān)系的一個(gè)實(shí)例。
圖5A示出了一個(gè)實(shí)例,其中源語言語句樣例j0對應(yīng)于目標(biāo)語言語句的三個(gè)樣例e1、e2、e3。當(dāng)如這里所述,有多個(gè)目標(biāo)語言樣例對應(yīng)于所檢索到的源語言語句時(shí),表示j0的翻譯多義的。具體來說,多義性檢測單元103可以通過確定是否有多個(gè)目標(biāo)語言語句樣例對應(yīng)于源語言語句樣例,來檢測源語言語句的翻譯的多義性(步驟S305)。
圖5B示出了一個(gè)實(shí)例,其中源語言語句樣例j0對應(yīng)于目標(biāo)語言的三個(gè)樣例e1、e2、e3,而目標(biāo)語言樣例e1、e2、e3又從相反方向?qū)?yīng)于源語言語句的四個(gè)樣例j0、j1、j2、j3。
選項(xiàng)生成單元104通過分析圖5B中所示的翻譯關(guān)系來生成選項(xiàng)。具體來說,提取與最少數(shù)目的目標(biāo)語言的對應(yīng)樣例相關(guān)聯(lián)的源語言樣例,并將所提取的源語言語句樣例產(chǎn)生作為選項(xiàng)。
例如,如圖5B所示,存在三個(gè)目標(biāo)語言候選樣例e1、e2、e3與源語言語句樣例j0相對應(yīng)。對于目標(biāo)語言樣例e1,其對應(yīng)于樣例j0、j1,其中j0對應(yīng)于目標(biāo)語言的三個(gè)樣例e1、e2、e3,而j1對應(yīng)于目標(biāo)語言的兩個(gè)樣例e1和e2。在這種情況下,樣例j1具有最少的多義性,于是被選擇(步驟S402)。
同樣,對于目標(biāo)語言樣例e2,其對應(yīng)于樣例j0、j1和j2。樣例j0對應(yīng)于目標(biāo)語言的三個(gè)樣例e1、e2、e3,樣例j1對應(yīng)于目標(biāo)語言的兩個(gè)樣例e1和e2,樣例j2只對應(yīng)于目標(biāo)語言的一個(gè)樣例e2。在這種情況下,j2的對應(yīng)關(guān)系具有最少的多義性,因此提取樣例j2(步驟S402)。
接下來,對于目標(biāo)語言樣例e3,其對應(yīng)于樣例j0和j3。樣例j0對應(yīng)于目標(biāo)語言的三個(gè)樣例e1、e2、e3,樣例j3對應(yīng)于目標(biāo)語言的一個(gè)樣例e3。在這種情況下,樣例j3具有最少的多義性,因此提取樣例j3(步驟S402)。這樣,樣例j1、j2、j3被產(chǎn)生作為選項(xiàng)(步驟S403)。
接著,將介紹用于顯示輸入語句和所生成的選項(xiàng)的顯示屏。圖6A和圖6B是顯示顯示屏的內(nèi)容的一個(gè)實(shí)例。圖6A示出了顯示屏上顯示輸入語句和樣例選項(xiàng)的一個(gè)實(shí)例,圖6B示出了顯示屏上顯示所選擇的選項(xiàng)的翻譯結(jié)果的一個(gè)實(shí)例。
如圖6A所示,用戶輸入的語句顯示在顯示屏的下方,選項(xiàng)生成單元104生成的樣例選項(xiàng)顯示在顯示屏的上方。圖6A示出了英語中的意思是“No,thank you.”的日語601被輸入作為源語言語句的情況。
在這種情況下,假設(shè)如圖2所示的平行語料庫存儲(chǔ)在存儲(chǔ)單元111中。那么,通過前面描述的處理建議了包括日語602和日語603的兩個(gè)選項(xiàng)(步驟S309)。
輸入源語言語句的用戶可以通過諸如筆、鼠標(biāo)伙鍵盤的輸入裝置從建議的選項(xiàng)中選擇與說話人意思一致的樣例。圖6A示出了用戶用筆選中了日語602的情況。
輸入接收單元101在接收了用戶通過輸入裝置所選擇的輸入后(步驟S310),如圖6B所示,在顯示單元上輸出與日語602相對應(yīng)的目標(biāo)語言樣例“No,thank you.”(步驟S311)。
下面,將介紹顯示屏的配置的另一個(gè)實(shí)例。圖7是示出了顯示屏的內(nèi)容的另一個(gè)實(shí)例的示意圖。
在存儲(chǔ)單元111中存儲(chǔ)的信息中,一個(gè)對應(yīng)于目標(biāo)語言中的多個(gè)樣例的樣例,如果具有最少的多義性,也有可能被產(chǎn)生為一個(gè)選項(xiàng)。在這種情況下,對應(yīng)于源語言語句的特定樣例的翻譯就具有多義性,因此就不能將其建議為一個(gè)樣例選項(xiàng)。
因此,在建議選項(xiàng)時(shí),選項(xiàng)生成單元104所提取的作為選項(xiàng)的樣例可以與特定樣例的翻譯是否具有多義性的信息相對應(yīng)地顯示。
圖7示出了用下劃線將對應(yīng)翻譯具有多義性的源語言語句樣例與沒有多義性的樣例區(qū)分開來的情況。顯示方法不僅僅局限于這種方法,任何以相關(guān)方式輸出表示存在多個(gè)翻譯樣例的信息的顯示方法都可以使用。
對應(yīng)的樣例也可以替換地用除下劃線以外的其他符號標(biāo)識(shí),或者可以改變對應(yīng)樣例的字符或者背景的顏色以供標(biāo)識(shí)。此外,可以將對應(yīng)翻譯具有多義性的樣例和對應(yīng)翻譯沒有多義性的樣例分成兩組,分別在不同的顯示列中顯示。
盡管上述情況使用了這里建議的方法用于具有顯示器和輸入裝置的移動(dòng)終端,但是所建議的方法也可以用于其他類型的裝置,如移動(dòng)電話或臺(tái)式終端。
如上所述,根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備以這樣的方式操作當(dāng)輸入的源語言語句具有多個(gè)翻譯樣例時(shí),從對應(yīng)于每個(gè)翻譯樣例的多個(gè)源語言語句樣例中將具有最少多義性的樣例建議給用戶作為選項(xiàng)。用戶可以從具有與輸入語句類似含義的樣例的選項(xiàng)中確認(rèn)并選擇一個(gè)與講話意圖一致的樣例。結(jié)果是,降低了輸出與講話意圖相偏離的翻譯的可能性。
在根據(jù)第二實(shí)施例的基于樣例的翻譯設(shè)備中,具有相同含義的多個(gè)翻譯樣例被集中地存儲(chǔ)為一個(gè)樣例組,其被認(rèn)為是一個(gè)樣例,并處理。
第二實(shí)施例與第一實(shí)施例的不同之處在于存儲(chǔ)單元的配置。配置和功能的其他部分與圖1的方框圖所示的根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備的配置相類似,因此,這些部分用相同的參考標(biāo)記標(biāo)出,而不再重復(fù)介紹。
與第一實(shí)施例相類似,根據(jù)第二實(shí)施例的存儲(chǔ)單元111用于存儲(chǔ)平行語料庫。存儲(chǔ)單元111與第一實(shí)施例的存儲(chǔ)單元111不同之處在于,與源語言語句的樣例按照對應(yīng)關(guān)系設(shè)置的具有相同含義的多個(gè)翻譯樣例被集中地存儲(chǔ)為一個(gè)樣例組。
圖8是示出了存儲(chǔ)在存儲(chǔ)單元111中的平行語料庫的數(shù)據(jù)結(jié)構(gòu)的一個(gè)實(shí)例。如圖8所示,存在兩個(gè)具有相同含義的英語翻譯樣例“Iunderstand.”和“I see.”對應(yīng)于日語樣例801,這兩個(gè)英語樣例用“”隔開,并集中地存儲(chǔ)為如英語樣例802所示。
具體來說,不同于第一實(shí)施例,具有相同含義的英語樣例并不利用不同的直線按照彼此的對應(yīng)關(guān)系存儲(chǔ)為獨(dú)立的樣例,而是使用一條直線將其存儲(chǔ)為一個(gè)組。
通過這種方式集中地處理具有相同含義的多個(gè)樣例,避免了執(zhí)行不必要的處理的不方便性。例如,根據(jù)第一實(shí)施例,具有相同含義的樣例被按照對應(yīng)關(guān)系分別存儲(chǔ),因此步驟S305確定源語言語句的對應(yīng)樣例具有多義性,并且執(zhí)行選項(xiàng)生成處理(步驟S307)。
相反地,通過以與根據(jù)第二實(shí)施例的其他樣例相同的方式處理具有相同含義的樣例組,步驟S305確定源語言語句的對應(yīng)樣例沒有多義性,因此避免了執(zhí)行選項(xiàng)生成處理。
除了如上所述將多個(gè)樣例作為一個(gè)樣例來處理以外,根據(jù)第二實(shí)施例的基于樣例的翻譯設(shè)備的基于樣例的翻譯處理的一般流程與圖3中所示的根據(jù)第一實(shí)施例的基于樣例的翻譯處理的一般流程的流程圖相同,因此不再重復(fù)解釋。
當(dāng)用戶選擇了對應(yīng)于如上所述的樣例組的源語言語句樣例時(shí)(步驟S310),輸出控制單元105輸出樣例組中包含的多個(gè)樣例中的任意一個(gè)作為翻譯(步驟S311)。
如上所述,在根據(jù)第二實(shí)施例的基于樣例的翻譯設(shè)備中,具有相同含義的多個(gè)樣例集中地存儲(chǔ)為一個(gè)樣例組,并視為一個(gè)樣例來處理。因此,省去了多義性檢測處理和選項(xiàng)生成處理的不必要的部分。
基于樣例的機(jī)器翻譯一般在平行語料庫中都具有大量數(shù)據(jù)。因此,特別是對于具有有限存儲(chǔ)能力的移動(dòng)終端來說,希望不用將平行語料庫存儲(chǔ)在終端上,而是希望通過通信設(shè)備獲取由外部服務(wù)器管理的樣例。
在根據(jù)第三實(shí)施例的基于樣例的翻譯設(shè)備中,通過通信單元在用于管理平行語料庫的樣例管理服務(wù)器中檢索與輸入的源語言語句相對應(yīng)的樣例。
圖9是顯示根據(jù)第三實(shí)施例的基于樣例的翻譯設(shè)備900的配置的方框圖。如圖9所示,基于樣例的翻譯設(shè)備900包括通信單元912、輸入接收單元101、樣例搜索單元102、多義性檢測單元103、選項(xiàng)生成單元104和輸出控制單元105。同時(shí),基于樣例的翻譯設(shè)備900還通過網(wǎng)絡(luò),如因特網(wǎng),與樣例管理服務(wù)器950連接。
第三實(shí)施例與第一實(shí)施例的不同之處在于,添加了通信單元912,刪除了存儲(chǔ)單元111。配置和功能的其余部分與圖1的方框圖所示的根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備100的配置類似,并用相同的參考標(biāo)記標(biāo)出,不再重復(fù)介紹。
樣例管理服務(wù)器950包括通信單元941和存儲(chǔ)單元951。通信單元941控制從基于樣例的翻譯設(shè)備900接收樣例搜索請求并向基于樣例的翻譯設(shè)備900返回構(gòu)成翻譯結(jié)果的樣例的處理。
與第一實(shí)施例中類似,存儲(chǔ)單元951存儲(chǔ)平行語料庫,并且與根據(jù)第一實(shí)施例的存儲(chǔ)單元111具有相同的結(jié)構(gòu)。因此,不再介紹存儲(chǔ)單元951。
基于樣例的翻譯設(shè)備900的通信單元912向樣例管理服務(wù)器950發(fā)送一個(gè)源語言語句,并接收由樣例管理服務(wù)器950針對所發(fā)送的源語言語句所搜索和返回的樣例。
下面,將介紹根據(jù)具有這種配置的第三實(shí)施例的基于樣例的翻譯設(shè)備900所執(zhí)行的基于樣例的翻譯處理。圖10是示出了根據(jù)第三實(shí)施例的基于樣例的翻譯處理的一般流程的流程圖。
步驟S1001的輸入接收處理與根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備100中的步驟S301的處理類似,因此不再介紹。
在接收了輸入語句后,樣例搜索單元102通過通信單元912從樣例管理服務(wù)器950獲取與輸入語句相一致或相類似的源語言語句的樣例(步驟S1002)。
步驟S1003到步驟S1011的多義性檢測處理、選項(xiàng)生成處理和輸出處理都與根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備100的步驟S303到步驟S311的處理類似,因此不再介紹。
下面,將介紹根據(jù)第三實(shí)施例的具有該配置的基于樣例的翻譯設(shè)備900所執(zhí)行的選項(xiàng)生成處理。圖11是示出了根據(jù)第三實(shí)施例的選項(xiàng)生成處理的一般流程的流程圖。
步驟S1101的未處理樣例選擇處理與根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備100的步驟S401的處理類似,因此不再介紹。
選擇了未處理的樣例之后,選項(xiàng)生成單元104通過通信單元912從樣例管理服務(wù)器950獲取與所選擇的未處理翻譯樣例相對應(yīng)的源語言樣例中的一個(gè),該樣例與具有最少數(shù)目的目標(biāo)語言翻譯樣例相關(guān)聯(lián)(步驟S1102)。
步驟S1103到步驟S1104的選項(xiàng)生成處理和完成確定處理與根據(jù)第一實(shí)施例的基于樣例的翻譯設(shè)備100的步驟S403到S404的處理類似,因此不再介紹。
如上所述,在根據(jù)第三實(shí)施例的基于樣例的翻譯設(shè)備中,可以通過通信單元從用于管理平行語料庫的樣例管理服務(wù)器中搜索與輸入的源語言語句相對應(yīng)的樣例。結(jié)果是,樣例管理處理就集中在樣例管理服務(wù)器上,從而降低了樣例管理處理負(fù)擔(dān)。
根據(jù)第一到第三實(shí)施例的基于樣例的翻譯設(shè)備所執(zhí)行的基于樣例的翻譯程序以建立在ROM(只讀存儲(chǔ)器)中的形式提供。
根據(jù)第一到第三實(shí)施例的基于樣例的翻譯設(shè)備所執(zhí)行的基于樣例的翻譯程序也可以通過記錄為計(jì)算機(jī)可讀記錄介質(zhì)中的可安裝或可執(zhí)行的文件的形式提供,所述計(jì)算機(jī)可讀記錄介質(zhì)如CD-ROM(光盤只讀存儲(chǔ)器)、軟盤(FD)、CD-R(可刻錄光盤)或者DVD。
作為另一替換,根據(jù)第一到第三實(shí)施例的基于樣例的翻譯設(shè)備所執(zhí)行的基于樣例的翻譯程序也可以以存儲(chǔ)在計(jì)算機(jī)中的形式提供,所述計(jì)算機(jī)連接到諸如因特網(wǎng)的網(wǎng)絡(luò)上,并且所述程序可以通過網(wǎng)絡(luò)被下載。作為另一替換,根據(jù)第一到第三實(shí)施例的基于樣例的翻譯設(shè)備所執(zhí)行的基于樣例的翻譯程序可以通過諸如因特網(wǎng)的網(wǎng)絡(luò)來提供或分布。
根據(jù)第一到第三實(shí)施例的基于樣例的翻譯設(shè)備所執(zhí)行的基于樣例的翻譯程序具有模塊化的結(jié)構(gòu),包括前面提到的各個(gè)部分(輸入接收單元、樣例搜索單元、多義性接測單元、選項(xiàng)生成單元、輸出控制單元),作為實(shí)際硬件,CPU(中央處理單元)從ROM中讀取基于樣例的翻譯程序,并執(zhí)行,從而把前面提到的各個(gè)部分裝載并生成到主存儲(chǔ)器中。
對于本領(lǐng)域技術(shù)人員來說很容易出現(xiàn)其他優(yōu)點(diǎn)和變形。因此,本發(fā)明在其更廣闊的方面并不局限于這里所顯示和描述的具體細(xì)節(jié)和代表性實(shí)施例。因此,在不脫離由所附權(quán)力要求及其等同方式所限定的精神和范圍內(nèi),可以做出各種變形。
權(quán)利要求
1.一種基于樣例的翻譯設(shè)備,包括存儲(chǔ)單元,其存儲(chǔ)第一語言的第一樣例和第二語言的第二樣例,所述第一樣例與至少一個(gè)與所述第一樣例具有相同含義的第二樣例相關(guān)聯(lián),所述第二樣例與至少一個(gè)與所述第二樣例具有相同含義的第一樣例相關(guān)聯(lián);輸入接收單元,其接收所述第一語言的語句的輸入;第一樣例搜索單元,其基于所述第一語言的語句,從所述存儲(chǔ)單元搜索第一樣例;第二樣例搜索單元,其搜索與所述第一樣例相對應(yīng)的第二樣例;確定單元,其確定是否存在多個(gè)搜索到的第二樣例;第一獲取單元,當(dāng)所述確定單元確定存在多個(gè)搜索到的第二樣例時(shí),所述第一獲取單元從所述存儲(chǔ)單元獲取與搜索到的多個(gè)第二樣例中的每一個(gè)相對應(yīng)的第一樣例;第二獲取單元,其從所述存儲(chǔ)單元獲取與所獲取的第一樣例相對應(yīng)的第二樣例;選項(xiàng)生成單元,其生成與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的所獲取的第一樣例,作為將被輸出的第一樣例的選項(xiàng);輸出控制單元,其輸出所述第一樣例的選項(xiàng)。
2.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,其中,所述第一樣例搜索單元從所述存儲(chǔ)單元搜索與所述第一語言的語句相一致的第一樣例。
3.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,其中,所述第一樣例搜索單元從所述存儲(chǔ)單元搜索與所述第一語言語句的相似程度大于預(yù)定閾值的第一樣例。
4.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,其中,當(dāng)存在多個(gè)第一樣例時(shí),所述第二樣例搜索單元搜索與所述多個(gè)第一樣例中的每一個(gè)相對應(yīng)的第二樣例。
5.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,其中,所述輸出控制單元相關(guān)聯(lián)地輸出信息和選項(xiàng),該信息表示存在多個(gè)所獲取的第二樣例,該選項(xiàng)是所述第一樣例的選項(xiàng)中的具有多個(gè)對應(yīng)的所獲取的第二樣例的第一樣例的選項(xiàng)。
6.根據(jù)權(quán)利要求5所述的基于樣例的翻譯設(shè)備,其中,所述輸出控制單元輸出所述第一樣例的選項(xiàng)中的具有多個(gè)對應(yīng)的所獲取的第二樣例的第一樣例的選項(xiàng),所述選項(xiàng)用下劃線表示。
7.根據(jù)權(quán)利要求5所述的基于樣例的翻譯設(shè)備,其中,所述輸出控制單元輸出所述第一樣例的選項(xiàng)中的具有多個(gè)對應(yīng)于所獲取的第二樣例的第一樣例的選項(xiàng),該選項(xiàng)與不具有多個(gè)對應(yīng)的所獲取的第二樣例的第一樣例的選項(xiàng)區(qū)分開。
8.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,其中,當(dāng)存在多個(gè)與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的第一樣例時(shí),所述選項(xiàng)生成單元從與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的第一樣例中,生成具有最高優(yōu)先級的第一樣例的選項(xiàng)。
9.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,還包括語音識(shí)別單元,其接收第一語言的語音,聽覺地識(shí)別所接收的語音,并輸出語音識(shí)別結(jié)果,其中,所述輸入接收單元接收所述語音識(shí)別結(jié)果作為所述第一語言的語句。
10.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,還包括字符識(shí)別單元,其接收第一語言的字符信息,識(shí)別所接收的字符信息,并輸出字符識(shí)別結(jié)果,其中,所述輸入接收單元接收所述字符識(shí)別結(jié)果作為所述第一語言的語句。
11.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,還包括顯示單元,其顯示所述第一樣例的選項(xiàng),其中,所述輸出控制單元將所述第一樣例的選項(xiàng)輸出到所述顯示單元。
12.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,還包括語音合成單元,其將與由用戶從所述第一樣例的選項(xiàng)中選擇的第一樣例相對應(yīng)的第二語言的語句合成為第二語言的語音,其中,所述輸出控制單元輸出所述第二語言的語音。
13.根據(jù)權(quán)利要求1所述的基于樣例的翻譯設(shè)備,其中,當(dāng)存在多個(gè)具有相同含義的第一樣例時(shí),所述存儲(chǔ)單元將所述具有相同含義的第一樣例設(shè)置為第一樣例組,并將所述第一樣例組與所述第二樣例相關(guān)聯(lián)地集中存儲(chǔ),當(dāng)存在多個(gè)具有相同含義的第二樣例時(shí),所述存儲(chǔ)單元將所述具有相同含義的第二樣例設(shè)置為第二樣例組,并將所述第二樣例組與所述第一樣例相關(guān)聯(lián)地集中存儲(chǔ),所述第一樣例搜索單元從所述存儲(chǔ)單元搜索所述第一樣例和所述第一樣例組中的一個(gè);所述第二樣例搜索單元搜索與所述第一樣例和所述第一樣例組中的一個(gè)相對應(yīng)的第二樣例和第二樣例組,所述確定單元確定搜索到的第二樣例或搜索到的第二樣例組的總數(shù)是否不小于二,當(dāng)所述確定單元確定搜索到的第二樣例或搜索到的第二樣例組的總數(shù)不小于二時(shí),所述第一獲取單元從所述存儲(chǔ)單元中,為所述第二樣例中的每一個(gè)或者所述第二樣例組中的每一個(gè),獲取與搜索到的第二樣例中的每一個(gè)或搜索到的第二樣例組中的每一個(gè)相關(guān)聯(lián)的第一樣例或第一樣例組,所述第二獲取單元從所述存儲(chǔ)單元獲取與所獲取的第一樣例或所獲取的第一樣例組相對應(yīng)的第二樣例或第二樣例組;所述選項(xiàng)生成單元生成與最少總數(shù)的所獲取的第二樣例或所獲取的第四樣例組相關(guān)聯(lián)的所獲取的第一樣例或所獲取的第一樣例組,作為所述第一樣例的選項(xiàng)。
14.一種基于樣例的翻譯設(shè)備,包括通信單元,其通過網(wǎng)絡(luò)將第一語言的語句、第一語言的第一樣例或第二語言的第二樣例傳輸?shù)脚c所述通信單元相連的樣例管理服務(wù)器,并接收從所述樣例管理服務(wù)器返回的第一樣例或第二樣例,所述樣例管理服務(wù)器具有存儲(chǔ)單元,用于存儲(chǔ)所述第一樣例和所述第二樣例,所述第一樣例與至少一個(gè)與所述第一樣例具有相同含義的第二樣例相關(guān)聯(lián),所述第二樣例與至少一個(gè)與所述第二樣例具有相同含義的第一樣例相關(guān)聯(lián);輸入接收單元,其接收所述第一語言的語句的輸入;第一樣例搜索單元,其基于所述第一語言的語句,通過所述通信單元從所述樣例管理服務(wù)器的存儲(chǔ)單元中搜索第一樣例;第二樣例搜索單元,其通過所述通信單元從所述樣例管理服務(wù)器的存儲(chǔ)單元中搜索與所述第一樣例相對應(yīng)的第二樣例;確定單元,其確定是否存在多個(gè)搜索到的第二樣例;第一獲取單元,當(dāng)所述確定單元確定存在多個(gè)搜索到的第二樣例時(shí),所述第一獲取單元通過所述通信單元從所述存儲(chǔ)單元中獲取與搜索到的第二樣例的每一個(gè)相對應(yīng)的第一樣例;第二獲取單元,其通過所述通信單元從所述存儲(chǔ)單元中獲取與所獲取的第一樣例相對應(yīng)的第二樣例;選項(xiàng)生成單元,其生成與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的第一樣例,作為將被輸出的第一樣例的選項(xiàng);以及輸出控制單元,其輸出所述第一樣例的選項(xiàng)。
15.一種基于樣例的翻譯方法,包括接收第一語言的輸入語句;基于所述第一語言的語句,從存儲(chǔ)有第一語言的第一樣例和第二語言的第二樣例的存儲(chǔ)器中搜索第一樣例,所述第一樣例與至少一個(gè)與所述第一樣例具有相同含義的第二樣例相關(guān)聯(lián),所述第二樣例與至少一個(gè)與所述第二樣例具有相同含義的第一樣例相關(guān)聯(lián);搜索與第一樣例相對應(yīng)的第二樣例;確定是否存在多個(gè)搜索到的第二樣例;當(dāng)確定存在多個(gè)搜索到的第二樣例時(shí),從所述存儲(chǔ)單元獲取與搜索到的第二樣例的每一個(gè)相對應(yīng)的第一樣例;從所述存儲(chǔ)單元獲取與所述第一樣例相對應(yīng)的第二樣例;生成與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的第一樣例,作為將被輸出的第一樣例的選項(xiàng);以及輸出所述第一樣例的選項(xiàng)。
16.一種基于樣例的翻譯方法,包括接收第一語言的輸入語句;基于所述第一語言的語句,通過通信單元從樣例管理服務(wù)器的存儲(chǔ)單元中搜索第一語言的第一樣例,所述第一樣例與至少一個(gè)與所述第一樣例具有相同含義的第二樣例相關(guān)聯(lián),所述第二樣例與至少一個(gè)與所述第二樣例具有相同含義的第一樣例相關(guān)聯(lián),所述通信單元將所述第一語言的語句、所述第一樣例或第二語言的第二樣例傳輸?shù)剿鰳永芾矸?wù)器,并接收由翻譯樣例管理服務(wù)器返回的第一樣例或第二樣例,所述翻譯樣例管理服務(wù)器通過網(wǎng)絡(luò)相連;通過所述通信單元從所述樣例管理服務(wù)器的存儲(chǔ)單元中搜索與所述第一樣例相對應(yīng)的第二樣例;確定是否存在多個(gè)搜索到的第二樣例;當(dāng)確定存在多個(gè)搜索到的第二樣例時(shí),通過所述通信單元從所述存儲(chǔ)單元獲取與搜索到的第二樣例的每一個(gè)相對應(yīng)的第一樣例;通過所述通信單元從所述存儲(chǔ)單元獲取與所獲取的第一樣例相對應(yīng)的第二樣例;生成與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的第一樣例,作為將被輸出的第一樣例的選項(xiàng);以及輸出所述第一樣例的選項(xiàng)。
全文摘要
一種設(shè)備,包括第一搜索單元,其基于第一語言的語句從存儲(chǔ)單元搜索第一語言的第一樣例;第二搜索單元,其搜索與第一樣例相對應(yīng)的第二語言的第二樣例,該第二語言與第一樣例具有相同的含義;確定單元,其確定是否存在多個(gè)第二樣例;第一獲取單元,其從存儲(chǔ)單元獲取與每個(gè)第二樣例相對應(yīng)的第一樣例;第二獲取單元,其獲取與從存儲(chǔ)單元獲取的第一樣例相對應(yīng)的第二樣例;以及選項(xiàng)生成單元,其生成與最少數(shù)目的所獲取的第二樣例相關(guān)聯(lián)的所獲取的第一樣例,作為將被輸出的第一樣例的選項(xiàng)。
文檔編號G06F17/30GK1971554SQ200610148670
公開日2007年5月30日 申請日期2006年11月22日 優(yōu)先權(quán)日2005年11月22日
發(fā)明者住田一男 申請人:株式會(huì)社東芝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1