基于大數(shù)據(jù)的機(jī)器人對話控制方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種機(jī)器人對話控制方法和系統(tǒng),通過根據(jù)輸入語句輸入大數(shù)據(jù)搜索引擎進(jìn)行搜索,獲得搜索結(jié)果,將搜索結(jié)果中與輸入語句匹配度最大的前m條語句作為第一語句,從第一語句中篩選合理性參數(shù)最大的語句作為聊天輸出語句輸出,可篩選出合理的第一語句作為輸出語句輸出,可提高機(jī)器人回復(fù)有效性和合理性。采用大數(shù)據(jù)搜索引擎對輸入語句進(jìn)行搜索,不再是根據(jù)人工建立的數(shù)據(jù)庫進(jìn)行搜索,由于大數(shù)據(jù)搜索引擎對應(yīng)的語句是根據(jù)大量用戶在歷史聊天過程中產(chǎn)生的語句,獲得的搜索結(jié)果更符合實(shí)際中用戶聊天,從第一語句中篩選符合預(yù)設(shè)條件的語句更加符合聊天語句,提高機(jī)器人回復(fù)語句的有效性和真實(shí)性。
【專利說明】
基于大數(shù)據(jù)的機(jī)器人對話控制方法和系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及人工智能技術(shù)領(lǐng)域,特別涉及一種基于大數(shù)據(jù)的機(jī)器人對話控制方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著機(jī)器人技術(shù)的快速發(fā)展,用戶對聊天機(jī)器人功能的要求也越來越高。如果用戶與聊天機(jī)器人聊天時(shí),分不清聊天的對象是人還是聊天機(jī)器人,則能通過圖靈測試,則說明該聊天機(jī)器人具備了人工智能,所以聊天機(jī)器人是人工智能的最重要內(nèi)容之一。
[0003]現(xiàn)有聊天機(jī)器人,都是基于回復(fù)數(shù)據(jù)庫對用戶的輸入語句進(jìn)行恢復(fù),數(shù)據(jù)庫中的數(shù)據(jù)表一般包含兩個(gè)基本字段,第一個(gè)字段是特征字符或詞句,第二個(gè)字段是自動(dòng)回復(fù)的內(nèi)容,如圖1所示?;貜?fù)數(shù)據(jù)庫中的內(nèi)容需要人工增添或?qū)胧孪热斯ぶ谱骱玫幕貜?fù)文本。人工制作回復(fù)數(shù)據(jù)庫的成本非常高,而且無法羅列所有可能的自動(dòng)回復(fù)的內(nèi)容,因此導(dǎo)致了現(xiàn)有聊天機(jī)器人只能對用戶的一些常用聊天輸入語句進(jìn)行有效的自動(dòng)回復(fù),而如果用戶的其他聊天輸入語句在回復(fù)數(shù)據(jù)庫不存在相應(yīng)特征字符或詞句時(shí),聊天機(jī)器人則不知道如何回答,而只能進(jìn)行無效的自動(dòng)回答,譬如回答“哦”等,如圖2所示。而且因?yàn)榛貜?fù)數(shù)據(jù)庫是人工構(gòu)建的,并不是人們自然聊天中產(chǎn)生回復(fù)語句,所以有時(shí)只是構(gòu)建者自己構(gòu)造出來的回復(fù)語句,與人們真實(shí)的聊天回復(fù)語句有一定的差距,大大降低了機(jī)器人聊天回復(fù)的有效性和真實(shí)性。
【發(fā)明內(nèi)容】
[0004]基于此,有必要針對機(jī)器人回復(fù)語句的有效性和真實(shí)性較低的問題,提供一種提高機(jī)器人回復(fù)語句的有效性和真實(shí)性的基于大數(shù)據(jù)的機(jī)器人對話控制方法和系統(tǒng)。
[0005]—種機(jī)器人對話控制方法,包括以下步驟:
[0006]獲取輸入語句,將所述輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果;
[0007]篩選所述搜索結(jié)果中與所述輸入語句匹配度最大的前m條語句分別作為m條第一語句,其中,所述m為正整數(shù);
[0008]分別計(jì)算每條所述第一語句的合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出。
[0009]本發(fā)明還提供一種機(jī)器人對話控制系統(tǒng),包括:
[0010]搜索模塊,用于獲取輸入語句,將所述輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果;
[0011]第一篩選模塊,用于篩選所述搜索結(jié)果中與所述輸入語句匹配度最大的前m條語句分別作為m條第一語句,其中,所述m為正整數(shù);
[0012]第二篩選模塊,用于分別計(jì)算每條所述第一語句的合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出。
[0013]上述機(jī)器人對話控制方法和系統(tǒng),通過根據(jù)輸入語句輸入大數(shù)據(jù)搜索引擎進(jìn)行搜索,獲得搜索結(jié)果,將搜索結(jié)果中與輸入語句匹配度最大的前m條語句作為第一語句,從m條第一語句中篩選合理性參數(shù)最大對應(yīng)的語句作為聊天輸出語句輸出,即可篩選出合理的第一語句作為輸出語句輸出,可提高機(jī)器人回復(fù)有效性和合理性。采用大數(shù)據(jù)搜索引擎對輸入語句進(jìn)行搜索,不再是根據(jù)人工建立的數(shù)據(jù)庫進(jìn)行搜索,由于大數(shù)據(jù)搜索引擎對應(yīng)的語句是根據(jù)大量用戶在歷史聊天過程中產(chǎn)生的語句,獲得的搜索結(jié)果更符合實(shí)際中用戶聊天的語句,且從m條第一語句中篩選合理性參數(shù)最大對應(yīng)的語句則更加符合聊天語句,提高機(jī)器人回復(fù)語句的有效性和真實(shí)性。
【附圖說明】
[0014]圖1為現(xiàn)有機(jī)器人中回復(fù)數(shù)據(jù)庫中內(nèi)容導(dǎo)入圖;
[0015]圖2為現(xiàn)有機(jī)器人與用戶交互的示意圖;
[0016]圖3為另一種實(shí)施方式的機(jī)器人對話控制方法的流程圖;
[0017]圖4為另一種實(shí)施方式的機(jī)器人對話控制方法的流程圖;
[0018]圖5為另一種實(shí)施方式的機(jī)器人對話控制方法的流程圖;
[0019]圖6為另一種實(shí)施方式的機(jī)器人對話控制方法的流程圖;
[0020]圖7為另一種實(shí)施方式的機(jī)器人對話控制方法的流程圖;
[0021 ]圖8為本發(fā)明機(jī)器人與用戶交互的示意圖;
[0022]圖9為一種實(shí)施方式的機(jī)器人對話控制系統(tǒng)的模塊圖;
[0023]圖10為另一種實(shí)施方式的機(jī)器人對話控制系統(tǒng)的模塊圖;
[0024]圖11為另一種實(shí)施方式的機(jī)器人對話控制系統(tǒng)的模塊圖;
[0025]圖12為另一種實(shí)施方式的機(jī)器人對話控制系統(tǒng)的模塊圖;
[0026]圖13為另一種實(shí)施方式的機(jī)器人對話控制系統(tǒng)的模塊圖。
【具體實(shí)施方式】
[0027]請參閱圖3,提供一種實(shí)施方式機(jī)器人對話控制方法,包括以下步驟:
[0028]SlOO:獲取輸入語句,將輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果。
[0029]在本實(shí)施例中,機(jī)器人是指泛義的機(jī)器人,包括一切模擬人類行為或思想以及模擬其他生物的機(jī)械,也包括一些電腦程序,例如,聊天機(jī)器人程序等。在用戶需要與機(jī)器人進(jìn)行交互時(shí),用戶可向機(jī)器人輸入語句,從而機(jī)器人可獲取用戶的輸入語句,其中,輸入語句可以是文字和語音,甚至可以是視頻。在本實(shí)施例中,輸入語句為語音,將輸入語句輸入至大數(shù)據(jù)搜索引擎中進(jìn)行搜索,可獲得搜索結(jié)果,其中,其中,搜索結(jié)果中包括多條語句,搜索結(jié)果中語句的條數(shù)即是搜索結(jié)果的數(shù)量,搜索出的這些語句與輸入語句相關(guān)。其中,搜索是調(diào)用大數(shù)據(jù)搜索引擎自動(dòng)完成的,大數(shù)據(jù)搜索引擎包括但不限于baidu(百度)、g00gle(谷歌)和gfsoso(谷粉搜搜)等互聯(lián)網(wǎng)搜索引擎、局域網(wǎng)搜索引擎、基于數(shù)據(jù)倉庫或數(shù)據(jù)庫的搜索引擎以及機(jī)器人自帶的搜索引擎。
[0030]S200:篩選搜索結(jié)果中與輸入語句匹配度最大的前m條語句分別作為m條第一語句。
[0031]其中,m為正整數(shù)。由于根據(jù)輸入語句進(jìn)行搜索時(shí),可能會(huì)獲得較多的搜索結(jié)果,有些搜索結(jié)果可能不太合理,對全部的數(shù)據(jù)進(jìn)行處理時(shí)會(huì)浪費(fèi)較多時(shí)間,從而需要對搜索結(jié)果進(jìn)行篩選,篩選出較為合理的,即篩選出搜索結(jié)果中與輸入語句匹配度最大的前m條語句分別作為m條第一語句,即與輸入語句匹配度最大的前m條語句是指將與輸入語句匹配度按從大到小的順序排序,排在最前的m條語句。例如,將輸入語句輸入到百度搜索引擎中進(jìn)行搜索,根據(jù)匹配度從大到小進(jìn)行排序后的搜索結(jié)果顯示在頁面上,排在越前的搜索結(jié)果,表示越合理。
[0032]S300:分別計(jì)算每條第一語句的合理性參數(shù),并將合理性參數(shù)最大對應(yīng)的第一語句作為聊天輸出語句并輸出。
[0033]獲得的每條第一語句有其對應(yīng)的合理性參數(shù),在本實(shí)施例中,合理性參數(shù)與搜索結(jié)果數(shù)量對應(yīng),第一語句的合理性參數(shù)是由根據(jù)第一語句進(jìn)行搜索得到的搜索結(jié)果數(shù)量來決定,即第一語句的合理性參數(shù)與第一語句的搜索結(jié)果數(shù)量相關(guān)的,第一語句的搜索結(jié)果數(shù)量越大,第一語句越合理,合理性參數(shù)越大。
[0034]可以理解,合理性參數(shù)還可與搜索結(jié)果數(shù)量在總搜索結(jié)果數(shù)量的比重對應(yīng),合理性參數(shù)由搜索結(jié)果數(shù)量在總搜索結(jié)果數(shù)量的比重決定,即第一語句的合理性參數(shù)與第一語句的搜索結(jié)果數(shù)量在總搜索結(jié)果數(shù)量的比重相關(guān)的,第一語句的總搜索結(jié)果數(shù)量為每條第一語句的搜索結(jié)果數(shù)量的總數(shù),占的比重越大,合理性參數(shù)越大。
[0035]上述機(jī)器人對話控制方法,通過根據(jù)輸入語句輸入大數(shù)據(jù)搜索引擎進(jìn)行搜索,獲得搜索結(jié)果,將搜索結(jié)果中與輸入語句匹配度最大的前m條語句作為第一語句,從m條第一語句中篩選合理性參數(shù)最大對應(yīng)的語句作為聊天輸出語句輸出,即可篩選出合理的第一語句作為輸出語句輸出,可提高機(jī)器人回復(fù)有效性和合理性。采用大數(shù)據(jù)搜索引擎對輸入語句進(jìn)行搜索,不再是根據(jù)人工建立的數(shù)據(jù)庫進(jìn)行搜索,由于大數(shù)據(jù)搜索引擎對應(yīng)的語句是根據(jù)大量用戶在歷史聊天過程中產(chǎn)生的語句,獲得的搜索結(jié)果更符合實(shí)際中用戶聊天的語句,且從m條第一語句中篩選合理性參數(shù)最大對應(yīng)的語句則更加符合聊天語句,提高機(jī)器人回復(fù)語句的有效性和真實(shí)性。
[0036]請參閱圖4,在其中一個(gè)實(shí)施例中,分別計(jì)算每條第一語句的合理性參數(shù),并將最大合理性參數(shù)對應(yīng)的第一語句作為聊天輸出語句并輸出的步驟S300包括:
[0037]S310:分別將每條第一語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果數(shù)量作為第一語句的搜索結(jié)果數(shù)量。
[0038]S320:將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),并將最大合理性參數(shù)對應(yīng)的第一語句作為聊天輸出語句并輸出。
[0039]獲得m條第一語句后,分別根據(jù)每條第一語句進(jìn)行搜索,獲得搜索結(jié)果數(shù)量作為第一語句的搜索結(jié)果數(shù)量,搜索結(jié)果數(shù)量是根據(jù)第一語句搜索得到的,從而搜索結(jié)果數(shù)量是和第一語句對應(yīng)的,即獲得與第一語句對應(yīng)的搜索結(jié)果數(shù)量,有m條第一語句,搜索m次,獲得m個(gè)搜索結(jié)果數(shù)量,每條第一語句對應(yīng)一個(gè)搜索結(jié)果數(shù)量,即由于有m條第一語句,根據(jù)每條第一語句進(jìn)行搜索,從而可獲得m個(gè)搜索結(jié)果數(shù)量分別作為第一語句的搜索結(jié)果數(shù)量,單個(gè)搜索結(jié)果數(shù)量作為單條第一語句的搜索結(jié)果數(shù)量。例如,有2條第一語句分別為A和B,根據(jù)第一語句A進(jìn)行搜索,得到搜索結(jié)果數(shù)量為30,根據(jù)第一語句B進(jìn)行搜索,得到搜索結(jié)果數(shù)量為10,分別進(jìn)行了2次搜索,獲得2個(gè)搜索結(jié)果數(shù)量分別30和10,將該2個(gè)搜索結(jié)果數(shù)量分別作為第一語句的搜索結(jié)果數(shù)量,30是對應(yīng)第一語句A的,10對應(yīng)第一語句B的。
[0040]可以理解,在本實(shí)施例中,將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),即根據(jù)第一語句的搜索結(jié)果數(shù)可獲得第一語句的合理性參數(shù),從而,最大搜索結(jié)果數(shù)量對應(yīng)最大合理性參數(shù)。分別將m條第一語句輸入至大數(shù)據(jù)搜索引擎中進(jìn)行搜索,即搜索m次,獲得m個(gè)搜索結(jié)果數(shù)量。搜索是調(diào)用大數(shù)據(jù)搜索引擎自動(dòng)完成的,從第一語句對應(yīng)的搜索結(jié)果數(shù)量的大小可知人們對第一語句的認(rèn)同度,搜索結(jié)果數(shù)量越大表示人們對第一語句的認(rèn)同度越高,則該第一語句越合理。獲得m條第一語句后,需要從其中選出一條最合理的語句作為輸出語句輸出給用戶。從第一語句對應(yīng)的搜索結(jié)果數(shù)量越大,其越合理,從而將最大搜索結(jié)果數(shù)量對應(yīng)的第一語句作為聊天輸出語句并輸出,即是將合理性參數(shù)最大對應(yīng)的語句作為輸出語句輸出,確保聊天語句的合理性。
[0041 ]請參閱圖5,在其中一個(gè)實(shí)施例中,將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),并將最大合理性參數(shù)對應(yīng)的第一語句作為聊天輸出語句并輸出的步驟S320包括:
[0042]S321:將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),并將最大合理性參數(shù)對應(yīng)的第一語句作為聊天輸出語句。
[0043]S322:將聊天輸出語句進(jìn)行人稱變換后輸出。
[0044]其中,搜索結(jié)果數(shù)量代表的是人們對第一語句的認(rèn)同度,即第一語句的合理性,第一語句對應(yīng)的搜索結(jié)果數(shù)量越大則越合理。由于是用戶和機(jī)器人的聊天,為了使機(jī)器人回復(fù)語句更加的合理,將最大搜索結(jié)果數(shù)量對應(yīng)的第一語句作為聊天輸出語句輸出時(shí),即將最大合理性參數(shù)對應(yīng)的第一語句作為聊天語句輸出時(shí),需要將聊天輸出語句進(jìn)行人稱變換后再輸出,即使對話合理化。例如,輸入語句的主語是我時(shí),表示是用戶自己,那么機(jī)器人在回復(fù)時(shí),是對用戶的回復(fù),將聊天輸出語句中的我變換成你,讓回復(fù)變得合理。
[0045]請參閱圖6,其中一個(gè)實(shí)施例中,將聊天輸出語句進(jìn)行人稱變換后輸出的步驟S322包括:
[0046]S3221:根據(jù)預(yù)設(shè)人稱變換規(guī)則,對聊天輸出語句中的第一人稱和第二人稱分別進(jìn)行變換,獲得人稱變換后的聊天輸出語句;
[0047]S3222:將人稱變換后的聊天輸出語句輸出。
[0048]其中,預(yù)設(shè)人稱變換規(guī)則包括第一人稱變換為第二人稱和第二人稱變換為第一人稱,具體地,是對第二語句中的人稱分別進(jìn)行單次變換,即第二語句中的第一人稱變換為第二人稱后不再進(jìn)行變換,第二語句中的第二人稱變換為第一人稱后不再進(jìn)行變換,例如,第二語句為“我找你有事情”,分別對其中的第一人稱和第二人稱分別進(jìn)行單次變換,即將我進(jìn)行單次變換為你,將你進(jìn)行單次變換為我,從而人稱變換后的第二語句為“你找我有事情”。輸入語句是用戶對機(jī)器人所講的話語,或向機(jī)器人輸入的文字或視頻,在本實(shí)施例中,輸入語句為用戶的語音,其中,人稱變換將第二語句中的第一人稱變換成第二人稱,第二人稱變?yōu)榈谝蝗朔Q,即第一人稱包括我,第二人稱包括你和您,變換過程即為將“我”變換為“你”、“你”變換為“我”、“您”變換為“我”,實(shí)現(xiàn)機(jī)器人對用戶的合理回復(fù)。
[0049]請參閱圖7,在其中一個(gè)實(shí)施例中,獲取輸入語句,將輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果的步驟SlOO包括:
[0050]SI 10:獲取輸入語句;
[0051]S120:將輸入語句輸入至大數(shù)據(jù)搜索引擎,提取輸入語句的關(guān)鍵詞,根據(jù)關(guān)鍵詞進(jìn)行搜索,獲得搜索結(jié)果,并對搜索結(jié)果中關(guān)鍵詞進(jìn)行標(biāo)記。
[0052]在機(jī)器人獲取輸入語句后,將該輸入語句輸入至搜索引擎,對該輸入語句進(jìn)行分詞,可獲得候選詞,可根據(jù)候選詞的重要程度,從候選詞中選取出關(guān)鍵詞,以提取輸入語句的關(guān)鍵詞,例如,輸入語句為“關(guān)鍵詞怎么提取”時(shí),提取的關(guān)鍵詞可為“關(guān)鍵詞”以及“提取”。根據(jù)該關(guān)鍵詞進(jìn)行搜索,即輸入語句的關(guān)鍵詞為搜索引擎對用戶的輸入語句進(jìn)行分詞后得到的多個(gè)詞,在搜索結(jié)果中包含有該輸入語句的關(guān)鍵詞。
[0053]在搜索結(jié)果中對關(guān)鍵詞進(jìn)行標(biāo)記,以突出關(guān)鍵詞在搜索結(jié)果中的位置,由于機(jī)器人后續(xù)進(jìn)行處理后回復(fù)給用戶的是搜索結(jié)果中的某一條語句,從而通過標(biāo)記關(guān)鍵詞,可便于用戶查看輸入語句。具體地,標(biāo)記包括顏色標(biāo)記、加粗標(biāo)記以及下劃線標(biāo)記等。
[0054]下面以一具體實(shí)施對上述機(jī)器人對話控制方法加以說明。請參閱圖8,為機(jī)器人與人進(jìn)行交流的示意圖。
[0055]首先,接收用戶的輸入語句,例如“我肚子痛”。
[0056]將用戶的輸入語句“我肚子痛”作為大數(shù)據(jù)搜索引擎http://www.gfsos0.net的輸入進(jìn)行搜索,獲得搜索結(jié)果,篩選出搜索結(jié)果中與“我肚子痛”匹配度最大的前50條語句作為50條第一語句,該50條語句中含有輸入語句的關(guān)鍵詞,并對50條語句中的關(guān)鍵詞進(jìn)行顏色標(biāo)記。
[0057]通過大數(shù)據(jù)搜索引擎從50條第一語句中篩選合理性最大的語句作為聊天輸出語句輸出,其中,根據(jù)第一語句進(jìn)行搜索獲得的搜索結(jié)果數(shù)量越大,第一語句的合理性參數(shù)越大,就越合理,具體步驟如下:
[0058]將50條第一語句分別作為大數(shù)據(jù)搜索引擎的50次輸入進(jìn)行50次搜索,得到50條搜索結(jié)果數(shù)量。
[0059]將50條搜索結(jié)果數(shù)量從大到小進(jìn)行排序,選出搜索結(jié)果數(shù)量最大的第一語句作為聊天輸出語句輸出。其中,排序后的序列中前9條搜索結(jié)果數(shù)量對應(yīng)的9條第一語句如下。
[0060]我肚子痛是不是懷孕了(搜索結(jié)果數(shù)為6280000)。
[0061]我肚子痛,每個(gè)月月經(jīng)過后就開始(搜索結(jié)果數(shù)為2880000)。
[0062 ]我肚子痛,也胃痛(搜索結(jié)果數(shù)為1960000)。
[0063]更年期肚子脹痛(搜索結(jié)果數(shù)為1940000)。
[0064]我肚子痛,拉肚子(搜索結(jié)果數(shù)為1380000)。
[0065]笑得我肚子痛(搜索結(jié)果數(shù)為1170000)
[0066]我肚子痛,想解大手(搜索結(jié)果數(shù)為486000)。
[0067]我肚子痛,要上廁所大便(搜索結(jié)果數(shù)為368000)。
[0068]我肚子痛的很厲害,痛的冒汗,是不是腸胃炎(搜索結(jié)果數(shù)為27100)。
[0069]將搜索結(jié)果數(shù)量作為合理性參數(shù),從而可知9條第一語句對應(yīng)的合理性參數(shù),其中,上述9條第一語句中“我肚子痛是不是懷孕了”的搜索結(jié)果數(shù)量最大,則該語句對應(yīng)的合理性參數(shù)最大,即選出該語句“我肚子痛是不是懷孕了”作為聊天輸出語句。
[0070]將聊天輸出語句進(jìn)行人稱變換后輸出給用戶。例如,將上述“我肚子痛是不是懷孕了”進(jìn)行人稱變換后輸出,即將其中的我變換成你,得到:你肚子痛是不是懷孕了,輸出給用戶,實(shí)現(xiàn)機(jī)器人與用戶之間的交互。
[0071]上述整個(gè)過程全部是機(jī)器人系統(tǒng)自動(dòng)完成的。大數(shù)據(jù)搜索引擎(譬如google、gfS0S0、baidu等)是在海量的用戶在過去長時(shí)間積累的大數(shù)據(jù)的基礎(chǔ)上形成的,某輸入語句對應(yīng)的搜索結(jié)果數(shù)越多,則表明該輸入語句越合理,某輸入語句對應(yīng)的搜索結(jié)果數(shù)越少,則表明該輸入語句越不合理??梢岳斫獾氖牵瑢個(gè)搜索結(jié)果數(shù)中最大搜索結(jié)果數(shù)對應(yīng)的第一語句作為聊天輸出語句,保證了機(jī)器人對用戶的聊天輸入語句所做回復(fù)的合理性,從而提高了聊天機(jī)器人的回復(fù)語句的有效性、真實(shí)性。
[0072]在搜索引擎中,由后臺大數(shù)據(jù)的數(shù)據(jù)量的變化,不同時(shí)間搜到得到的結(jié)果數(shù)會(huì)有所波動(dòng),這種波動(dòng)反映出人們對某一話語的認(rèn)同度的真實(shí)變化,不但不影響本發(fā)明的使用,反而更能使得本發(fā)明的方法能真實(shí)地反映人們對某一話語的認(rèn)同度。搜索引擎后臺的大數(shù)據(jù)日益增多,搜索結(jié)果就越來越能反映出人們對某一話語的認(rèn)同度,從而可以依據(jù)搜索引擎的結(jié)果來判斷某話語的合理性,進(jìn)而提高了聊天機(jī)器人的回復(fù)語句的有效性、真實(shí)性。
[0073]請參閱圖9,本發(fā)明還提供一種實(shí)施方式的機(jī)器人對話控制系統(tǒng),包括:
[0074]搜索模塊100:用于獲取輸入語句,將輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果。
[0075]在本實(shí)施例中,機(jī)器人是指泛義的機(jī)器人,包括一切模擬人類行為或思想以及模擬其他生物的機(jī)械,也包括一些電腦程序,例如,聊天機(jī)器人程序等。在用戶需要與機(jī)器人進(jìn)行交互時(shí),用戶可向機(jī)器人輸入語句,從而機(jī)器人可獲取用戶的輸入語句,其中,輸入語句可以是文字和語音,甚至可以是視頻。在本實(shí)施例中,輸入語句為語音,將輸入語句輸入至大數(shù)據(jù)搜索引擎中進(jìn)行搜索,可獲得搜索結(jié)果其中,其中,搜索結(jié)果中包括多條語句,搜索結(jié)果中語句的條數(shù)即是搜索結(jié)果的數(shù)量,搜索出的這些語句與輸入語句相關(guān)。其中,搜索是調(diào)用大數(shù)據(jù)搜索引擎自動(dòng)完成的,大數(shù)據(jù)搜索引擎包括但不限于baidu、g00gle和gfsoso等互聯(lián)網(wǎng)搜索引擎、局域網(wǎng)搜索引擎、基于數(shù)據(jù)倉庫或數(shù)據(jù)庫的搜索引擎以及機(jī)器人自帶的搜索引擎。
[0076]第一篩選模塊200:用于篩選搜索結(jié)果中與輸入語句匹配度最大的前m條語句分別作為m條第一語句。
[0077]其中,m為正整數(shù)。由于根據(jù)輸入語句進(jìn)行搜索時(shí),可能會(huì)獲得較多的搜索結(jié)果,有些搜索結(jié)果可能不太合理,對全部的數(shù)據(jù)進(jìn)行處理時(shí)會(huì)浪費(fèi)較多時(shí)間,從而需要對搜索結(jié)果進(jìn)行篩選,篩選出較為合理的,即篩選出搜索結(jié)果中與輸入語句匹配度最大的前m條語句分別作為m條第一語句,即與輸入語句匹配度最大的前m條語句是指將與輸入語句匹配度按從大到小的順序排序,排在最前的m條語句。例如,將輸入語句輸入到百度搜索引擎中進(jìn)行搜索,根據(jù)匹配度從大到小進(jìn)行排序后的搜索結(jié)果顯示在頁面上,排在越前的搜索結(jié)果,表示越合理。
[0078]第二篩選模塊300,用于分別計(jì)算每條第一語句的合理性參數(shù),并將合理性參數(shù)最大對應(yīng)的第一語句作為聊天輸出語句并輸出。
[0079]獲得的每條第一語句有其對應(yīng)的合理性參數(shù),在本實(shí)施例中,合理性參數(shù)與搜索結(jié)果數(shù)量對應(yīng),第一語句的合理性參數(shù)是由根據(jù)第一語句進(jìn)行搜索得到的搜索結(jié)果數(shù)量來決定,即第一語句的合理性參數(shù)與第一語句的搜索結(jié)果數(shù)量相關(guān)的,第一語句的搜索結(jié)果數(shù)量越大,第一語句越合理,合理性參數(shù)越大。
[0080]可以理解,合理性參數(shù)還可與搜索結(jié)果數(shù)量在總搜索結(jié)果數(shù)量的比重對應(yīng),合理性參數(shù)由搜索結(jié)果數(shù)量在總搜索結(jié)果數(shù)量的比重決定,即第一語句的合理性參數(shù)與第一語句的搜索結(jié)果數(shù)量在總搜索結(jié)果數(shù)量的比重相關(guān)的,第一語句的總搜索結(jié)果數(shù)量為每條第一語句的搜索結(jié)果數(shù)量的總數(shù),占的比重越大,合理性參數(shù)越大。
[0081]上述機(jī)器人對話控制系統(tǒng),通過根據(jù)輸入語句輸入大數(shù)據(jù)搜索引擎進(jìn)行搜索,獲得搜索結(jié)果,將搜索結(jié)果中與輸入語句匹配度最大的前m條語句作為第一語句,從m條第一語句中篩選合理性參數(shù)最大對應(yīng)的語句作為聊天輸出語句輸出,即可篩選出合理的第一語句作為輸出語句輸出,可提高機(jī)器人回復(fù)有效性和合理性。采用大數(shù)據(jù)搜索引擎對輸入語句進(jìn)行搜索,不再是根據(jù)人工建立的數(shù)據(jù)庫進(jìn)行搜索,由于大數(shù)據(jù)搜索引擎對應(yīng)的語句是根據(jù)大量用戶在歷史聊天過程中產(chǎn)生的語句,獲得的搜索結(jié)果更符合實(shí)際中用戶聊天的語句,且從m條第一語句中篩選合理性參數(shù)最大對應(yīng)的語句則更加符合聊天語句,提高機(jī)器人回復(fù)語句的有效性和真實(shí)性。
[0082]請參閱圖10,在其中一個(gè)實(shí)施例中,第二篩選模塊300寶包括:
[0083]搜索單元310,還用于分別將每條第一語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果數(shù)量作為第一語句的搜索結(jié)果數(shù)量。
[0084]篩選單元320:用于將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),并將最大合理性參數(shù)對應(yīng)的第一語句作為聊天輸出語句并輸出。
[0085]獲得m條第一語句后,分別根據(jù)每條第一語句進(jìn)行搜索,獲得搜索結(jié)果數(shù)量作為第一語句的搜索結(jié)果數(shù)量,搜索結(jié)果數(shù)量是根據(jù)第一語句搜索得到的,從而搜索結(jié)果數(shù)量是和第一語句對應(yīng)的,即獲得與第一語句對應(yīng)的搜索結(jié)果數(shù)量,有m條第一語句,搜索m次,獲得m個(gè)搜索結(jié)果數(shù)量,每條第一語句對應(yīng)一個(gè)搜索結(jié)果數(shù)量,即由于有m條第一語句,根據(jù)每條第一語句進(jìn)行搜索,從而可獲得m個(gè)搜索結(jié)果數(shù)量分別作為第一語句的搜索結(jié)果數(shù)量,單個(gè)搜索結(jié)果數(shù)量作為單條第一語句的搜索結(jié)果數(shù)量。例如,有2條第一語句分別為A和B,根據(jù)第一語句A進(jìn)行搜索,得到搜索結(jié)果數(shù)量為30,根據(jù)第一語句B進(jìn)行搜索,得到搜索結(jié)果數(shù)量為10,分別進(jìn)行了2次搜索,獲得2個(gè)搜索結(jié)果數(shù)量分別30和10,將該2個(gè)搜索結(jié)果數(shù)量分別作為第一語句的搜索結(jié)果數(shù)量,30是對應(yīng)第一語句A的,10對應(yīng)第一語句B的。
[0086]可以理解,在本實(shí)施例中,將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),即根據(jù)第一語句的搜索結(jié)果數(shù)可獲得第一語句的合理性參數(shù),從而,最大搜索結(jié)果數(shù)量對應(yīng)最大合理性參數(shù)。分別將m條第一語句輸入至大數(shù)據(jù)搜索引擎中進(jìn)行搜索,即搜索m次,獲得m個(gè)搜索結(jié)果數(shù)量。搜索是調(diào)用大數(shù)據(jù)搜索引擎自動(dòng)完成的,從第一語句對應(yīng)的搜索結(jié)果數(shù)量的大小可知人們對第一語句的認(rèn)同度,搜索結(jié)果數(shù)量越大表示人們對第一語句的認(rèn)同度越高,則該第一語句越合理。獲得m條第一語句后,需要從其中選出一條最合理的語句作為輸出語句輸出給用戶。從第一語句對應(yīng)的搜索結(jié)果數(shù)量越大,其越合理,從而將最大搜索結(jié)果數(shù)量對應(yīng)的第一語句作為聊天輸出語句并輸出,即是將合理性參數(shù)最大對應(yīng)的語句作為輸出語句輸出,確保聊天語句的合理性。
[0087]請參閱圖11,在其中一個(gè)實(shí)施例中,篩選單元320包括:
[0088]選擇單元321:用于將第一語句的搜索結(jié)果數(shù)量作為第一語句的合理性參數(shù),并將最大合理性參數(shù)對應(yīng)的第一語句作為聊天輸出語句。
[0089]人稱變換單元322:用于將聊天輸出語句進(jìn)行人稱變換后輸出。
[0090]其中,搜索結(jié)果數(shù)量代表的是人們對第一語句的認(rèn)同度,即第一語句的合理性,第一語句對應(yīng)的搜索結(jié)果數(shù)量越大則越合理。由于是用戶和機(jī)器人的聊天,為了使機(jī)器人回復(fù)語句更加的合理,將最大搜索結(jié)果數(shù)量對應(yīng)的第一語句作為聊天輸出語句輸出時(shí),即將最大合理性參數(shù)對應(yīng)的第一語句作為聊天語句輸出時(shí),需要將聊天輸出語句進(jìn)行人稱變換后再輸出,即使對話合理化。例如,輸入語句的主語是我時(shí),表示是用戶自己,那么機(jī)器人在回復(fù)時(shí),是對用戶的回復(fù),將聊天輸出語句中的我變換成你,讓回復(fù)變得合理。
[0091 ]請參閱圖12,在其中一個(gè)實(shí)施例中,人稱變換單元322包括:
[0092]變換單元3221,用于根據(jù)預(yù)設(shè)人稱變換規(guī)則,對聊天輸出語句中的第一人稱和第二人稱分別進(jìn)行變換,獲得人稱變換后的聊天輸出語句。
[0093]輸出單元3222,用于將人稱變換后的聊天輸出語句輸出。
[0094]其中,預(yù)設(shè)人稱變換規(guī)則包括第一人稱變換為第二人稱和第二人稱變換為第一人稱,具體地,是對第二語句中的人稱分別進(jìn)行單次變換,即第二語句中的第一人稱變換為第二人稱后不再進(jìn)行變換,第二語句中的第二人稱變換為第一人稱后不再進(jìn)行變換,例如,第二語句為“我找你有事情”,分別對其中的第一人稱和第二人稱分別進(jìn)行單次變換,即將我進(jìn)行單次變換為你,將你進(jìn)行單次變換為我,從而人稱變換后的第二語句為“你找我有事情”。輸入語句是用戶對機(jī)器人所講的話語,或向機(jī)器人輸入的文字或視頻,在本實(shí)施例中,輸入語句為用戶的語音,其中,人稱變換將第二語句中的第一人稱變換成第二人稱,第二人稱變?yōu)榈谝蝗朔Q,即第一人稱包括我,第二人稱包括你和您,變換過程即為將“我”變換為“你”、“你”變換為“我”、“您”變換為“我”,實(shí)現(xiàn)機(jī)器人對用戶的合理回復(fù)。
[0095]請參閱圖13,在其中一個(gè)實(shí)施例中,搜索模塊100包括:
[0096]獲取單元110,用于獲取輸入語句;
[0097]語句搜索單元120,用于將輸入語句輸入至大數(shù)據(jù)搜索引擎,提取輸入語句的關(guān)鍵詞,根據(jù)關(guān)鍵詞進(jìn)行搜索,獲得搜索結(jié)果。
[0098]在機(jī)器人獲取輸入語句后,將該輸入語句輸入至搜索引擎,對該輸入語句進(jìn)行分詞,可獲得候選詞,可根據(jù)候選詞的重要程度,從候選詞中選取出關(guān)鍵詞,以提取輸入語句的關(guān)鍵詞,例如,輸入語句為“關(guān)鍵詞怎么提取”時(shí),提取的關(guān)鍵詞可為“關(guān)鍵詞”以及“提取”。根據(jù)該關(guān)鍵詞進(jìn)行搜索,即輸入語句的關(guān)鍵詞為搜索引擎對用戶的輸入語句進(jìn)行分詞后得到的多個(gè)詞,在搜索結(jié)果中包含有該輸入語句的關(guān)鍵詞。
[0099 ]標(biāo)記單元130,用于對搜索結(jié)果中關(guān)鍵詞進(jìn)行標(biāo)記。
[0100]在搜索結(jié)果中對關(guān)鍵詞進(jìn)行標(biāo)記,以突出關(guān)鍵詞在搜索結(jié)果中的位置,由于機(jī)器人后續(xù)進(jìn)行處理后回復(fù)給用戶的是搜索結(jié)果中的某一條語句,從而通過標(biāo)記關(guān)鍵詞,可便于用戶查看輸入語句。具體地,標(biāo)記包括顏色標(biāo)記、加粗標(biāo)記以及下劃線標(biāo)記等。
[0101]以上實(shí)施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡潔,未對上述實(shí)施例中的各個(gè)技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說明書記載的范圍。
[0102]以上實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種機(jī)器人對話控制方法,其特征在于,包括以下步驟: 獲取輸入語句,將所述輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果;篩選所述搜索結(jié)果中與所述輸入語句匹配度最大的前m條語句分別作為m條第一語句,其中,所述m為正整數(shù); 分別計(jì)算每條所述第一語句的合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出。2.根據(jù)權(quán)利要求1所述的機(jī)器人對話控制方法,其特征在于,所述分別計(jì)算每條所述第一語句的合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出的步驟包括: 分別將每條所述第一語句作為所述大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果數(shù)量作為所述第一語句的搜索結(jié)果數(shù)量; 將所述第一語句的搜索結(jié)果數(shù)量作為所述第一語句的所述合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出。3.根據(jù)權(quán)利要求2所述的機(jī)器人對話控制方法,其特征在于,所述將所述第一語句的搜索結(jié)果數(shù)量作為所述第一語句的所述合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出的步驟包括: 將所述第一語句的搜索結(jié)果數(shù)量作為所述第一語句的所述合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句; 將所述聊天輸出語句進(jìn)行人稱變換后輸出。4.根據(jù)權(quán)利要求3所述的機(jī)器人對話控制方法,其特征在于,所述將所述聊天輸出語句進(jìn)行人稱變換后輸出的步驟包括: 根據(jù)預(yù)設(shè)人稱變換規(guī)則,對所述聊天輸出語句中的第一人稱和第二人稱分別進(jìn)行變換,獲得人稱變換后的聊天輸出語句; 將所述人稱變換后的聊天輸出語句輸出。5.根據(jù)權(quán)利要求1所述的機(jī)器人對話控制方法,其特征在于,所述獲取輸入語句,將所述輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果的步驟包括: 獲取輸入語句; 將所述輸入語句輸入至所述大數(shù)據(jù)搜索引擎,提取所述輸入語句的關(guān)鍵詞,根據(jù)所述關(guān)鍵詞進(jìn)行搜索,獲得搜索結(jié)果,并對所述搜索結(jié)果中所述關(guān)鍵詞進(jìn)行標(biāo)記。6.一種機(jī)器人對話控制系統(tǒng),其特征在于,包括: 搜索模塊,用于獲取輸入語句,將所述輸入語句作為大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果; 第一篩選模塊,用于篩選所述搜索結(jié)果中與所述輸入語句匹配度最大的前m條語句分別作為m條第一語句,其中,所述m為正整數(shù); 第二篩選模塊,用于分別計(jì)算每條所述第一語句的合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出。7.根據(jù)權(quán)利要求6所述的機(jī)器人對話控制系統(tǒng),其特征在于,所述第二篩選模塊包括: 搜索單元,用于分別將每條所述第一語句作為所述大數(shù)據(jù)搜索引擎的輸入進(jìn)行搜索,獲得搜索結(jié)果數(shù)量作為與所述第一語句的搜索結(jié)果數(shù)量; 篩選單元,用于將所述第一語句的搜索結(jié)果數(shù)量作為所述第一語句的所述合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句并輸出。8.根據(jù)權(quán)利要求7所述的機(jī)器人對話控制系統(tǒng),其特征在于,所述篩選單元包括: 選擇單元,用于將所述第一語句的搜索結(jié)果數(shù)量作為所述第一語句的所述合理性參數(shù),并將最大所述合理性參數(shù)對應(yīng)的所述第一語句作為聊天輸出語句; 人稱變換單元,用于將所述聊天輸出語句進(jìn)行人稱變換后輸出。9.根據(jù)權(quán)利要求8所述的機(jī)器人對話控制系統(tǒng),其特征在于,所述人稱變換單元包括: 變換單元,用于根據(jù)預(yù)設(shè)人稱變換規(guī)則,對所述聊天輸出語句中的第一人稱和第二人稱分別進(jìn)行變換,獲得人稱變換后的聊天輸出語句; 輸出單元,用于將所述人稱變換后的聊天輸出語句輸出。10.根據(jù)權(quán)利要求6所述的機(jī)器人對話控制系統(tǒng),其特征在于,所述搜索模塊包括: 獲取單元,用于獲取輸入語句; 搜索單元,用于將所述輸入語句輸入至所述大數(shù)據(jù)搜索引擎,提取所述輸入語句的關(guān)鍵詞,根據(jù)所述關(guān)鍵詞進(jìn)行搜索,獲得搜索結(jié)果; 標(biāo)記單元,用于對所述搜索結(jié)果中所述關(guān)鍵詞進(jìn)行標(biāo)記。
【文檔編號】G06F17/30GK105912712SQ201610281588
【公開日】2016年8月31日
【申請日】2016年4月29日
【發(fā)明人】朱定局
【申請人】華南師范大學(xué)