本發(fā)明涉及機(jī)器人技術(shù)領(lǐng)域,特別涉及一種基于人臉識(shí)別和語(yǔ)音控制的智能機(jī)器人。
背景技術(shù):
隨著機(jī)器人行業(yè)的迅速發(fā)展和人工智能的興起,越來(lái)越多的研究人員開(kāi)始投入機(jī)器人的研究,服務(wù)機(jī)器人方興未艾,其中迎賓機(jī)器人是服務(wù)機(jī)器人的主力軍。大型展覽館、會(huì)展中心、高級(jí)賓館、銀行、醫(yī)院、大型酒店和餐飲機(jī)構(gòu)都出現(xiàn)了各式各樣的迎賓機(jī)器人,但目前的迎賓機(jī)器人大多功能單一,技術(shù)低端,發(fā)展很不完善。不是缺少人臉識(shí)別功能,或者語(yǔ)音識(shí)別極易受外界嘈雜環(huán)境的影響,就是不具備語(yǔ)音控制機(jī)器人復(fù)雜動(dòng)作和及其運(yùn)動(dòng)規(guī)劃的功能,而且目前很多的迎賓機(jī)器人不具備與客戶(hù)進(jìn)行互動(dòng)溝通的功能。
因此有必要對(duì)現(xiàn)有的迎賓機(jī)器人進(jìn)行改進(jìn),以使其具有更多功能,智能化程度更高。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,針對(duì)現(xiàn)有迎賓機(jī)器人存在的不足,本發(fā)明的目的是提供一種智能迎賓機(jī)器人,其集語(yǔ)音識(shí)別和人臉識(shí)別于一體,具有語(yǔ)音控制機(jī)器人復(fù)雜動(dòng)作和運(yùn)動(dòng)規(guī)劃等功能,以解決現(xiàn)有迎賓機(jī)器人功能簡(jiǎn)單,智能化程度低等問(wèn)題。
本發(fā)明基于人臉識(shí)別和語(yǔ)音控制的智能迎賓機(jī)器人,包括:語(yǔ)音模塊,視覺(jué)模塊,語(yǔ)音控制模塊,傳感和避障模塊、以及運(yùn)動(dòng)控制模塊;
所述語(yǔ)音語(yǔ)音模塊包括語(yǔ)音輸入模塊、語(yǔ)音識(shí)別模塊、對(duì)話(huà)管理模塊、語(yǔ)音合成模塊和語(yǔ)音輸出模塊;
所述語(yǔ)音輸入模塊用于采集語(yǔ)音信息,并將信息傳輸給語(yǔ)音識(shí)別模塊;
所述語(yǔ)音識(shí)別模塊用于將接收的語(yǔ)音信息轉(zhuǎn)換為音波信息,并根據(jù)語(yǔ)音識(shí)別規(guī)則對(duì)音波信息進(jìn)行配對(duì)處理;語(yǔ)音識(shí)別模塊還用于將經(jīng)配對(duì)處理后的信息通過(guò)命令輸入模塊輸入語(yǔ)音控制模塊,或者將經(jīng)配對(duì)處理后的信息輸入對(duì)話(huà)管理模塊;
所述對(duì)話(huà)管理模塊對(duì)語(yǔ)音識(shí)別模塊輸入的信息進(jìn)行處理,并向語(yǔ)音合成模塊輸入對(duì)話(huà)信息;
所述語(yǔ)音合成模塊用于對(duì)對(duì)話(huà)管理模塊輸入的信息進(jìn)行處理,合成應(yīng)答的語(yǔ)音,并將應(yīng)答語(yǔ)音輸入語(yǔ)音輸出模塊;
所述語(yǔ)音輸出模塊用于輸出應(yīng)答語(yǔ)音;
所述視覺(jué)模塊包括人臉識(shí)別模塊和視覺(jué)跟蹤模塊,所述人臉識(shí)別模塊用于識(shí)別人臉信息,并將識(shí)別信息輸入語(yǔ)音控制模塊,所述視覺(jué)跟蹤模塊用于對(duì)目標(biāo)物進(jìn)行實(shí)時(shí)跟蹤;
所述語(yǔ)音控制模塊用于在接收到語(yǔ)音模塊和視覺(jué)模塊輸入的命令信息后,生成機(jī)器人動(dòng)作的目標(biāo)信息,并將目標(biāo)信息輸入運(yùn)動(dòng)控制模塊;
所述傳感和避障模塊包括障礙檢測(cè)模塊和定位信息模塊;
所述障礙檢測(cè)模塊用于檢測(cè)機(jī)器人運(yùn)動(dòng)前方的障礙信息,并將障礙信息輸入運(yùn)動(dòng)控制模塊;所述障礙檢測(cè)模塊包括視覺(jué)檢測(cè)模塊、超聲波檢測(cè)模塊和紅外線(xiàn)檢測(cè)模塊;
所述定定位信息模塊用于檢測(cè)機(jī)器人的坐標(biāo)信息,并將坐標(biāo)信息輸入運(yùn)動(dòng)控制模塊;所述定位信息模塊包括全局定位信息模塊和局部定位信息模塊,所述全局定位信息模塊為激光傳感器,所述局部定位信息模塊為陀螺儀和光電碼盤(pán);
所述運(yùn)動(dòng)控制模塊用于在獲取坐標(biāo)信息、障礙信息和目標(biāo)信息后控制機(jī)器人的運(yùn)動(dòng)。
本發(fā)明的有益效果:
本發(fā)明基于人臉識(shí)別和語(yǔ)音控制的智能迎賓機(jī)器人,其集語(yǔ)音識(shí)別和人臉識(shí)別于一體,能通過(guò)語(yǔ)音模塊實(shí)現(xiàn)人機(jī)語(yǔ)音對(duì)話(huà),能通過(guò)視覺(jué)模塊識(shí)別顧客,并且能通過(guò)語(yǔ)音控制機(jī)器人的動(dòng)作和運(yùn)動(dòng)規(guī)劃,跟蹤目標(biāo)物,智能化程度高。
附圖說(shuō)明
圖1為迎賓機(jī)器人系統(tǒng)結(jié)構(gòu)模塊示意圖;
圖2為語(yǔ)音模塊系統(tǒng)框圖。
附圖標(biāo)記說(shuō)明:001-語(yǔ)音模塊,011-語(yǔ)音輸入模塊,012-語(yǔ)音識(shí)別模塊,013-對(duì)話(huà)管理模塊,014-語(yǔ)音合成模塊,015-語(yǔ)音輸出模塊,002-視覺(jué)模塊,021-人臉識(shí)別模塊,022-視覺(jué)跟蹤模塊,003-語(yǔ)音控制模塊,004-傳感和避障模塊,041-障礙檢測(cè)模塊,411-視覺(jué)測(cè)距,412-超聲波組檢測(cè),413-紅外傳感組檢測(cè),042-定位信息模塊,421-全局定位信息模塊,422-局部定位信息模塊,005-運(yùn)動(dòng)控制模塊。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述。
本實(shí)施例基于人臉識(shí)別和語(yǔ)音控制的智能迎賓機(jī)器人,包括:語(yǔ)音模塊001,視覺(jué)模塊002,語(yǔ)音控制模塊003,傳感和避障模塊004、以及運(yùn)動(dòng)控制模塊005。
所述語(yǔ)音模塊包括語(yǔ)音輸入模塊011、語(yǔ)音識(shí)別模塊012、對(duì)話(huà)管理模塊013、語(yǔ)音合成模塊014和語(yǔ)音輸出模塊015。
所述語(yǔ)音輸入模塊用于采集語(yǔ)音信息,并將信息傳輸給語(yǔ)音識(shí)別模塊。
所述語(yǔ)音識(shí)別模塊011用于將接收的語(yǔ)音信息轉(zhuǎn)換為音波信息,并根據(jù)語(yǔ)音識(shí)別規(guī)則對(duì)音波信息進(jìn)行配對(duì)處理;語(yǔ)音識(shí)別模塊還用于將經(jīng)配對(duì)處理后的信息通過(guò)命令輸入模塊輸入語(yǔ)音控制模塊003,或者將經(jīng)配對(duì)處理后的信息輸入對(duì)話(huà)管理模塊。
所述對(duì)話(huà)管理模塊對(duì)語(yǔ)音識(shí)別模塊輸入的信息進(jìn)行處理,并向語(yǔ)音合成模塊012輸入對(duì)話(huà)信息。
所述語(yǔ)音合成模塊012用于對(duì)對(duì)話(huà)管理模塊輸入的信息進(jìn)行處理,合成應(yīng)答的語(yǔ)音,并將應(yīng)答語(yǔ)音輸入語(yǔ)音輸出模塊。
所述語(yǔ)音輸出模塊用于輸出應(yīng)答語(yǔ)音。
所述視覺(jué)模塊包括人臉識(shí)別模塊021和視覺(jué)跟蹤模塊022,所述人臉識(shí)別模塊用于識(shí)別人臉信息,并將識(shí)別信息輸入語(yǔ)音控制模塊003,所述視覺(jué)跟蹤模塊用于對(duì)目標(biāo)物進(jìn)行實(shí)時(shí)跟蹤。本實(shí)施例中,視覺(jué)跟蹤模塊022采用現(xiàn)有技術(shù)中的camshift算法實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤。
所述語(yǔ)音控制模塊003用于在接收到語(yǔ)音模塊001和視覺(jué)模塊002輸入的命令信息后,生成機(jī)器人動(dòng)作的目標(biāo)信息,并將目標(biāo)信息輸入運(yùn)動(dòng)控制模塊005。
所述傳感和避障模塊004包括障礙檢測(cè)模塊041和定位信息模塊042。
所述障礙檢測(cè)模塊041用于檢測(cè)機(jī)器人運(yùn)動(dòng)前方的障礙信息,并將障礙信息輸入運(yùn)動(dòng)控制模塊005;所述障礙檢測(cè)模塊包括視覺(jué)檢測(cè)模塊411、超聲波檢測(cè)模塊412和紅外線(xiàn)檢測(cè)模塊413;
所述定位信息模塊042用于檢測(cè)機(jī)器人的坐標(biāo)信息,并將坐標(biāo)信息輸入運(yùn)動(dòng)控制模塊005;所述定位信息模塊包括全局定位信息模塊421和局部定位信息模塊422,所述全局定位信息模塊為激光傳感器,所述局部定位信息模塊為陀螺儀和光電碼盤(pán)。
所述運(yùn)動(dòng)控制模塊005用于在獲取坐標(biāo)信息、障礙信息和目標(biāo)信息后控制機(jī)器人的運(yùn)動(dòng)。具體的,本實(shí)施例中運(yùn)動(dòng)控制模塊005采用現(xiàn)有技術(shù)中的局部路徑規(guī)劃算法和虛擬尋跡算法控制機(jī)器人的運(yùn)動(dòng),實(shí)現(xiàn)機(jī)器人的路徑規(guī)劃,自主定位導(dǎo)航與跟蹤控制、以及動(dòng)態(tài)避障。
最后說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的宗旨和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。