日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

用于通過(guò)聲音識(shí)別用戶身份的方法及設(shè)備與流程

文檔序號(hào):11199812閱讀:3722來(lái)源:國(guó)知局
用于通過(guò)聲音識(shí)別用戶身份的方法及設(shè)備與流程

本發(fā)明的實(shí)施方式涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地,本發(fā)明的實(shí)施方式涉及用于通過(guò)聲音識(shí)別用戶身份的方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。



背景技術(shù):

本部分旨在為權(quán)利要求書中陳述的本發(fā)明的實(shí)施方式提供背景或者上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。

支持多用戶的智能終端設(shè)備通常是指能夠被多個(gè)用戶使用的智能終端設(shè)備(例如,物聯(lián)網(wǎng)設(shè)備)。支持多用戶的智能終端設(shè)備可以具體為智能音箱、智能語(yǔ)音助手以及智能空調(diào)等。

為了使支持多用戶的智能終端設(shè)備能夠?yàn)槠渌С值牟煌脩籼峁﹤€(gè)性化服務(wù)(也可以稱為差分化服務(wù)或者差異化服務(wù)等),通常需要通過(guò)聲音來(lái)識(shí)別用戶身份;例如,在智能語(yǔ)音助手支持多用戶的情況下,如果智能語(yǔ)音助手所支持的一個(gè)用戶詢問(wèn)智能語(yǔ)音助手用戶本人當(dāng)天的日程安排,則智能語(yǔ)音助手應(yīng)該根據(jù)對(duì)話方的用戶身份獲取該用戶身份所對(duì)應(yīng)的當(dāng)天的日程安排,并答復(fù)該用戶,而不是針對(duì)不同用戶均給出相同的答復(fù)或者將其他用戶的當(dāng)天的日程安排作為對(duì)話方的當(dāng)天的日程安排答復(fù)用戶。

目前,對(duì)于支持多用戶功能的智能終端設(shè)備而言,通過(guò)聲音識(shí)別用戶身份的實(shí)現(xiàn)方式通常為:基于聲紋識(shí)別技術(shù)來(lái)識(shí)別用戶身份。



技術(shù)實(shí)現(xiàn)要素:

但是,由于聲紋識(shí)別技術(shù)實(shí)現(xiàn)難度較高,因此,其所需要耗費(fèi)的資源(例如,計(jì)算資源等)通常較大;如果智能終端設(shè)備本地使用聲紋識(shí)別技術(shù)來(lái)識(shí)別用戶身份,則不僅需要額外的考慮智能終端設(shè)備的硬件配置,還需要考慮智能終端設(shè)備在使用過(guò)程中的能源消耗,具體而言,由于聲紋識(shí)別技術(shù)需要耗費(fèi)較多的計(jì)算資源,因此,智能終端設(shè)備中的負(fù)責(zé)喚醒功能的芯片無(wú)法通過(guò)結(jié)構(gòu)相對(duì)較為簡(jiǎn)單的小芯片來(lái)實(shí)現(xiàn),然而,結(jié)構(gòu)相對(duì)較為復(fù)雜的大芯片不但會(huì)影響智能終端設(shè)備的成本,還會(huì)增加智能終端設(shè)備在使用過(guò)程中的耗電量;而如果智能終端設(shè)備將聲音信號(hào)上傳至服務(wù)器,由相應(yīng)的服務(wù)器利用聲紋識(shí)別技術(shù)來(lái)實(shí)現(xiàn)用戶身份識(shí)別,聲紋識(shí)別技術(shù)的實(shí)現(xiàn)難度以及與智能終端設(shè)備與服務(wù)器的信息交互也會(huì)使智能終端設(shè)備的響應(yīng)速度受到影響。

因此在現(xiàn)有技術(shù)中,由智能終端設(shè)備本地通過(guò)聲音識(shí)別用戶身份,會(huì)不利于降低智能終端設(shè)備的生產(chǎn)成本以及使用成本,而由網(wǎng)絡(luò)側(cè)的服務(wù)器通過(guò)聲音識(shí)別用戶身份,一方面不利于提高用戶身份識(shí)別的準(zhǔn)確性,另一方面不利于提高智能終端設(shè)備的響應(yīng)速度,這是非常令人煩惱的技術(shù)問(wèn)題。

為此,非常需要一種改進(jìn)的用于通過(guò)聲音識(shí)別用戶身份的技術(shù)方案,在該技術(shù)方案由智能終端設(shè)備本地實(shí)現(xiàn)時(shí),完全可以實(shí)現(xiàn)在基本上不影響智能終端設(shè)備的生產(chǎn)成本以及使用成本的情況下,使用戶身份識(shí)別具有較佳的準(zhǔn)確性,并使智能終端設(shè)備具有較好的響應(yīng)速度。

在本上下文中,本發(fā)明的實(shí)施方式期望提供一種用于通過(guò)聲音識(shí)別用戶身份的方法、設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

在本發(fā)明實(shí)施方式的第一方面中,提供了一種用于通過(guò)聲音識(shí)別用戶身份的方法,包括:根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè),其中,一個(gè)喚醒詞對(duì)應(yīng)至少一個(gè)用戶身份信息;在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份。

在本發(fā)明的一個(gè)實(shí)施例中,所述一個(gè)喚醒詞對(duì)應(yīng)一個(gè)用戶身份信息,且不同喚醒詞對(duì)應(yīng)不同的用戶身份信息。

在本發(fā)明的又一個(gè)實(shí)施例中,所述方法還包括:接收外部設(shè)備傳輸來(lái)的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述接收到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息;和/或,通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息;其中,所述對(duì)應(yīng)關(guān)系信息用于確定喚醒詞對(duì)應(yīng)的用戶身份信息。

在本發(fā)明的再一個(gè)實(shí)施例中,所述通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的步驟包括:通過(guò)與第一用戶的語(yǔ)音交互獲取第一喚醒詞與所述第一用戶的用戶身份信息的對(duì)應(yīng)關(guān)系信息。

在本發(fā)明的再一個(gè)實(shí)施例中,所述第一喚醒詞是所述第一用戶針對(duì)所述智能終端設(shè)備的特定稱呼。

在本發(fā)明的再一個(gè)實(shí)施例中,所述外部設(shè)備包括:計(jì)算機(jī)、智能移動(dòng)電話、平板電腦以及智能手表中的至少一個(gè),且所述外部設(shè)備與所述智能終端設(shè)備通過(guò)無(wú)線網(wǎng)絡(luò)或者藍(lán)牙無(wú)線連接。

在本發(fā)明的再一個(gè)實(shí)施例中,所述通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的步驟包括:在智能終端設(shè)備初次啟動(dòng)運(yùn)行過(guò)程中,向用戶發(fā)出用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音邀請(qǐng),在用戶接受所述語(yǔ)音邀請(qǐng)的情況下,通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞以及用戶身份信息,并設(shè)置獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息;和/或,在智能終端設(shè)備運(yùn)行過(guò)程中,在接收到用戶發(fā)出的用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音命令的情況下,通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞以及用戶身份信息,并設(shè)置獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息。

在本發(fā)明的再一個(gè)實(shí)施例中,所述用戶身份信息包括:用于表征用戶角色的信息和/或用戶在應(yīng)用中的注冊(cè)賬號(hào)。

在本發(fā)明的再一個(gè)實(shí)施例中,所述根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)的步驟包括:將智能終端設(shè)備拾取的聲音信號(hào)轉(zhuǎn)換為文本信息;檢測(cè)所述文本信息中是否包含有預(yù)先設(shè)置的所有喚醒詞中的任一喚醒詞。

在本發(fā)明的再一個(gè)實(shí)施例中,所述根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)的步驟包括:檢測(cè)智能終端設(shè)備拾取的聲音信號(hào)與針對(duì)預(yù)先設(shè)置的各喚醒詞而設(shè)置的各聲學(xué)模型的匹配度;判斷各聲學(xué)模型與所述聲音信號(hào)的匹配度是否符合預(yù)設(shè)匹配要求。

在本發(fā)明的再一個(gè)實(shí)施例中,所述在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份的步驟包括:在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息,并根據(jù)所述確定出的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份;或者,在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)預(yù)先設(shè)置的喚醒詞、驗(yàn)證碼與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定所述檢測(cè)出的喚醒詞對(duì)應(yīng)的驗(yàn)證碼以及用戶身份信息,向用戶發(fā)出用于獲取驗(yàn)證碼的語(yǔ)音請(qǐng)求,在檢測(cè)出用戶的語(yǔ)音回復(fù)中包含有所述確定出的驗(yàn)證碼的情況下,則根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份。

在本發(fā)明的再一個(gè)實(shí)施例中,所述智能終端設(shè)備包括:智能音箱。

在本發(fā)明實(shí)施方式的第二方面中,提供一種設(shè)備,包括:?jiǎn)拘言~檢測(cè)模塊,用于根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè),其中,一個(gè)喚醒詞對(duì)應(yīng)至少一個(gè)用戶身份信息;以及用戶身份識(shí)別模塊,用于在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份。

在本發(fā)明實(shí)施方式的第三方面中,提供一種設(shè)備,包括:存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;處理器,用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序,且所述計(jì)算機(jī)程序被執(zhí)行時(shí),下述指令被運(yùn)行:用于根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)的指令,其中,一個(gè)喚醒詞對(duì)應(yīng)至少一個(gè)用戶身份信息;在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份的指令。

在本發(fā)明的一個(gè)實(shí)施例中,所述一個(gè)喚醒詞對(duì)應(yīng)一個(gè)用戶身份信息,且不同喚醒詞對(duì)應(yīng)不同的用戶身份信息。

在本發(fā)明的又一個(gè)實(shí)施例中,所述設(shè)備還包括:用于接收外部設(shè)備傳輸來(lái)的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述接收到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令;和/或,用于通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令;其中,所述對(duì)應(yīng)關(guān)系信息用于確定喚醒詞對(duì)應(yīng)的用戶身份信息。

在本發(fā)明的再一個(gè)實(shí)施例中,所述用于通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令具體為:用于通過(guò)與第一用戶的語(yǔ)音交互獲取第一喚醒詞與所述第一用戶的用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令。

在本發(fā)明的再一個(gè)實(shí)施例中,所述第一喚醒詞是所述第一用戶針對(duì)所述智能終端設(shè)備的特定稱呼。

在本發(fā)明的再一個(gè)實(shí)施例中,所述外部設(shè)備包括:計(jì)算機(jī)、智能移動(dòng)電話、平板電腦以及智能手表中的至少一個(gè),且所述外部設(shè)備與所述智能終端設(shè)備通過(guò)無(wú)線網(wǎng)絡(luò)或者藍(lán)牙無(wú)線連接。

在本發(fā)明的再一個(gè)實(shí)施例中,所述用于通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令包括:用于在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息,并根據(jù)所述確定出的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份的指令;和/或,用于在智能終端設(shè)備運(yùn)行過(guò)程中,在接收到用戶發(fā)出的用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音命令的情況下,通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞以及用戶身份信息,并設(shè)置獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)所述獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令。

在本發(fā)明的再一個(gè)實(shí)施例中,所述用戶身份信息包括:用于表征用戶角色的信息和/或用戶在應(yīng)用中的注冊(cè)賬號(hào)。

在本發(fā)明的再一個(gè)實(shí)施例中,所述用于根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)的指令包括:用于將智能終端設(shè)備拾取的聲音信號(hào)轉(zhuǎn)換為文本信息的指令;用于檢測(cè)所述文本信息中是否包含有預(yù)先設(shè)置的所有喚醒詞中的任一喚醒詞的指令。

在本發(fā)明的再一個(gè)實(shí)施例中,所述用于根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)的指令包括:用于檢測(cè)智能終端設(shè)備拾取的聲音信號(hào)與針對(duì)預(yù)先設(shè)置的各喚醒詞而設(shè)置的各聲學(xué)模型的匹配度的指令;用于判斷各聲學(xué)模型與所述聲音信號(hào)的匹配度是否符合預(yù)設(shè)匹配要求的指令。

在本發(fā)明的再一個(gè)實(shí)施例中,所述在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份的指令包括:在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于利用所述檢測(cè)出的喚醒詞在預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息中查找匹配記錄,并根據(jù)匹配記錄中的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份;或者,在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于根據(jù)預(yù)先設(shè)置的喚醒詞、驗(yàn)證碼與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定所述檢測(cè)出的喚醒詞對(duì)應(yīng)的驗(yàn)證碼以及用戶身份信息,向用戶發(fā)出用于獲取驗(yàn)證碼的語(yǔ)音請(qǐng)求,在檢測(cè)出用戶的語(yǔ)音回復(fù)中包含有所述確定出的驗(yàn)證碼的情況下,則根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份的指令。

在本發(fā)明的再一個(gè)實(shí)施例中,所述智能終端設(shè)備包括:智能音箱。

在本發(fā)明實(shí)施方式的第四方面中,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)步驟:根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè),其中,一個(gè)喚醒詞對(duì)應(yīng)至少一個(gè)用戶身份信息;在檢測(cè)出所述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)所述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份。

根據(jù)本發(fā)明實(shí)施方式的用于通過(guò)聲音識(shí)別用戶身份的方法、設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),本發(fā)明實(shí)施方式通過(guò)預(yù)先為一個(gè)喚醒詞設(shè)置一個(gè)或者多個(gè)用戶身份信息,這樣,在檢測(cè)出智能終端設(shè)備當(dāng)前拾取的聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,可以快速準(zhǔn)確的根據(jù)檢測(cè)出的喚醒詞所對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出該聲音信號(hào)的用戶身份;由于檢測(cè)聲音信號(hào)是否包含有喚醒詞的實(shí)現(xiàn)方案所需要耗費(fèi)的資源通常較小,且完全可以由智能終端設(shè)備中的結(jié)構(gòu)相對(duì)較為簡(jiǎn)單的負(fù)責(zé)喚醒功能的芯片來(lái)實(shí)現(xiàn),當(dāng)然,也可以將喚醒和識(shí)別都放在同一個(gè)主芯片中進(jìn)行,但喚醒詞的檢測(cè)和識(shí)別功能僅占用主芯片的很小比例的運(yùn)算資源(比如不超過(guò)10%),在檢測(cè)和識(shí)別出喚醒詞時(shí),再喚醒主芯片的語(yǔ)音識(shí)別功能、開始全力工作;因此,本發(fā)明實(shí)施方式在由智能終端設(shè)備本地實(shí)現(xiàn)的情況下,基本上不需要額外考慮智能終端設(shè)備的硬件配置以及智能終端設(shè)備在使用過(guò)程中的能源消耗,且智能終端設(shè)備會(huì)具有較好的響應(yīng)速度;即便是本發(fā)明實(shí)施方式的部分步驟由服務(wù)器執(zhí)行,由于服務(wù)器是利用一個(gè)喚醒詞所對(duì)應(yīng)的相應(yīng)用戶身份信息來(lái)確定用戶身份,因此,完全可以不需要用戶聲音的細(xì)節(jié)特征,甚至可以不需要智能終端設(shè)備向其傳輸聲音信號(hào),從而可以避免聲音的細(xì)節(jié)特征被濾除而對(duì)用戶身份識(shí)別的準(zhǔn)確性所產(chǎn)生的影響,也可以避免聲紋識(shí)別技術(shù)以及聲音信號(hào)的傳輸而給智能終端設(shè)備的響應(yīng)速度帶來(lái)的影響。由此可知,本發(fā)明實(shí)施方式提供的技術(shù)方案有效降低了用戶身份識(shí)別的難度,并能夠在一定程度上提高用戶身份識(shí)別的準(zhǔn)確性以及智能終端設(shè)備的響應(yīng)速度,從而本發(fā)明實(shí)施方式具有實(shí)現(xiàn)成本低以及便于推廣應(yīng)用等特點(diǎn)。

附圖說(shuō)明

通過(guò)參考附圖閱讀下文的詳細(xì)描述,本發(fā)明示例性實(shí)施方式的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式,其中:

圖1示意性地示出了根據(jù)本發(fā)明實(shí)施方式的可以在其中實(shí)現(xiàn)的應(yīng)用場(chǎng)景示意圖;

圖2示意性地示出了根據(jù)本發(fā)明一實(shí)施例的用于通過(guò)聲音識(shí)別用戶身份的方法流程圖;

圖3示意性地示出了根據(jù)本發(fā)明一實(shí)施例的設(shè)備的結(jié)構(gòu)示意圖;

圖4示意性地示出了根據(jù)本發(fā)明一實(shí)施例的計(jì)算機(jī)的結(jié)構(gòu)示意圖;

圖5示意性地示出了根據(jù)本發(fā)明一實(shí)施例的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的示意圖。

在附圖中,相同或者對(duì)應(yīng)的標(biāo)號(hào)表示相同或者對(duì)應(yīng)的部分。

具體實(shí)施方式

下面將參考若干示例性實(shí)施方式來(lái)描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出這些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明,而并非以任何方式限制本發(fā)明的范圍。相反,提供這些實(shí)施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。

本領(lǐng)域技術(shù)人員知道,本發(fā)明的實(shí)施方式可以實(shí)現(xiàn)為一種設(shè)備、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本公開可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件或者完全的軟件(包括固件、駐留軟件、微代碼等),或者硬件和軟件結(jié)合的形式。

根據(jù)本發(fā)明的實(shí)施方式,提出了一種用于通過(guò)聲音識(shí)別用戶身份的方法、設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

在本文中,需要理解的是,本發(fā)明實(shí)施方式所涉及的術(shù)語(yǔ)喚醒詞通常是指用于喚醒智能終端設(shè)備(尤其是物聯(lián)網(wǎng)設(shè)備)的短句或者詞組,智能終端設(shè)備可以具體為智能音箱等物聯(lián)網(wǎng)設(shè)備;術(shù)語(yǔ)聲音也可以稱為語(yǔ)音,且通常是指由人發(fā)出的聲音,當(dāng)然,本發(fā)明實(shí)施方式也不排除聲音由設(shè)備發(fā)出的可能性,即本發(fā)明實(shí)施方式可以將由設(shè)備播放的音頻信號(hào)作為聲音;術(shù)語(yǔ)用戶身份通??梢晕ㄒ粯?biāo)識(shí)出一個(gè)用戶。此外,附圖中的任何元素?cái)?shù)量均用于示例而非限制,以及任何命名都僅用于區(qū)分,而不具有任何限制含義。下面參考本發(fā)明的若干代表性實(shí)施方式,詳細(xì)闡釋本發(fā)明的原理和精神。

發(fā)明概述

本發(fā)明人發(fā)現(xiàn),由于聲紋識(shí)別技術(shù)實(shí)現(xiàn)難度較高,因此,其所需要耗費(fèi)的資源(例如,計(jì)算資源等)通常較大;如果智能終端設(shè)備本地使用聲紋識(shí)別技術(shù)來(lái)識(shí)別用戶身份,則不僅需要額外考慮智能終端設(shè)備的硬件配置,還需要考慮智能終端設(shè)備在使用過(guò)程中的能源消耗,具體而言,由于聲紋識(shí)別技術(shù)需要耗費(fèi)較多的計(jì)算資源,因此,智能終端設(shè)備中的負(fù)責(zé)喚醒功能的芯片無(wú)法通過(guò)結(jié)構(gòu)相對(duì)較為簡(jiǎn)單的小芯片來(lái)實(shí)現(xiàn),然而,結(jié)構(gòu)相對(duì)較為復(fù)雜的大芯片不但會(huì)影響智能終端設(shè)備的成本,還會(huì)增加智能終端設(shè)備在使用過(guò)程中的耗電量;而如果智能終端設(shè)備將聲音信號(hào)上傳至服務(wù)器,由相應(yīng)的服務(wù)器利用聲紋識(shí)別技術(shù)來(lái)實(shí)現(xiàn)用戶身份識(shí)別,聲紋識(shí)別技術(shù)的實(shí)現(xiàn)難度以及與智能終端設(shè)備與服務(wù)器的信息交互也會(huì)使智能終端設(shè)備的響應(yīng)速度受到影響。

因此,針對(duì)現(xiàn)有技術(shù)中存在的由智能終端設(shè)備本地通過(guò)聲音識(shí)別用戶身份,會(huì)不利于降低智能終端設(shè)備的生產(chǎn)成本以及使用成本,而由網(wǎng)絡(luò)側(cè)的服務(wù)器通過(guò)聲音識(shí)別用戶身份,一方面不利于提高用戶身份識(shí)別的準(zhǔn)確性,另一方面不利于提高智能終端設(shè)備的響應(yīng)速度的技術(shù)問(wèn)題,提供了一種用于通過(guò)聲音識(shí)別用戶身份的方法和設(shè)備,通過(guò)預(yù)先為一個(gè)喚醒詞設(shè)置一個(gè)或者多個(gè)用戶身份信息,這樣,在檢測(cè)出智能終端設(shè)備當(dāng)前拾取的聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,可以快速準(zhǔn)確的根據(jù)檢測(cè)出的喚醒詞所對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出該聲音信號(hào)的用戶身份;由于檢測(cè)聲音信號(hào)是否包含有喚醒詞的實(shí)現(xiàn)方案所需要耗費(fèi)的資源通常較小,且完全可以由智能終端設(shè)備中的結(jié)構(gòu)相對(duì)較為簡(jiǎn)單的負(fù)責(zé)喚醒功能的芯片來(lái)實(shí)現(xiàn),當(dāng)然,也可以將喚醒和識(shí)別都放在同一個(gè)主芯片中進(jìn)行,但喚醒詞的檢測(cè)和識(shí)別功能僅占用主芯片的很小比例的運(yùn)算資源(比如不超過(guò)10%),在檢測(cè)和識(shí)別出喚醒詞時(shí),再喚醒主芯片的語(yǔ)音識(shí)別功能、開始全力工作;因此,本發(fā)明實(shí)施方式在由智能終端設(shè)備本地實(shí)現(xiàn)的情況下,基本上不需要額外考慮智能終端設(shè)備的硬件配置以及智能終端設(shè)備在使用過(guò)程中的能源消耗,且智能終端設(shè)備會(huì)具有較好的響應(yīng)速度;即便是本發(fā)明實(shí)施方式的部分步驟由服務(wù)器執(zhí)行,由于服務(wù)器是利用一個(gè)喚醒詞所對(duì)應(yīng)的相應(yīng)用戶身份信息來(lái)確定用戶身份,因此,完全可以不需要用戶聲音的細(xì)節(jié)特征,甚至可以不需要智能終端設(shè)備向其傳輸聲音信號(hào),從而可以避免聲音的細(xì)節(jié)特征被濾除而對(duì)用戶身份識(shí)別的準(zhǔn)確性所產(chǎn)生的影響,也可以避免聲紋識(shí)別技術(shù)以及聲音信號(hào)的傳輸而給智能終端設(shè)備的響應(yīng)速度帶來(lái)的影響。由此可知,本發(fā)明實(shí)施方式提供的技術(shù)方案有效降低了用戶身份識(shí)別的難度,并能夠在一定程度上提高用戶身份識(shí)別的準(zhǔn)確性以及智能終端設(shè)備的響應(yīng)速度,從而本發(fā)明實(shí)施方式具有實(shí)現(xiàn)成本低以及便于推廣應(yīng)用等特點(diǎn)。

在介紹了本發(fā)明的基本原理之后,下面具體介紹本發(fā)明的各種非限制性實(shí)施方式。

應(yīng)用場(chǎng)景總覽

首先參考圖1,示意性地示出了根據(jù)本發(fā)明實(shí)施方式的可以在其中實(shí)現(xiàn)的應(yīng)用場(chǎng)景。

圖1中,智能終端設(shè)備100是能夠支持多用戶的智能終端設(shè)備(圖1中示意性的示出了兩個(gè)用戶,且這兩個(gè)用戶通常具有不同的用戶身份),該支持多用戶的智能終端設(shè)備100可以為其所支持的各用戶提供個(gè)性化服務(wù);例如,在圖1中的智能終端設(shè)備100為智能音箱(具有智能語(yǔ)音助手功能)或者智能語(yǔ)音助手(下述以智能音箱為例進(jìn)行說(shuō)明)等,且該智能音箱支持第一用戶以及第二用戶的情況下,如果第一用戶詢問(wèn)智能音箱用戶本人當(dāng)天的日程安排,則該智能音箱應(yīng)該能夠根據(jù)當(dāng)前對(duì)話方的聲音識(shí)別出當(dāng)前對(duì)話方的用戶身份為第一用戶,從而智能音箱應(yīng)獲取第一用戶所對(duì)應(yīng)的當(dāng)天的日程安排,并答復(fù)第一用戶;而如果第二用戶詢問(wèn)智能音箱用戶本人當(dāng)天的日程安排,則該智能音箱應(yīng)該能夠根據(jù)當(dāng)前對(duì)話方的聲音識(shí)別出當(dāng)前對(duì)話方的用戶身份為第二用戶,從而智能音箱應(yīng)獲取第二用戶所對(duì)應(yīng)的當(dāng)天的日程安排,并答復(fù)第二用戶;由此可知,雖然第一用戶和第二用戶均向智能音箱詢問(wèn)了同樣的問(wèn)題(即均詢問(wèn)其當(dāng)天的日程安排),但是,智能音箱分別向第一用戶和第二用戶所給出的答復(fù)可以是完全不同的答復(fù)。

然而,本領(lǐng)域技術(shù)人員完全可以理解,本發(fā)明實(shí)施方式的適用場(chǎng)景不受到該框架任何方面的限制。

示例性方法

下面結(jié)合圖1所示的應(yīng)用場(chǎng)景,參考圖2來(lái)描述根據(jù)本發(fā)明示例性實(shí)施方式的用于通過(guò)聲音識(shí)別用戶身份的方法。需要注意的是,上述應(yīng)用場(chǎng)景僅是為了便于理解本發(fā)明的精神和原理而示出,本發(fā)明的實(shí)施方式在此方面不受任何限制。相反,本發(fā)明的實(shí)施方式可以應(yīng)用于適用的任何場(chǎng)景。

參見(jiàn)圖2,示意性地示出了根據(jù)本發(fā)明一實(shí)施例的用于通過(guò)聲音識(shí)別用戶身份的方法的流程圖,且該方法通常是在用戶的智能終端設(shè)備中執(zhí)行,例如,該方法可以在用戶的智能音箱、智能語(yǔ)音助手以及智能空調(diào)等物聯(lián)網(wǎng)設(shè)備中執(zhí)行。當(dāng)然,本發(fā)明實(shí)施方式也不排除該方法由服務(wù)器實(shí)現(xiàn)或者由智能終端設(shè)備以及服務(wù)器共同實(shí)現(xiàn)的可能性。

本發(fā)明實(shí)施方式的方法主要包括:步驟s210以及s220;可選的,本發(fā)明實(shí)施方式的方法還可以包括:步驟s200。下面對(duì)本發(fā)明實(shí)施方式所包括的各步驟分別進(jìn)行說(shuō)明。

s200、設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息。

作為示例,本發(fā)明實(shí)施方式中的喚醒詞主要用于喚醒智能終端設(shè)備,且喚醒詞可以具體為短句或者詞組等,當(dāng)然,該喚醒詞也可以為包含有較多內(nèi)容(如較多漢字或者較多單詞)的一句話。

作為示例,本發(fā)明實(shí)施方式中的用戶身份信息可以是用戶標(biāo)識(shí)信息,即一個(gè)用戶身份信息可以表征出一個(gè)用戶。用戶身份信息可以具體為用于表征用戶角色的信息,例如,用戶身份信息可以具體為表征出該用戶在家庭中的角色(如媽媽、爸爸或者兒子等)的信息,再例如,用戶身份信息可以具體為表征出該用戶在公司中的角色(如經(jīng)理或者經(jīng)理助理等)的信息。用戶身份信息也可以為用戶在應(yīng)用中的注冊(cè)賬號(hào),例如,用戶在即時(shí)通信工具(如微信或者qq等)或者網(wǎng)易郵箱中的注冊(cè)賬號(hào)等。當(dāng)然,用戶身份信息還可以具體為用于表征用戶角色的信息以及用戶在應(yīng)用中的注冊(cè)賬號(hào)。本發(fā)明實(shí)施方式不限制用戶身份信息的具體表現(xiàn)形式。

作為示例,本發(fā)明實(shí)施方式中預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息主要用于確定喚醒詞對(duì)應(yīng)的用戶身份信息。在本發(fā)明實(shí)施方式中的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息中,一個(gè)喚醒詞可以對(duì)應(yīng)至少一個(gè)用戶身份信息,也就是說(shuō),本發(fā)明實(shí)施方式允許兩個(gè)或者更多用戶身份信息對(duì)應(yīng)相同的喚醒詞,然而,在實(shí)際應(yīng)用中,一個(gè)喚醒詞通常僅對(duì)應(yīng)一個(gè)用戶身份信息,即不同的用戶身份信息對(duì)應(yīng)不同的喚醒詞。

作為示例,本發(fā)明實(shí)施方式中的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息可以是在智能終端設(shè)備出廠時(shí)預(yù)先設(shè)置好,并存儲(chǔ)于智能終端設(shè)備中的,且用戶在使用智能終端設(shè)備的過(guò)程中,可以對(duì)前述預(yù)先設(shè)置好的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息進(jìn)行維護(hù),例如修改已有的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息、刪除已有的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息或者新增喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息等;當(dāng)然,本發(fā)明實(shí)施方式中的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息也可以是在智能終端設(shè)備出廠之后,完全由用戶在使用智能終端設(shè)備的過(guò)程中動(dòng)態(tài)設(shè)置,并存儲(chǔ)于智能終端設(shè)備中的。

作為示例,本發(fā)明實(shí)施方式可以通過(guò)與外部設(shè)備的信息傳輸來(lái)設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,且該外部設(shè)備可以具體為智能移動(dòng)電話或者平板電腦或者計(jì)算機(jī)或者智能手表等智能電子設(shè)備。本發(fā)明實(shí)施方式中的與外部設(shè)備的信息傳輸可以通過(guò)與外部設(shè)備有線連接方式實(shí)現(xiàn),例如,與外部設(shè)備通過(guò)usb(universalserialbus,通用串行總線)有線連接,以實(shí)現(xiàn)信息的有線傳輸;本發(fā)明實(shí)施方式中的與外部設(shè)備的信息傳輸也可以通過(guò)無(wú)線連接方式實(shí)現(xiàn),例如,與外部設(shè)備基于無(wú)線網(wǎng)絡(luò)或者藍(lán)牙或者紅外等方式無(wú)線連接,以實(shí)現(xiàn)信息的無(wú)線傳輸。

本發(fā)明實(shí)施方式的通過(guò)與外部設(shè)備的信息傳輸來(lái)設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的一個(gè)具體例子為,用戶可以通過(guò)智能移動(dòng)電話或者平板電腦或者計(jì)算機(jī)或者智能手表等智能電子設(shè)備中的應(yīng)用所提供的用戶交互界面來(lái)采集喚醒詞以及用戶身份信息,并根據(jù)預(yù)定格式設(shè)置采集到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,然后,將該對(duì)應(yīng)關(guān)系信息傳輸給智能音箱等智能終端設(shè)備,由智能終端設(shè)備存儲(chǔ)其接收到的該對(duì)應(yīng)關(guān)系信息。在該具體例子中,外部設(shè)備可以指示智能終端設(shè)備清除其原來(lái)存儲(chǔ)的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)當(dāng)前接收到的對(duì)應(yīng)關(guān)系信息;外部設(shè)備也可以指示智能終端設(shè)備保留其原來(lái)存儲(chǔ)的對(duì)應(yīng)關(guān)系信息,并在原來(lái)存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的基礎(chǔ)上添加當(dāng)前接收到的對(duì)應(yīng)關(guān)系信息;外部設(shè)備還可以指示智能終端設(shè)備利用當(dāng)前接收到的對(duì)應(yīng)關(guān)系信息來(lái)修改其原來(lái)存儲(chǔ)的對(duì)應(yīng)關(guān)系信息,例如,指示智能終端設(shè)備利用當(dāng)前接收到的對(duì)應(yīng)關(guān)系中的喚醒詞替換其原來(lái)存儲(chǔ)的相應(yīng)對(duì)應(yīng)關(guān)系中的喚醒詞等。該例子中的應(yīng)用可以為獨(dú)立應(yīng)用(例如,瀏覽器或者專用于實(shí)現(xiàn)該對(duì)應(yīng)關(guān)系信息設(shè)置的app等)或者嵌入在微信或者qq等應(yīng)用中的第三方應(yīng)用等。

作為示例,本發(fā)明實(shí)施方式可以通過(guò)智能終端設(shè)備與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)其獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息;具體的,本發(fā)明實(shí)施方式可以在智能終端設(shè)備初次啟動(dòng)運(yùn)行過(guò)程中,向用戶發(fā)出用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音邀請(qǐng),在檢測(cè)出用戶接受該語(yǔ)音邀請(qǐng)的情況下,通過(guò)與用戶的語(yǔ)音交互來(lái)獲取喚醒詞以及用戶身份信息,并設(shè)置當(dāng)前獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息;本發(fā)明實(shí)施方式也可以在智能終端設(shè)備后續(xù)運(yùn)行過(guò)程中,在接收到用戶發(fā)出的用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音命令的情況下,通過(guò)智能終端設(shè)備與用戶的語(yǔ)音交互來(lái)獲取喚醒詞以及用戶身份信息,然后,設(shè)置獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)。

一個(gè)具體的例子,用戶在購(gòu)買了智能終端設(shè)備,且第一次加電啟動(dòng)該智能終端設(shè)備,以使智能終端設(shè)備初次運(yùn)行的應(yīng)用場(chǎng)景中,通過(guò)智能終端設(shè)備主動(dòng)向用戶發(fā)出用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音邀請(qǐng),例如,智能終端設(shè)備在初次啟動(dòng)并運(yùn)行后,發(fā)出“主人你好,我想認(rèn)識(shí)一下你,可以嗎?”的語(yǔ)音;在檢測(cè)到用戶接受了該語(yǔ)音邀請(qǐng)(例如,智能終端設(shè)備檢測(cè)到用戶說(shuō)“可以”或者“好啊”或者“好”或者“嗯”等)的情況下,可以利用智能終端設(shè)備繼續(xù)通過(guò)與用戶的語(yǔ)音交互來(lái)獲取喚醒詞以及用戶身份信息,例如,通過(guò)智能終端設(shè)備繼續(xù)發(fā)出“主人,你打算怎樣稱呼我呢”的語(yǔ)音,設(shè)定本發(fā)明實(shí)施方式檢測(cè)到用戶說(shuō)“我想稱呼你為小智小智”,則本發(fā)明實(shí)施方式可以將“小智小智”作為喚醒詞,之后,通過(guò)智能終端設(shè)備繼續(xù)發(fā)出“主人,您的手機(jī)號(hào)碼可以告訴我嗎?”的語(yǔ)音,設(shè)定本發(fā)明實(shí)施方式檢測(cè)到用戶說(shuō)“我的手機(jī)號(hào)碼是**”,則本發(fā)明實(shí)施方式可以將該手機(jī)號(hào)碼作為用戶身份信息或者用戶身份信息的一部分,之后,本發(fā)明實(shí)施方式可以在區(qū)分男聲、女聲及童聲的基礎(chǔ)上,通過(guò)智能終端設(shè)備繼續(xù)發(fā)出“我猜您一定是家里的男主人”等語(yǔ)音,以進(jìn)一步獲取用戶身份信息;在成功獲取到喚醒詞以及用戶身份信息后,本發(fā)明實(shí)施方式將喚醒詞以及用戶身份信息按照預(yù)定格式進(jìn)行存儲(chǔ),從而針對(duì)當(dāng)前用戶成功設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息。

另一個(gè)具體的例子,智能終端設(shè)備在用戶的家中被使用了一段時(shí)間之后,用戶希望該智能終端設(shè)備能夠?yàn)槠浼抑行略黾拥囊晃怀蓡T也提供個(gè)性化服務(wù),該用戶可以主動(dòng)向智能終端設(shè)備發(fā)出用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音命令,例如,該用戶可以向智能終端設(shè)備說(shuō)“小智小智,請(qǐng)認(rèn)識(shí)一位新成員”;本發(fā)明實(shí)施方式在檢測(cè)到用戶發(fā)出了用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音命令之后,可以通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞以及用戶身份信息,例如,通過(guò)智能終端設(shè)備可以發(fā)出“非常榮幸,主人,請(qǐng)問(wèn)這位新成員打算怎樣稱呼我呢?”的語(yǔ)音,設(shè)定本發(fā)明實(shí)施方式檢測(cè)到用戶說(shuō)“他想稱呼你為大智大智”,則本發(fā)明實(shí)施方式可以將“大智大智”作為喚醒詞,之后,通過(guò)智能終端設(shè)備繼續(xù)發(fā)出“主人,這位新成員的手機(jī)號(hào)碼可以告訴我嗎?”的語(yǔ)音,設(shè)定本發(fā)明實(shí)施方式檢測(cè)到用戶說(shuō)“他的手機(jī)號(hào)碼是**”,則本發(fā)明實(shí)施方式可以將該手機(jī)號(hào)碼作為用戶身份信息或者用戶身份信息的一部分,之后,本發(fā)明實(shí)施方式可以在區(qū)分男聲、女聲及童聲的基礎(chǔ)上,通過(guò)智能終端設(shè)備繼續(xù)發(fā)出“我猜這位新成員一定是家里的小主人”等語(yǔ)音,以進(jìn)一步獲取用戶身份信息;在成功獲取到喚醒詞以及用戶身份信息后,本發(fā)明實(shí)施方式可以將喚醒詞以及用戶身份信息按照預(yù)定格式進(jìn)行存儲(chǔ),從而針對(duì)當(dāng)前用戶成功設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息。

需要特別說(shuō)明的是,本發(fā)明實(shí)施方式可以通過(guò)與第一用戶的語(yǔ)音交互獲取第一喚醒詞與該第一用戶的用戶身份信息的對(duì)應(yīng)關(guān)系信息,即用戶為自己設(shè)置喚醒詞以及用戶身份信息;本發(fā)明實(shí)施方式也可以通過(guò)與第一用戶的語(yǔ)音交互獲取第二喚醒詞與第二用戶的用戶身份信息的對(duì)應(yīng)關(guān)系信息,即用戶為其他用戶設(shè)置喚醒詞以及用戶身份信息。另外,本發(fā)明實(shí)施方式中的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息可以為文本形式的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,也可以為聲學(xué)模型形式的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息。本發(fā)明實(shí)施方式可以采用現(xiàn)有的聲學(xué)模型構(gòu)建方式為各用戶的喚醒詞構(gòu)建相應(yīng)的聲學(xué)模型,建立聲學(xué)模型的技術(shù)已較成熟,本發(fā)明實(shí)施方式在此不對(duì)建立聲學(xué)模型的具體實(shí)現(xiàn)方式進(jìn)行詳細(xì)說(shuō)明。

作為示例,在一些應(yīng)用場(chǎng)景中,喚醒詞通常會(huì)被設(shè)置為用戶對(duì)智能終端設(shè)備的特定稱呼(即特定稱謂),例如,在上述的具體例子中“小智小智”以及“大智大智”均是用戶對(duì)智能終端設(shè)備的特定稱謂。本發(fā)明實(shí)施方式不限制喚醒詞的具體表現(xiàn)形式。

作為示例,本發(fā)明實(shí)施方式建立的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息中還可以包括:驗(yàn)證碼;即本發(fā)明實(shí)施方式可以建立喚醒詞、驗(yàn)證碼以及用戶身份信息的對(duì)應(yīng)關(guān)系信息,該驗(yàn)證碼主要用于提高用戶身份識(shí)別的安全性以及準(zhǔn)確性,也就是說(shuō),本發(fā)明實(shí)施方式通過(guò)使用驗(yàn)證碼可以在一定程度上避免用戶使用其他用戶的喚醒詞。

s210、根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)。

作為示例,本發(fā)明實(shí)施方式可以采用將語(yǔ)音識(shí)別為文字的技術(shù)來(lái)實(shí)現(xiàn)喚醒詞檢測(cè),具體的,設(shè)定本發(fā)明實(shí)施方式中預(yù)先設(shè)置有文本形式的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,在該情況下,本發(fā)明實(shí)施方式可以先將智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行預(yù)處理(當(dāng)然,本發(fā)明實(shí)施方式也可以不進(jìn)行預(yù)處理操作),例如,本發(fā)明實(shí)施方式對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行與噪音、回聲以及混響等相關(guān)的預(yù)處理;然后,本發(fā)明實(shí)施方式可以將預(yù)處理后的聲音信號(hào)轉(zhuǎn)換為文本信息,然后,再檢測(cè)該文本信息中是否包含有預(yù)先設(shè)置的所有喚醒詞中的任一個(gè)喚醒詞,例如,從該文本信息中提取各關(guān)鍵詞,并依次將提出的關(guān)鍵詞在當(dāng)前存儲(chǔ)的各喚醒詞中進(jìn)行匹配查找,如果查找到與關(guān)鍵詞匹配的喚醒詞,則本發(fā)明實(shí)施方式檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞,如果未查找到與關(guān)鍵詞匹配的喚醒詞,則檢測(cè)出聲音信號(hào)未包含有預(yù)先設(shè)置的喚醒詞。需要特別說(shuō)明的是,本發(fā)明實(shí)施方式在依次將提出的關(guān)鍵詞在當(dāng)前存儲(chǔ)的各喚醒詞中進(jìn)行匹配查找的過(guò)程中,可以在查找到與關(guān)鍵詞匹配的喚醒詞時(shí),停止后續(xù)關(guān)鍵詞的查找過(guò)程;當(dāng)然,本發(fā)明實(shí)施方式也可以在查找到與關(guān)鍵詞匹配的喚醒詞時(shí),繼續(xù)后續(xù)關(guān)鍵詞的查找過(guò)程,即針對(duì)提出的所有關(guān)鍵詞均進(jìn)行匹配查找,而如果查找到兩個(gè)或者更多關(guān)鍵詞均存在匹配的喚醒詞,則本發(fā)明實(shí)施方式可以將優(yōu)先級(jí)高的喚醒詞作為本次最終查找到的喚醒詞。

作為示例,本發(fā)明實(shí)施方式可以采用聲學(xué)模型的技術(shù)來(lái)實(shí)現(xiàn)喚醒詞檢測(cè),具體的,設(shè)定本發(fā)明實(shí)施方式中預(yù)先設(shè)置有聲學(xué)模型形式的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,在該情況下,本發(fā)明實(shí)施方式可以先將智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行預(yù)處理,例如,對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行與噪音、回聲以及混響等相關(guān)的預(yù)處理;然后,再計(jì)算預(yù)處理后的聲音信號(hào)與預(yù)先設(shè)置的各聲學(xué)模型的匹配度,并從計(jì)算結(jié)果中選取出最高匹配度,然后,判斷該最高匹配度是否滿足預(yù)定匹配要求,如果該最高匹配度滿足預(yù)定匹配要求,則檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞,而如果該最高匹配度不滿足預(yù)定匹配要求,則檢測(cè)出聲音信號(hào)未包含有預(yù)先設(shè)置的喚醒詞。本發(fā)明實(shí)施方式可以采用現(xiàn)有的匹配度計(jì)算方式來(lái)計(jì)算聲音信號(hào)與聲學(xué)模型的匹配度,計(jì)算匹配度的技術(shù)已較成熟,本發(fā)明實(shí)施方式在此不對(duì)計(jì)算匹配度的具體實(shí)現(xiàn)方式進(jìn)行詳細(xì)說(shuō)明。

s220、在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出該聲音信號(hào)的用戶身份。

作為示例,本發(fā)明實(shí)施方式在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,可以根據(jù)預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息,例如,利用檢測(cè)出的喚醒詞在預(yù)先設(shè)置的對(duì)應(yīng)關(guān)系中查找匹配記錄,并從匹配記錄中獲取用戶身份信息,該獲取到的用戶身份信息即表示出本發(fā)明實(shí)施方式識(shí)別出的發(fā)出聲音信號(hào)的用戶身份。

作為示例,本發(fā)明實(shí)施方式在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,在核查驗(yàn)證碼的基礎(chǔ)上識(shí)別用戶身份,以提高用戶身份識(shí)別的安全性。

一個(gè)具體的例子,本發(fā)明實(shí)施方式在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,可以根據(jù)預(yù)先設(shè)置的喚醒詞、驗(yàn)證碼與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定當(dāng)前檢測(cè)出的喚醒詞所對(duì)應(yīng)的驗(yàn)證碼,例如,利用檢測(cè)出的喚醒詞在預(yù)先設(shè)置的對(duì)應(yīng)關(guān)系中查找匹配記錄,并從匹配記錄中獲取驗(yàn)證碼以及用戶身份信息,同時(shí),可以向用戶發(fā)出用于獲取驗(yàn)證碼的語(yǔ)音請(qǐng)求,例如,通過(guò)智能終端設(shè)備發(fā)出“小智請(qǐng)求小主人的驗(yàn)證碼”的語(yǔ)音;本發(fā)明實(shí)施方式可以判斷智能終端設(shè)備當(dāng)前拾取到的用戶的語(yǔ)音回復(fù)中是否包含有匹配記錄中的驗(yàn)證碼,例如,可以先將智能終端設(shè)備拾取的聲音信號(hào)轉(zhuǎn)換為文本信息,然后,再檢測(cè)該文本信息中是否包含有上述從匹配記錄中獲取到的驗(yàn)證碼,如果包含有從匹配記錄中獲取到的驗(yàn)證碼,則本次驗(yàn)證通過(guò),上述從匹配記錄中獲取到的用戶身份信息即表示出本發(fā)明實(shí)施方式識(shí)別出的發(fā)出聲音信號(hào)的用戶身份;如果未包含有從匹配記錄中獲取到的驗(yàn)證碼,則本次驗(yàn)證失敗,本發(fā)明實(shí)施方式可以提示用戶與本次驗(yàn)證失敗相關(guān)的提示信息,例如,通過(guò)智能終端設(shè)備發(fā)出“小主人,驗(yàn)證碼有點(diǎn)問(wèn)題哦,小智再次請(qǐng)求小主人的驗(yàn)證碼”的語(yǔ)音。本發(fā)明實(shí)施方式可以預(yù)先設(shè)置身份驗(yàn)證的次數(shù)上限,在驗(yàn)證次數(shù)達(dá)到身份驗(yàn)證的次數(shù)上限時(shí),可以結(jié)束本次身份識(shí)別的過(guò)程,并提示用戶。

示例性設(shè)備

在介紹了本發(fā)明示例性實(shí)施方式的方法之后,接下來(lái),參考圖3對(duì)本發(fā)明示例性實(shí)施方式的用于通過(guò)聲音識(shí)別用戶身份的設(shè)備進(jìn)行說(shuō)明。

參見(jiàn)圖3,示意性地示出了根據(jù)本發(fā)明一實(shí)施例的用于通過(guò)聲音識(shí)別用戶身份的設(shè)備的結(jié)構(gòu)示意圖,該設(shè)備通常設(shè)置于用戶的智能終端設(shè)備中,例如,該設(shè)備可以設(shè)置于用戶的智能音箱、智能語(yǔ)音助手以及智能空調(diào)等物聯(lián)網(wǎng)設(shè)備中。當(dāng)然,本發(fā)明實(shí)施方式也不排除該設(shè)備設(shè)置于服務(wù)器中,或者該設(shè)備的一部分(例如,喚醒詞檢測(cè)模塊310)設(shè)置于智能終端設(shè)備中,而另一部分(例如,用戶身份識(shí)別模塊320)設(shè)置于服務(wù)器中的可能性。

本發(fā)明實(shí)施方式的設(shè)備主要包括:?jiǎn)拘言~檢測(cè)模塊310以及用戶身份識(shí)別模塊320;可選的,本發(fā)明實(shí)施方式的設(shè)備還可以包括:設(shè)置對(duì)應(yīng)關(guān)系模塊300。下面對(duì)本發(fā)明實(shí)施方式的各模塊分別進(jìn)行說(shuō)明。

設(shè)置對(duì)應(yīng)關(guān)系模塊300主要用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息。設(shè)置對(duì)應(yīng)關(guān)系模塊300所建立的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息中還可以包括:驗(yàn)證碼;即設(shè)置對(duì)應(yīng)關(guān)系模塊300可以建立喚醒詞、驗(yàn)證碼以及用戶身份信息的對(duì)應(yīng)關(guān)系信息,該驗(yàn)證碼主要用于提高用戶身份識(shí)別的安全性以及準(zhǔn)確性,也就是說(shuō),本發(fā)明實(shí)施方式的設(shè)備通過(guò)使用驗(yàn)證碼可以在一定程度上避免用戶使用其他用戶的喚醒詞。

作為示例,設(shè)置對(duì)應(yīng)關(guān)系模塊300可以通過(guò)與外部設(shè)備的信息傳輸來(lái)設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,設(shè)置對(duì)應(yīng)關(guān)系模塊300也可以通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息;具體的例子如上述方法實(shí)施方式中針對(duì)步驟s200的描述,在此不再重復(fù)說(shuō)明。

喚醒詞檢測(cè)模塊310主要用于根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)。

作為示例,喚醒詞檢測(cè)模塊310可以采用將語(yǔ)音識(shí)別為文字的技術(shù)來(lái)實(shí)現(xiàn)喚醒詞檢測(cè),具體的,設(shè)定設(shè)置對(duì)應(yīng)關(guān)系模塊300預(yù)先設(shè)置了文本形式的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,在該情況下,喚醒詞檢測(cè)模塊310可以先將智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行預(yù)處理(當(dāng)然,喚醒詞檢測(cè)模塊310也可以不進(jìn)行預(yù)處理操作),例如,喚醒詞檢測(cè)模塊310對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行與噪音、回聲以及混響等相關(guān)的預(yù)處理;然后,喚醒詞檢測(cè)模塊310再將預(yù)處理后的聲音信號(hào)轉(zhuǎn)換為文本信息,然后,喚醒詞檢測(cè)模塊310檢測(cè)該文本信息中是否包含有預(yù)先設(shè)置的所有喚醒詞中的任一喚醒詞,例如,喚醒詞檢測(cè)模塊310從文本信息中提取各關(guān)鍵詞,并依次將提出的關(guān)鍵詞在當(dāng)前存儲(chǔ)的各喚醒詞中進(jìn)行匹配查找,如果查找到與關(guān)鍵詞匹配的喚醒詞,則喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞,如果未查找到與關(guān)鍵詞匹配的喚醒詞,則喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)未包含有預(yù)先設(shè)置的喚醒詞。需要特別說(shuō)明的是,喚醒詞檢測(cè)模塊310在依次將提出的關(guān)鍵詞在當(dāng)前存儲(chǔ)的各喚醒詞中進(jìn)行匹配查找的過(guò)程中,可以在查找到與關(guān)鍵詞匹配的喚醒詞時(shí),立即停止后續(xù)關(guān)鍵詞的查找過(guò)程;當(dāng)然,喚醒詞檢測(cè)模塊310也可以在查找到與關(guān)鍵詞匹配的喚醒詞時(shí),繼續(xù)后續(xù)關(guān)鍵詞的查找過(guò)程,即喚醒詞檢測(cè)模塊310針對(duì)提出的所有關(guān)鍵詞均進(jìn)行匹配查找,而如果查找到兩個(gè)或者更多關(guān)鍵詞均存在匹配的喚醒詞,則本喚醒詞檢測(cè)模塊310可以將優(yōu)先級(jí)高的喚醒詞作為本次最終查找到的喚醒詞。

作為示例,喚醒詞檢測(cè)模塊310可以采用聲學(xué)模型的技術(shù)來(lái)實(shí)現(xiàn)喚醒詞檢測(cè),具體的,設(shè)定設(shè)置對(duì)應(yīng)關(guān)系模塊300預(yù)先設(shè)置了聲學(xué)模型形式的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,在該情況下,喚醒詞檢測(cè)模塊310可以先將智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行預(yù)處理,例如,喚醒詞檢測(cè)模塊310對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行與噪音、回聲以及混響等相關(guān)的預(yù)處理;然后,喚醒詞檢測(cè)模塊310再計(jì)算預(yù)處理后的聲音信號(hào)與預(yù)先設(shè)置的各聲學(xué)模型的匹配度,并從計(jì)算結(jié)果中選取出最高匹配度,然后,喚醒詞檢測(cè)模塊310判斷該最高匹配度是否滿足預(yù)定匹配要求,如果該最高匹配度滿足預(yù)定匹配要求,則喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞,而如果該最高匹配度不滿足預(yù)定匹配要求,則喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)未包含有預(yù)先設(shè)置的喚醒詞。喚醒詞檢測(cè)模塊310可以采用現(xiàn)有的匹配度計(jì)算方式來(lái)計(jì)算聲音信號(hào)與聲學(xué)模型的匹配度,計(jì)算匹配度的技術(shù)已較成熟,在此不對(duì)喚醒詞檢測(cè)模塊310計(jì)算匹配度的具體實(shí)現(xiàn)方式進(jìn)行詳細(xì)說(shuō)明。

用戶身份識(shí)別模塊320主要用于在檢測(cè)出上述聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)喚醒詞檢測(cè)模塊310檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出上述聲音信號(hào)的用戶身份。

作為示例,用戶身份識(shí)別模塊320在喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,可以根據(jù)預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息,例如,用戶身份識(shí)別模塊320利用喚醒詞檢測(cè)模塊310檢測(cè)出的喚醒詞在預(yù)先設(shè)置的對(duì)應(yīng)關(guān)系中查找匹配記錄,并從匹配記錄中獲取用戶身份信息,該獲取到的用戶身份信息即表示出用戶身份識(shí)別模塊320識(shí)別出的發(fā)出聲音信號(hào)的用戶身份。

作為示例,用戶身份識(shí)別模塊320在喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,在核查驗(yàn)證碼的基礎(chǔ)上識(shí)別用戶身份,以提高用戶身份識(shí)別的安全性。

一個(gè)具體的例子,用戶身份識(shí)別模塊320在喚醒詞檢測(cè)模塊310檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)預(yù)先設(shè)置的喚醒詞、驗(yàn)證碼與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定當(dāng)前檢測(cè)出的喚醒詞所對(duì)應(yīng)的驗(yàn)證碼,例如,用戶身份識(shí)別模塊320利用檢測(cè)出的喚醒詞在預(yù)先設(shè)置的對(duì)應(yīng)關(guān)系中查找匹配記錄,并從匹配記錄中獲取驗(yàn)證碼以及用戶身份信息,同時(shí)用戶身份識(shí)別模塊320可以向用戶發(fā)出用于獲取驗(yàn)證碼的語(yǔ)音請(qǐng)求,例如,用戶身份識(shí)別模塊320通過(guò)智能終端設(shè)備發(fā)出“小智請(qǐng)求小主人的驗(yàn)證碼”的語(yǔ)音;用戶身份識(shí)別模塊320可以觸發(fā)喚醒詞檢測(cè)模塊310判斷智能終端設(shè)備當(dāng)前拾取到的用戶的語(yǔ)音回復(fù)中是否包含有匹配記錄中的驗(yàn)證碼,如喚醒詞檢測(cè)模塊310可以先將智能終端設(shè)備拾取的聲音信號(hào)轉(zhuǎn)換為文本信息,然后,再檢測(cè)該文本信息中是否包含有上述從匹配記錄中獲取到的驗(yàn)證碼,如果包含有從匹配記錄中獲取到的驗(yàn)證碼,則用戶身份識(shí)別模塊320確認(rèn)本次驗(yàn)證通過(guò),上述從匹配記錄中獲取到的用戶身份信息即表示出用戶身份識(shí)別模塊320識(shí)別出的發(fā)出聲音信號(hào)的用戶身份;如果未包含有從匹配記錄中獲取到的驗(yàn)證碼,則用戶身份識(shí)別模塊320確定本次驗(yàn)證失敗,用戶身份識(shí)別模塊320可以提示用戶與本次驗(yàn)證失敗相關(guān)的提示信息,例如,用戶身份識(shí)別模塊320通過(guò)智能終端設(shè)備發(fā)出“小主人,驗(yàn)證碼有點(diǎn)問(wèn)題哦,小智再次請(qǐng)求小主人的驗(yàn)證碼”的語(yǔ)音。用戶身份識(shí)別模塊320中可以預(yù)先設(shè)置有身份驗(yàn)證的次數(shù)上限,在驗(yàn)證次數(shù)達(dá)到身份驗(yàn)證的次數(shù)上限時(shí),用戶身份識(shí)別模塊320可以結(jié)束本次身份識(shí)別的過(guò)程,并提示用戶。

圖4示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器40的框圖。圖4顯示的計(jì)算機(jī)系統(tǒng)/服務(wù)器40僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來(lái)任何限制。

如圖4所示,計(jì)算機(jī)系統(tǒng)/服務(wù)器40以通用計(jì)算設(shè)備的形式表現(xiàn)。計(jì)算機(jī)系統(tǒng)/服務(wù)器40的組件可以包括但不限于:一個(gè)或者多個(gè)處理器或者處理單元401,系統(tǒng)存儲(chǔ)器402,連接不同系統(tǒng)組件(包括系統(tǒng)存儲(chǔ)器402和處理單元401)的總線403。

計(jì)算機(jī)系統(tǒng)/服務(wù)器40典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計(jì)算機(jī)系統(tǒng)/服務(wù)器40訪問(wèn)的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。

系統(tǒng)存儲(chǔ)器402可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如,隨機(jī)存取存儲(chǔ)器(ram)4021和/或高速緩存存儲(chǔ)器4022。計(jì)算機(jī)系統(tǒng)/服務(wù)器40可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,rom4023可以用于讀寫不可移動(dòng)的、非易失性磁介質(zhì)(圖4中未顯示,通常稱為“硬盤驅(qū)動(dòng)器”)。盡管未在圖4中示出,可以提供用于對(duì)可移動(dòng)非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動(dòng)器,以及對(duì)可移動(dòng)非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過(guò)一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線403相連。系統(tǒng)存儲(chǔ)器402中可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。

具有一組(至少一個(gè))程序模塊4024的程序/實(shí)用工具4025,可以存儲(chǔ)在例如系統(tǒng)存儲(chǔ)器402中,且這樣的程序模塊4024包括但不限于:操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊4024通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。

計(jì)算機(jī)系統(tǒng)/服務(wù)器40也可以與一個(gè)或多個(gè)外部設(shè)備404(如鍵盤、指向設(shè)備、顯示器等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口405進(jìn)行。并且,計(jì)算機(jī)系統(tǒng)/服務(wù)器40還可以通過(guò)網(wǎng)絡(luò)適配器406與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖4所示,網(wǎng)絡(luò)適配器406通過(guò)總線403與計(jì)算機(jī)系統(tǒng)/服務(wù)器40的其它模塊(如處理單元401等)通信。應(yīng)當(dāng)明白的是,盡管圖4中未示出,可以結(jié)合計(jì)算機(jī)系統(tǒng)/服務(wù)器40使用其它硬件和/或軟件模塊。

處理單元401通過(guò)運(yùn)行存儲(chǔ)在系統(tǒng)存儲(chǔ)器402中的計(jì)算機(jī)程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如,執(zhí)行用于實(shí)現(xiàn)上述方法實(shí)施例中的各步驟的指令;具體而言,處理器401可以執(zhí)行存儲(chǔ)器402中存儲(chǔ)的計(jì)算機(jī)程序,且該計(jì)算機(jī)程序被執(zhí)行時(shí),下述指令被運(yùn)行:用于根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè)的指令(下述簡(jiǎn)稱為第一指令);以及,在第一指令檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于根據(jù)第一指令檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出聲音信號(hào)的用戶身份的指令(下述簡(jiǎn)稱為第二指令)??蛇x的,在計(jì)算機(jī)程序被執(zhí)行時(shí),用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令被執(zhí)行(下述簡(jiǎn)稱為第三指令)。

作為示例,上述第三指令可以包括:第四指令和/或第五指令;其中的第四指令為用于接收外部設(shè)備傳輸來(lái)的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)接收到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令;其中的第五指令為用于通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令。

作為示例,上述第五指令可以具體為:用于通過(guò)與第一用戶的語(yǔ)音交互獲取第一喚醒詞與第一用戶的用戶身份信息的對(duì)應(yīng)關(guān)系信息,并存儲(chǔ)獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令(下述簡(jiǎn)稱為第六指令)。

作為示例,上述第六指令可以包括:第七指令和/或第八指令;其中的第七指令為用于在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息,并根據(jù)確定出的用戶身份信息識(shí)別出發(fā)出所述聲音信號(hào)的用戶身份的指令;其中的第八指令為用于在智能終端設(shè)備運(yùn)行過(guò)程中,在接收到用戶發(fā)出的用于設(shè)置喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的語(yǔ)音命令的情況下,通過(guò)與用戶的語(yǔ)音交互獲取喚醒詞以及用戶身份信息,并設(shè)置獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息,存儲(chǔ)獲取到的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息的指令。

作為示例,上述第一指令可以包括:第九指令以及第十指令;其中的第九指令為用于將智能終端設(shè)備拾取的聲音信號(hào)轉(zhuǎn)換為文本信息的指令;其中的第十指令為用于檢測(cè)文本信息中是否包含有預(yù)先設(shè)置的所有喚醒詞中的任一喚醒詞的指令。

作為示例,上述第一指令可以包括:第十一指令以及第十二指令;其中的第十一指令為用于檢測(cè)智能終端設(shè)備拾取的聲音信號(hào)與針對(duì)預(yù)先設(shè)置的各喚醒詞而設(shè)置的各聲學(xué)模型的匹配度的指令;其中的第十二指令為用于判斷各聲學(xué)模型與聲音信號(hào)的匹配度是否符合預(yù)設(shè)匹配要求的指令。

作為示例,上述第二指令可以包括:第十三指令或者第十四指令;其中的第十三指令可以具體為在第一指令檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于利用第一指令檢測(cè)出的喚醒詞在預(yù)先設(shè)置的喚醒詞與用戶身份信息的對(duì)應(yīng)關(guān)系信息中查找匹配記錄,并根據(jù)匹配記錄中的用戶身份信息識(shí)別出發(fā)出聲音信號(hào)的用戶身份;其中的第十四指令可以具體為在第一指令檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,用于根據(jù)預(yù)先設(shè)置的喚醒詞、驗(yàn)證碼與用戶身份信息的對(duì)應(yīng)關(guān)系信息確定第一指令檢測(cè)出的喚醒詞對(duì)應(yīng)的驗(yàn)證碼以及用戶身份信息,向用戶發(fā)出用于獲取驗(yàn)證碼的語(yǔ)音請(qǐng)求,在檢測(cè)出用戶的語(yǔ)音回復(fù)中包含有上述確定出的驗(yàn)證碼時(shí),根據(jù)檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出聲音信號(hào)的用戶身份的指令。

上述第一指令至第十四指令所執(zhí)行的具體操作如上述方法實(shí)施方式中的描述,在此不再詳細(xì)說(shuō)明。

本發(fā)明實(shí)施方式的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)一個(gè)具體例子如圖5所示。

圖5的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)為光盤500,其上存儲(chǔ)有計(jì)算機(jī)程序(即程序產(chǎn)品),該程序被處理器執(zhí)行時(shí),會(huì)實(shí)現(xiàn)上述方法實(shí)施方式中所記載的各步驟,例如,根據(jù)預(yù)先設(shè)置的各喚醒詞對(duì)智能終端設(shè)備拾取的聲音信號(hào)進(jìn)行喚醒詞檢測(cè),其中,一個(gè)喚醒詞對(duì)應(yīng)至少一個(gè)用戶身份信息;在檢測(cè)出聲音信號(hào)包含有預(yù)先設(shè)置的喚醒詞的情況下,根據(jù)上述檢測(cè)出的喚醒詞對(duì)應(yīng)的用戶身份信息識(shí)別出發(fā)出聲音信號(hào)的用戶身份。各步驟的具體實(shí)現(xiàn)方式在此不再重復(fù)說(shuō)明。

應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了用于通過(guò)聲音識(shí)別用戶身份的設(shè)備的若干模塊或子模塊,但是這種劃分僅僅是示例性的并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多模塊的特征和功能可以在一個(gè)模塊中具體化。反之,上文描述的一個(gè)模塊的特征和功能可以進(jìn)一步劃分為由多個(gè)模塊來(lái)具體化。

此外,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。附加地或備選地,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。

雖然已經(jīng)參考若干具體實(shí)施方式描述了本發(fā)明的精神和原理,但是應(yīng)該理解,本發(fā)明并不限于所公開的具體實(shí)施方式,對(duì)各方面的劃分也不意味著這些方面中的特征不能組合以進(jìn)行受益,這種劃分僅是為了表述的方便。本發(fā)明旨在涵蓋所附權(quán)利要求的精神和范圍內(nèi)所包括的各種修改和等同布置。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1