本申請涉及人工智能,更具體的說,是涉及一種問答方法、裝置、相關(guān)設(shè)備及計算機程序產(chǎn)品。
背景技術(shù):
1、隨著人工智能技術(shù)的發(fā)展,人工智能模型越來越多的應(yīng)用于各行各業(yè),示例如智能問答場景。特別是伴隨大模型的興起,借助大模型強大的自然語義理解、邏輯推理及文本生成等能力,極大提升了各類型任務(wù)的處理效率。
2、當(dāng)前,市面上各類型的大模型眾多,不同大模型的網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練策略等均不相同,能力也不盡相同。單一的大模型性能有限,在一些問答場景下很容易生成錯誤的回答,因此如何提升大模型在智能問答場景下的效果成為亟待解決的問題。
技術(shù)實現(xiàn)思路
1、鑒于上述問題,提出了本申請以便提供一種問答方法、裝置、相關(guān)設(shè)備及計算機程序產(chǎn)品,以實現(xiàn)提升大模型在智能問答場景下的效果的目的。具體方案如下:
2、本申請的第一方面,提供了一種問答方法,包括:
3、獲取問題信息;
4、調(diào)用配置的大模型集合中各第一大模型,以指示每個所述第一大模型生成所述問題信息對應(yīng)的回答內(nèi)容,得到回答內(nèi)容集合,所述大模型集合中包含兩個以上不同的第一大模型;
5、調(diào)用配置的第二大模型,以指示所述第二大模型基于所述問題信息,判斷所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致,得到所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致的判斷結(jié)果;
6、若所述判斷結(jié)果表示存在至少一對回答內(nèi)容一致,則將一致的所述回答內(nèi)容作為最終答案輸出。
7、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,還包括:
8、若所述判斷結(jié)果表示所述回答內(nèi)容集合中各回答內(nèi)容均不一致,則參考配置的所述大模型集合中各第一大模型的優(yōu)勢處理題型,選取優(yōu)勢處理題型包含所述問題信息的題型的第一大模型,作為目標(biāo)第一大模型;
9、以所述目標(biāo)第一大模型生成的所述問題信息對應(yīng)的回答內(nèi)容,作為最終答案輸出。
10、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,調(diào)用配置的第二大模型得到所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致的判斷結(jié)果的過程,包括:
11、持續(xù)檢測各個所述第一大模型是否生成完畢回答內(nèi)容,并在得到兩個所述第一大模型生成的回答內(nèi)容時開始對已生成的回答內(nèi)容進(jìn)行兩兩組合,并調(diào)用所述第二大模型,以指示第二大模型判斷每一回答內(nèi)容組合中兩個回答內(nèi)容是否一致,直至得到所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致的判斷結(jié)果;
12、若所述判斷結(jié)果表示存在至少一對回答內(nèi)容一致,則將一致的所述回答內(nèi)容作為最終答案輸出的過程,包括:
13、持續(xù)檢測所述第二大模型輸出的判斷結(jié)果,在首次檢測到判斷結(jié)果為一致時即將一致的所述回答內(nèi)容作為最終答案輸出。
14、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,還包括:
15、根據(jù)所述判斷結(jié)果,確定并輸出所述最終答案的風(fēng)險等級,所述風(fēng)險等級用于表征所述最終答案存在錯誤的風(fēng)險大小。
16、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,還包括:
17、獲取預(yù)先測試得到的所述目標(biāo)第一大模型對所述問題信息的題型的正確率;
18、根據(jù)所述正確率確定并輸出所述最終答案的風(fēng)險等級,所述風(fēng)險等級用于表征所述最終答案存在錯誤的風(fēng)險大小。
19、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,根據(jù)所述判斷結(jié)果,確定所述最終答案的風(fēng)險等級的過程,包括:
20、根據(jù)所述判斷結(jié)果中與所述最終答案一致的回答內(nèi)容的數(shù)量,確定所述最終答案的風(fēng)險等級,所述數(shù)量越多對應(yīng)的風(fēng)險等級所表征的最終答案存在錯誤的風(fēng)險越小。
21、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,所述第二大模型為采用問答訓(xùn)練數(shù)據(jù)對通用大模型進(jìn)行微調(diào)訓(xùn)練后得到的模型,其中,所述問答訓(xùn)練數(shù)據(jù)包括樣本問題信息、與所述樣本問題信息對應(yīng)的回答內(nèi)容對,以及所述回答內(nèi)容對是否一致的判斷結(jié)果。
22、在一種可能的設(shè)計中,在本申請實施例的第一方面的另一種實現(xiàn)方式中,還包括:
23、對所述回答內(nèi)容集合中兩兩回答內(nèi)容的一致性判斷結(jié)果進(jìn)行交叉驗證,若確定存在驗證不通過的回答內(nèi)容,則標(biāo)記所述驗證不通過的回答內(nèi)容,以作為訓(xùn)練數(shù)據(jù)用于對所述第二大模型進(jìn)行更新訓(xùn)練。
24、本申請的第二方面,提供了一種問答裝置,包括:
25、問題獲取單元,用于獲取問題信息;
26、第一大模型調(diào)用單元,用于調(diào)用配置的大模型集合中各第一大模型,以指示每個所述第一大模型生成所述問題信息對應(yīng)的回答內(nèi)容,得到回答內(nèi)容集合,所述大模型集合中包含兩個以上不同的第一大模型;
27、第二大模型調(diào)用單元,用于調(diào)用配置的第二大模型,以指示所述第二大模型基于所述問題信息,判斷所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致,得到所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致的判斷結(jié)果;
28、第一答案輸出單元,用于若所述判斷結(jié)果表示存在至少一對回答內(nèi)容一致,則將一致的所述回答內(nèi)容作為最終答案輸出。
29、本申請的第三方面,提供了一種電子設(shè)備,包括:存儲器和處理器;
30、所述存儲器,用于存儲程序;
31、所述處理器,用于執(zhí)行所述程序,實現(xiàn)本申請前述第一方面中任一項所描述的問答方法。
32、本申請的第四方面,提供了一種可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)本申請前述第一方面中任一項所描述的問答方法。
33、本申請的第五方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時,實現(xiàn)本申請前述第一方面中任一項所描述的問答方法。
34、借由上述技術(shù)方案,本申請集成了多個大模型進(jìn)行問答處理,具體地,通過配置的大模型集合中各第一大模型,分別生成問題信息對應(yīng)的回答內(nèi)容,進(jìn)一步,本申請還預(yù)先配置了第二大模型,該第二大模型用于對前述各第一大模型生成的回答內(nèi)容進(jìn)行一致性檢測,得到回答內(nèi)容集合中兩兩回答內(nèi)容是否一致的判斷結(jié)果,若判斷結(jié)果表示存在至少一對回答內(nèi)容一致,則可以將該一致的回答內(nèi)容作為最終答案輸出??紤]到單個大模型生成的回答內(nèi)容可能存在錯誤,但是通過交叉驗證任意兩個大模型生成的回答內(nèi)容的一致性,若存在至少一對回答內(nèi)容一致,則該一致的回答內(nèi)容的準(zhǔn)確率將會極大的提升,因此可以將該一致的回答內(nèi)容作為最終答案輸出,能夠極大提升回答結(jié)果的準(zhǔn)確率。
35、此外,本申請在驗證不同第一大模型生成的回答內(nèi)容是否一致時,借助了第二大模型的能力,通過第二大模型結(jié)合問題信息這一上下文信息,對兩兩回答內(nèi)容的一致性進(jìn)行檢測,可以充分利用第二大模型的推理能力,提高一致性檢測的準(zhǔn)確度。
1.一種問答方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,調(diào)用配置的第二大模型得到所述回答內(nèi)容集合中兩兩回答內(nèi)容是否一致的判斷結(jié)果的過程,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述判斷結(jié)果,確定所述最終答案的風(fēng)險等級的過程,包括:
7.根據(jù)權(quán)利要求1-6任一項所述的方法,其特征在于,所述第二大模型為采用問答訓(xùn)練數(shù)據(jù)對通用大模型進(jìn)行微調(diào)訓(xùn)練后得到的模型,其中,所述問答訓(xùn)練數(shù)據(jù)包括樣本問題信息、與所述樣本問題信息對應(yīng)的回答內(nèi)容對,以及所述回答內(nèi)容對是否一致的判斷結(jié)果。
8.根據(jù)權(quán)利要求1-6任一項所述的方法,其特征在于,還包括:
9.一種問答裝置,其特征在于,包括:
10.一種電子設(shè)備,其特征在于,包括:存儲器和處理器;
11.一種可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1~8中任一項所述的問答方法的各個步驟。
12.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1~8中任一項所述的問答方法的各個步驟。