本說明書實施例涉及計算機,特別涉及一種對話處理模型訓練方法。本說明書一個或者多個實施例同時涉及一種對話方法,一種對話處理模型訓練裝置,一種對話裝置,一種計算設備,一種計算機可讀存儲介質以及一種計算機程序產品。
背景技術:
1、通常,利用特定的項目數(shù)據,對預訓練對話處理模型進行微調訓練,可以使預訓練對話處理模型能夠擁有特定項目上的對話能力。
2、然而,實際應用中,由于多種實際的原因,例如用戶的提問方式繁多、訓練數(shù)據少等等,導致模型的回答與預期回答差別較大,回答效果較差。
3、因此,亟需一種提高模型回答效果的技術方案以解決上述技術問題。
技術實現(xiàn)思路
1、有鑒于此,本說明書實施例提供了一種對話處理模型訓練方法。本說明書一個或者多個實施例同時涉及一種對話方法,一種對話處理模型訓練裝置,一種對話裝置,一種計算設備,一種計算機可讀存儲介質以及一種計算機程序產品,以解決現(xiàn)有技術中存在回答效果較差的技術缺陷。
2、根據本說明書實施例的第一方面,提供了一種對話處理模型訓練方法,包括:
3、確定與目標對話領域關聯(lián)的初始對話處理模型,其中,所述初始對話處理模型,通過與所述目標對話領域關聯(lián)的初始對話訓練數(shù)據,對預訓練對話處理模型訓練獲得;
4、根據所述初始對話處理模型在所述目標對話領域的應用數(shù)據,確定第一對話訓練數(shù)據以及第二對話訓練數(shù)據,其中,所述第一對話訓練數(shù)據包括第一對話訓練樣本以及所述第一對話訓練樣本對應的正標簽,所述第二對話訓練數(shù)據包括第二對話訓練樣本以及所述第二對話訓練樣本對應的負標簽;
5、根據所述初始對話訓練數(shù)據以及所述第一對話訓練樣本,對所述初始對話處理模型進行訓練,獲得更新對話處理模型;
6、根據所述第一對話訓練樣本、所述正標簽、所述第二對話訓練樣本以及所述負標簽,對所述更新對話處理模型進行訓練,獲得目標對話處理模型。
7、根據本說明書實施例的第二方面,提供了一種對話方法,包括:
8、確定與目標對話領域關聯(lián)的輸入對話數(shù)據;
9、將所述輸入對話數(shù)據輸入對話處理模型,獲得與所述輸入對話數(shù)據對應的、與所述目標對話領域關聯(lián)的輸出對話數(shù)據,其中,所述對話處理模型根據上述對話處理模型訓練方法獲得。
10、根據本說明書實施例的第三方面,提供了一種對話處理模型訓練裝置,包括:
11、初始模型確定模塊,被配置為確定與目標對話領域關聯(lián)的初始對話處理模型,其中,所述初始對話處理模型,通過與所述目標對話領域關聯(lián)的初始對話訓練數(shù)據,對預訓練對話處理模型訓練獲得;
12、訓練數(shù)據確定模塊,被配置為根據所述初始對話處理模型在所述目標對話領域的應用數(shù)據,確定第一對話訓練數(shù)據以及第二對話訓練數(shù)據,其中,所述第一對話訓練數(shù)據包括第一對話訓練樣本以及所述第一對話訓練樣本對應的正標簽,所述第二對話訓練數(shù)據包括第二對話訓練樣本以及所述第二對話訓練樣本對應的負標簽;
13、更新模型獲得模塊,被配置為根據所述初始對話訓練數(shù)據以及所述第一對話訓練樣本,對所述初始對話處理模型進行訓練,獲得更新對話處理模型;
14、目標模型獲得模塊,被配置為根據所述第一對話訓練樣本、所述正標簽、所述第二對話訓練樣本以及所述負標簽,對所述更新對話處理模型進行訓練,獲得目標對話處理模型。
15、根據本說明書實施例的第四方面,提供了一種對話裝置,包括:
16、輸入確定模塊,被配置為確定與目標對話領域關聯(lián)的輸入對話數(shù)據;
17、輸出獲得模塊,被配置為將所述輸入對話數(shù)據輸入對話處理模型,獲得與所述輸入對話數(shù)據對應的、與所述目標對話領域關聯(lián)的輸出對話數(shù)據,其中,所述對話處理模型根據上述對話處理模型訓練方法獲得。
18、根據本說明書實施例的第五方面,提供了一種計算設備,包括:
19、存儲器和處理器;
20、其中,存儲器用于存儲計算機程序/指令,處理器用于執(zhí)行計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)上述對話處理模型訓練方法或上述對話方法的步驟。
21、根據本說明書實施例的第六方面,提供了一種計算機可讀存儲介質,其存儲有計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)上述對話處理模型訓練方法或上述對話方法的步驟。
22、根據本說明書實施例的第七方面,提供了一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)上述對話處理模型訓練方法或上述對話方法的步驟。
23、本說明書一個實施例提供的一種對話處理模型訓練方法,根據與目標對話領域關聯(lián)的初始對話處理模型在該目標對話領域的應用數(shù)據,確定與目標對話領域關聯(lián)性更強的第一對話訓練數(shù)據和第二對話訓練數(shù)據,之后,利用對應正標簽的第一對話訓練數(shù)據以及初始對話訓練數(shù)據再對初始對話處理模型進行訓練,通過增加正標簽的第一對話訓練數(shù)據,訓練獲得更新對話處理模型,相較于初始對話處理模型,增強了初始對話處理模型回答準確答案的能力,進一步的,根據第一對話訓練樣本、正標簽、第二對話訓練樣本以及負標簽,對上述獲得的更新對話處理模型進行進一步訓練,進一步提高了獲得的目標對話處理模型對輸入數(shù)據的正負判斷能力,并進一步提高了目標對話處理模型在實際應用中的回答準確性以及回答效果。
1.一種對話處理模型訓練方法,其特征在于,包括:
2.根據權利要求1所述的對話處理模型訓練方法,其特征在于,所述根據所述初始對話處理模型在所述目標對話領域的應用數(shù)據,確定第一對話訓練數(shù)據以及第二對話訓練數(shù)據之前,還包括:
3.根據權利要求2所述的對話處理模型訓練方法,其特征在于,所述部署所述初始對話處理模型,基于所述初始對話處理模型進行對話處理,獲得對話數(shù)據,包括:
4.根據權利要求1-3任意一項所述的對話處理模型訓練方法,其特征在于,所述根據所述初始對話處理模型在所述目標對話領域的應用數(shù)據,確定第一對話訓練數(shù)據以及第二對話訓練數(shù)據之前,還包括:
5.根據權利要求4所述的對話處理模型訓練方法,其特征在于,所述根據所述初始對話處理模型在所述目標對話領域的應用數(shù)據,確定第一對話訓練數(shù)據以及第二對話訓練數(shù)據,包括:
6.根據權利要求5所述的對話處理模型訓練方法,其特征在于,所述根據所述目標對話處理任務、以及所述初始對話處理模型在所述目標對話領域的應用數(shù)據,確定滿足所述模型訓練數(shù)據量的總對話訓練數(shù)據,包括:
7.根據權利要求6所述的對話處理模型訓練方法,其特征在于,所述從所述初始對話訓練數(shù)據中,選擇滿足所述模型訓練數(shù)據量的總對話訓練數(shù)據,包括:
8.根據權利要求6所述的對話處理模型訓練方法,其特征在于,所述根據所述目標對話處理任務,從所述初始對話處理模型在所述目標對話領域的應用數(shù)據中,篩選出初始對話訓練數(shù)據之后,還包括:
9.根據權利要求5所述的對話處理模型訓練方法,其特征在于,所述根據所述總對話訓練數(shù)據,確定所述第一對話訓練數(shù)據以及所述第二對話訓練數(shù)據,包括:
10.根據權利要求9所述的對話處理模型訓練方法,其特征在于,所述根據所述總對話訓練數(shù)據,確定所述第一對話訓練數(shù)據以及所述第二對話訓練數(shù)據之前,還包括:
11.根據權利要求10所述的對話處理模型訓練方法,其特征在于,所述根據所述第一數(shù)據量與所述第一樣本數(shù)量的匹配關系、以及所述第二數(shù)據量與所述第二樣本數(shù)量的匹配關系,調整所述第一對話訓練數(shù)據以及所述第二對話訓練數(shù)據,包括:
12.根據權利要求1所述的對話處理模型訓練方法,其特征在于,所述確定與目標對話領域關聯(lián)的初始對話處理模型,包括:
13.一種對話方法,其特征在于,包括:
14.根據權利要求13所述的對話方法,其特征在于,所述將所述輸入對話數(shù)據輸入對話處理模型,獲得與所述輸入對話數(shù)據對應的、與所述目標對話領域關聯(lián)的輸出對話數(shù)據,包括:
15.根據權利要求13所述的對話方法,其特征在于,所述確定與目標對話領域關聯(lián)的輸入對話數(shù)據,包括:
16.一種對話處理模型訓練裝置,其特征在于,包括:
17.一種對話裝置,其特征在于,包括:
18.一種計算設備,其特征在于,包括:
19.一種計算機可讀存儲介質,其特征在于,其存儲有計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)權利要求1-12任意一項所述對話處理模型訓練方法或者權利要求13-15任意一項所述對話方法的步驟。
20.一種計算機程序產品,其特征在于,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)權利要求1-12任意一項所述對話處理模型訓練方法或者權利要求13-15任意一項所述對話方法的步驟。