本技術實施例涉及人工智能領域,更具體地涉及一種虛假圖像檢測方法及相關裝置。
背景技術:
1、隨著生成式人工智能技術的飛速發(fā)展,圖像等多媒體內容編輯已經變得愈發(fā)便捷和高效。然而,如同雙刃劍一般,生成式人工智能在極大地豐富了創(chuàng)意表達的可能性的同時,也催生了一系列不容忽視的風險與挑戰(zhàn),尤其是信息真實性與誤導性問題日益凸顯。該類技術可能會被惡意地用于生成虛假或誤導性的圖像,當前,主流的虛假圖像檢測方法主要依靠深度學習技術從大規(guī)模的標注數(shù)據中學習區(qū)分性特征來鑒別真假。首先,需要從互聯(lián)網上收集并清洗真實圖像,然后基于多種已知的圖像偽造算法或軟件制作大量逼真的虛假圖像樣本,最后基于構建的數(shù)據集訓練深度學習分類模型來區(qū)分真假。然而,這類對于已知的偽造方法上展現(xiàn)出卓越的檢測性能,但對于新型、未見過的偽造技術制作的數(shù)據時,其檢測性能則顯著下降。這是因為深度學習模型往往過度擬合于訓練數(shù)據中的模式,一旦出現(xiàn)新的偽造方式,則缺乏足夠的泛化性和適應性。因此,現(xiàn)有技術虛假圖像檢測的準確性較低。
技術實現(xiàn)思路
1、本技術實施例提供一種虛假圖像檢測方法及相關裝置,可以提高虛假圖像檢測的準確性。
2、第一方面,本技術實施例提供一種虛假圖像檢測方法,該方法包括:
3、獲取待檢測圖像;
4、基于目標特征編碼模型對所述待檢測圖像進行特征提取,得到所述待檢測圖像的目標圖像特征;
5、基于多層感知機分類模型和所述目標圖像特征對所述待檢測圖像進行圖像分類,得到第一圖像分類結果;
6、基于支持向量機分類模型和所述目標圖像特征對所述待檢測圖像進行圖像分類,得到第二圖像分類結果,其中,所述多層感知機分類模型基于第一圖像訓練集訓練得到,所述支持向量機分類模型基于第二圖像訓練集訓練得到,所述第二圖像訓練集為所述第一圖像訓練集的子集,所述第一圖像訓練集和所述第二圖像訓練集為不同的集合;
7、基于所述第一圖像分類和所述第二圖像分類結果確定所述待檢測圖像的目標圖像分類結果。
8、在一個實施方式中,所述虛假圖像檢測方法,包括:
9、獲取第一圖像訓練集,其中,所述第一圖像訓練集包括多個第一圖像樣本和對應的第一標注標簽,所述第一標注標簽為真實類別或者虛假類別;
10、基于所述第一圖像訓練集訓練初始特征編碼模型和第一初始分類模型,得到所述目標特征編碼模型和所述多層感知機分類模型;
11、從所述第一圖像訓練集中篩選出第二圖像訓練集;
12、凍結所述目標特征編碼模型,并基于所述第二圖像訓練集訓練第二初始分類模型,得到所述支持向量機分類模型。
13、在一個實施方式中,所述基于所述第一圖像訓練集訓練初始特征編碼模型和第一初始分類模型,得到所述目標特征編碼模型和所述多層感知機分類模型,包括:
14、將所述第一圖像訓練集中的多個第一圖像樣本輸入所述初始特征編碼模型,得到各個所述第一圖像樣本對應的樣本特征;
15、將各個所述第一圖像樣本對應的樣本特征輸入所述第一初始分類模型,得到模型分類結果;
16、基于各個所述第一圖像樣本的第一標注標簽和所述模型分類結果計算分類損失;
17、基于各個所述第一圖像樣本對應的樣本特征和所述第一圖像訓練集計算對比損失;
18、基于所述分類損失和所述對比損失確定總損失;
19、基于所述總損失迭代更新所述初始特征編碼模型和所述第一初始分類模型,得到所述目標特征編碼模型和多層感知機分類模型。
20、在一個實施方式中,所述從所述第一圖像訓練集中篩選出第二圖像訓練集,包括:
21、從所述第一圖像訓練集中屬于虛假類別的虛假圖像樣本中篩選得到虛假樣本集;
22、從所述第一圖像訓練集中屬于真實類別的真實圖像樣本中篩選得到真實樣本集;
23、合并所述真實樣本集和所述虛假樣本集,得到所述第二圖像訓練集。
24、在一個實施方式中,所述從所述第一圖像訓練集中屬于虛假類別的虛假圖像樣本中篩選得到虛假樣本集,包括:
25、將所述第一圖像訓練集中的所述虛假圖像樣本輸入所述目標特征編碼模型,得到所述虛假圖像樣本的虛假圖像特征;
26、將所述第一圖像訓練集中所有所述虛假圖像樣本的虛假圖像特征的平均值確定為虛假圖像平均特征;
27、分別計算各個所述虛假圖像特征與所述虛假圖像平均特征的特征相似度;
28、將與所述虛假圖像平均特征之間特征相似度從大到小排序靠前的第一預設數(shù)量的所述虛假圖像樣本確定為第一篩選樣本集,其中,第一預設數(shù)量小于所述第一圖像訓練集中虛假圖像樣本的數(shù)量;
29、在所述第一篩選樣本集中隨機抽取第二預設數(shù)量的所述虛假圖像樣本和對應的第一標注標簽作為所述虛假樣本集,其中,第二預設數(shù)量小于第一預設數(shù)量。
30、在一個實施方式中,所述第一圖像訓練集包括多個第一圖像樣本、多個所述第一圖像樣本對應的第一標注標簽以及屬于虛假類別的所述第一圖像樣本的第二標注標簽,所述第二標注標簽為多種偽造方式中的一個,所述凍結所述目標特征編碼模型,并基于所述第二圖像訓練集訓練第二初始分類模型,得到所述支持向量機分類模型,包括:
31、獲取第三圖像訓練集,其中,所述第三圖像訓練集包括多個第二圖像樣本、多個所述第二圖像樣本對應的第一標注標簽以及屬于虛假類別的所述第二圖像樣本的第二標注標簽,所述第三圖像訓練集中的所述第二標注標簽與所述第一圖像訓練集的第二標注標簽不同;
32、合并所述第二圖像訓練集和所述第三圖像訓練集,得到第四圖像訓練集,所述第四圖像訓練集中圖像樣本的數(shù)量少于第一圖像訓練集;
33、凍結所述目標特征編碼模型,并基于所述第四圖像訓練集訓練所述第二初始分類模型,得到所述支持向量機分類模型。
34、在一個實施方式中,所述凍結所述目標特征編碼模型,并基于所述第四圖像訓練集訓練所述第二初始分類模型,得到所述支持向量機分類模型,包括:
35、將所述第四圖像訓練集等分為k個子集合;
36、將k個子集合分別確定為驗證集,將k個子集合除所述驗證集之外的子集合確定為目標訓練集;
37、獲取所述第二初始分類模型的多組候選訓練參數(shù);
38、凍結所述目標特征編碼模型,將所述候選訓練參數(shù)作為所述第二初始分類模型的固定參數(shù),并基于所述第一圖像訓練集訓練所述第二初始分類模型,得到所述目標訓練集對應的第三初始分類模型;
39、基于所述目標訓練集對應的所述驗證集驗證所述目標訓練集對應的第三初始分類模型,得到所述目標訓練集對應的所述第三初始分類模型的模型驗證參數(shù);
40、基于多個所述目標訓練集對應的所述第三初始分類模型的模型驗證參數(shù)確定所述候選訓練參數(shù)的總驗證參數(shù);
41、將所述總驗證參數(shù)滿足預設條件的所述候選訓練參數(shù)確定為目標訓練參數(shù);
42、凍結所述目標特征編碼模型,將所述目標訓練參數(shù)作為所述第二初始分類模型的固定參數(shù),并基于所述第四圖像訓練集訓練所述第二初始分類模型,得到所述支持向量機分類模型。
43、第二方面,本技術實施例提供一種虛假圖像檢測裝置,具有實現(xiàn)對應于上述第一方面提供的虛假圖像檢測方法的功能。所述功能可以通過硬件實現(xiàn),也可以通過硬件執(zhí)行相應的軟件實現(xiàn)。硬件或軟件包括一個或多個與上述功能相對應的模塊,所述模塊可以是軟件和/或硬件。
44、第三方面,本技術實施例提供一種計算機可讀存儲介質,其包括指令,當其在計算機上運行時,使得計算機執(zhí)行如第一方面所述的虛假圖像檢測方法。
45、第四方面,本技術實施例提供一種計算設備,包括存儲器,處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其中,所述處理器執(zhí)行所述計算機程序時實現(xiàn)第一方面所述的虛假圖像檢測方法。
46、第五方面,本技術實施例提供一種芯片,該芯片中包括與終端設備的收發(fā)器耦合的處理器,用于執(zhí)行本技術實施例第一方面提供的技術方案。
47、第六方面,本技術實施例提供一種芯片系統(tǒng),該芯片系統(tǒng)包括處理器,用于支持終端設備實現(xiàn)上述第一方面中所涉及的功能。
48、在一種可能的設計中,上述芯片系統(tǒng)還包括存儲器,該存儲器用于保存終端必需的程序指令和數(shù)據。該芯片系統(tǒng)可以由芯片構成,也可以包含芯片和其他分立器件。
49、第七方面,本技術實施例提供一種包含指令的計算機程序產品,當該計算機程序產品在計算機上運行時,使得計算機執(zhí)行上述第一方面所述的虛假圖像檢測方法。
50、相較于現(xiàn)有技術,本技術實施例中,獲取待檢測圖像;基于目標特征編碼模型對待檢測圖像進行特征提取,得到待檢測圖像的目標圖像特征;基于多層感知機分類模型和目標圖像特征對待檢測圖像進行圖像分類,得到第一圖像分類結果;基于支持向量機分類模型和目標圖像特征對待檢測圖像進行圖像分類,得到第二圖像分類結果;其中,多層感知機分類模型基于第一圖像訓練集訓練得到,支持向量機分類模型基于第二圖像訓練集訓練得到,第二圖像訓練集為第一圖像訓練集的子集,第一圖像訓練集和第二圖像訓練集為不同的集合;基于第一圖像分類和第二圖像分類結果確定待檢測圖像的目標圖像分類結果。本技術基于多層感知機的分類器和支持向量機的分類器的結合,預訓練的基于多層感知機的分類器能夠保持對已知偽造方式的數(shù)據的檢測性能支持向量機的分類器能提高對未知偽造方式的數(shù)據的檢測性能,多層感知機分類模型基于第一圖像訓練集訓練得到,支持向量機分類模型基于第二圖像訓練集訓練得到,第二圖像訓練集為第一圖像訓練集的子集,綜合多層感知機的分類器和支持向量機的分類器的預測結果,可以提高虛假圖像檢測的準確性。