1.一種文檔搜索方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中確定所述搜索文本在所述實體關(guān)系圖中對應(yīng)的實體和與所述實體關(guān)聯(lián)的關(guān)聯(lián)實體包括:
3.根據(jù)權(quán)利要求1所述的方法,其中利用語義特征提取網(wǎng)絡(luò)從所述搜索文本和所述候選文檔提取第一文本特征包括:
4.根據(jù)權(quán)利要求3所述的方法,所述候選文檔關(guān)鍵文本包括所述候選文檔的文檔標(biāo)題;所述基于所述搜索文本和所述候選文檔關(guān)鍵文本確定第一復(fù)合文本包括:將所述搜索文本和所述候選文檔關(guān)鍵文本進行文本拼接,將文本拼接的結(jié)果確定為第一復(fù)合文本。
5.根據(jù)權(quán)利要求1所述的方法,其中利用實體特征提取網(wǎng)絡(luò)從所述實體和所述關(guān)聯(lián)實體提取第一實體特征包括:
6.根據(jù)權(quán)利要求1所述的方法,其中基于所述第一文本特征和所述第一實體特征確定第一融合特征包括:
7.根據(jù)權(quán)利要求1所述的方法,所述經(jīng)訓(xùn)練的分類器利用訓(xùn)練集對分類器進行訓(xùn)練確定,所述分類器接收第一融合特征,并輸出分類結(jié)果,所述分類結(jié)果包括分到各個匹配等級的概率,所述匹配等級包括相互匹配和相互不匹配;其中利用經(jīng)訓(xùn)練的分類器基于所述第一融合特征確定所述搜索文本和所述候選文檔是否匹配包括:
8.根據(jù)權(quán)利要求7所述的方法,所述訓(xùn)練集包括多個訓(xùn)練樣本對,所述訓(xùn)練樣本對包括第一融合特征和其對應(yīng)的匹配等級,所述匹配等級是所述第一融合特征對應(yīng)的搜索文本和候選文檔之間的匹配等級;
9.根據(jù)權(quán)利要求1所述的方法,所述經(jīng)訓(xùn)練的分類器利用訓(xùn)練集對分類器進行訓(xùn)練確定,所述分類器接收第一融合特征,并輸出分類結(jié)果,所述分類結(jié)果包括分到各個匹配等級的概率,所述匹配等級包括相互高度匹配、相互一般匹配和相互不匹配;其中利用經(jīng)訓(xùn)練的分類器基于所述第一融合特征確定所述搜索文本和所述候選文檔是否匹配包括:
10.一種文檔搜索裝置,包括:
11.一種計算設(shè)備,包括:
12.一種計算機可讀存儲介質(zhì),其存儲有計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1-9中任一項所述的方法。
13.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1至9中任一項所述的方法的步驟。