本發(fā)明涉及人工智能,尤其是涉及基于知識圖譜的軍事領(lǐng)域知識問答生成方法、計算機系統(tǒng)、可讀存儲介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、知識圖譜作為人類知識結(jié)構(gòu)化后的綜合性知識系統(tǒng),囊括了基本事實、普遍規(guī)則及關(guān)聯(lián)信息,廣泛應(yīng)用于信息檢索、智能推理與決策等先進技術(shù)領(lǐng)域。其最初的成功在于顯著提升了搜索引擎的效能,隨后逐步擴展到輔助問答、自然語言深度理解、個性化推薦等多元化應(yīng)用場景,展現(xiàn)出強大的價值潛力。
2、近來,人們對軍事領(lǐng)域知識高效獲取與應(yīng)用的需求急劇增加。知識圖譜憑借其獨特的知識組織與管理優(yōu)勢,已在該領(lǐng)域獲得實踐應(yīng)用。例如公開號為cn113806513a的中國專利申請,公開了一種基于軍事領(lǐng)域知識圖譜的問答系統(tǒng)構(gòu)建方法及系統(tǒng),展現(xiàn)了知識圖譜在軍事領(lǐng)域知識傳播中的積極作用。
3、盡管如此,面對日益增長的軍事領(lǐng)域知識需求的挑戰(zhàn),如何進一步促進非專業(yè)人士也能有效利用知識圖譜進行軍事領(lǐng)域知識探索,仍是當前亟待解決的課題。
技術(shù)實現(xiàn)思路
1、本發(fā)明基于現(xiàn)有的基于知識圖譜的軍事領(lǐng)域知識問答生成方法的不足,提出一種新的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,包括:知識圖譜形成步驟,形成軍事領(lǐng)域知識圖譜;初步圖譜檢索語句生成步驟,使用大模型對用戶問題進行自然語言處理,生成初步知識圖譜檢索語句;知識圖譜檢索步驟,根據(jù)所述初步知識圖譜檢索語句,在所述軍事領(lǐng)域知識圖譜中進行數(shù)據(jù)檢索,得到結(jié)果關(guān)系,并根據(jù)每一條所述結(jié)果關(guān)系構(gòu)建一份結(jié)果文檔;關(guān)鍵詞抽取與處理步驟,對所述用戶問題進行關(guān)鍵詞抽取處理,包括構(gòu)建圖模型,創(chuàng)建節(jié)點,并且將權(quán)重排列在前的前m個所述節(jié)點作為關(guān)鍵詞;節(jié)點得分計算與過濾步驟,將所述結(jié)果文檔和關(guān)鍵詞進行向量化處理,計算每份所述結(jié)果文檔和關(guān)鍵詞的匹配度得分,保留高相關(guān)性的所述結(jié)果文檔和節(jié)點;模板構(gòu)建與數(shù)據(jù)組裝步驟,基于所述高相關(guān)性的所述結(jié)果文檔和節(jié)點,構(gòu)建回答模板;智能問答生成步驟,將所述回答模板中的數(shù)據(jù)輸入生成模型,生成回答。
2、進一步的,所述方法的所述關(guān)鍵詞抽取與處理步驟還包括:對所述用戶問題進行分詞、過濾和標準化處理,并且在構(gòu)建所述圖模型時,創(chuàng)建邊,構(gòu)建圖的公式,調(diào)整軍事領(lǐng)域詞匯在所述圖模型中的權(quán)重。
3、進一步地,所述方法的所述關(guān)鍵詞抽取與處理步驟還包括,使用以下公式計算所述節(jié)點的權(quán)重:
4、
5、其中是節(jié)點的重要性得分,d是阻尼系數(shù),n是所述圖模型中對應(yīng)圖的全部所述節(jié)點的總數(shù),是節(jié)點的所有入邊的源節(jié)點集合,是節(jié)點和節(jié)點間的權(quán)重,是節(jié)點的出鏈數(shù)量,提取權(quán)重最高的前m個節(jié)點作為所述關(guān)鍵詞,其中,m大于等于1且小于等于10。
6、進一步的,所述方法的所述節(jié)點得分計算與過濾步驟還包括,通過bge向量模型對所述結(jié)果文檔和關(guān)鍵詞進行向量化處理,采用余弦相似度算法計算每份所述結(jié)果文檔和關(guān)鍵詞的相似度得分,將相似度得分在0.55以上的所述結(jié)果文檔和關(guān)鍵詞保留。
7、進一步的,所述方法還包括子節(jié)點關(guān)聯(lián)擴展步驟,在所述軍事領(lǐng)域知識圖譜中對所述結(jié)果文檔進行拓展查詢檢索,將檢索結(jié)果合并入所述結(jié)果文檔中,用于構(gòu)建所述回答模板。
8、進一步的,所述方法還包括匹配重排與置信度剔除步驟,對所述結(jié)果文檔和關(guān)鍵詞與所述用戶問題進行匹配度計算,并根據(jù)計算結(jié)果進行置信度剔除,保留高置信度的所述結(jié)果文檔作為最終輸出文檔,用于構(gòu)建所述回答模板。
9、進一步的,所述方法使用bm25算法進行所述匹配重排,將每個所述結(jié)果文檔對所述用戶問題的查詢計算bm25得分:
10、
11、其中,q表示是查詢,d是所述結(jié)果文檔,是特定詞在文檔d中出現(xiàn)的頻率,是所述結(jié)果文檔d的長度,表示是所有所述結(jié)果文檔的平均長度,和b是參數(shù),默認值=1.5和b=0.75,表示計算特定詞的逆文檔頻率,用于衡量特定詞在整個所述結(jié)果文檔集中的區(qū)分能力,計算方式如下:
12、
13、其中n是文檔總數(shù),是包含特定詞的所述結(jié)果文檔數(shù)。
14、進一步地,所述方法設(shè)置置信度閾值為0.75的bm25算法得分閾值,低于0.75分數(shù)的所述結(jié)果文檔剔除。
15、進一步地,所述方法的所述關(guān)鍵詞抽取與處理步驟中,還包括進行所述關(guān)鍵詞的擴展和同義詞替換處理。
16、進一步的,所述方法還包括反饋步驟,接受用戶對回答進行評價,根據(jù)所述評價優(yōu)化所述生成模型和所述軍事領(lǐng)域知識圖譜。
17、為解決上述問題,本發(fā)明還提供了計算機系統(tǒng),包括存儲器、處理器及存儲在存儲器上的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)如上所述方法的步驟。
18、為解決上述問題,本發(fā)明還提供了計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上所述方法的步驟。
19、為解決上述問題,本發(fā)明還提供了計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上所述方法的步驟。
20、本發(fā)明構(gòu)思了一種基于知識圖譜的軍事領(lǐng)域知識問答生成方法,與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案:1)減少人工干預,提高知識圖譜的準確性和效率;2)提高對軍事領(lǐng)域復雜數(shù)據(jù)的理解能力和檢索能力;3)通過智能問答系統(tǒng),根據(jù)用戶的問題,從構(gòu)建的知識圖譜中提取相關(guān)的信息,并以簡潔明了的方式呈現(xiàn)給用戶。
21、本發(fā)明的技術(shù)方案將相關(guān)技術(shù)有效地結(jié)合起來,幫助用戶(人們)更好地理解大量的軍事信息。以滿足軍事領(lǐng)域?qū)χR獲取和應(yīng)用的需求。通過融合知識圖譜的強大組織和關(guān)聯(lián)數(shù)據(jù)能力與先進的自然語言處理技術(shù),提升軍事領(lǐng)域信息查詢與分析的效率與準確性。
1.一種基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,所述關(guān)鍵詞抽取與處理步驟還包括:對所述用戶問題進行分詞、過濾和標準化處理,并且在構(gòu)建所述圖模型時,調(diào)整軍事領(lǐng)域詞匯在所述圖模型中的權(quán)重。
3.如權(quán)利要求2所述的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,所述關(guān)鍵詞抽取與處理步驟還包括,使用以下公式計算所述節(jié)點的權(quán)重:
4.如權(quán)利要求3所述的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,所述節(jié)點得分計算與過濾步驟還包括,通過bge向量模型對所述結(jié)果文檔和關(guān)鍵詞進行向量化處理,采用余弦相似度算法計算每份所述結(jié)果文檔和關(guān)鍵詞的相似度得分,將相似度得分在0.55以上的所述結(jié)果文檔和關(guān)鍵詞保留。
5.如權(quán)利要求4所述的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,還包括子節(jié)點關(guān)聯(lián)擴展步驟,在所述軍事領(lǐng)域知識圖譜中對所述結(jié)果文檔進行拓展查詢檢索,將檢索結(jié)果合并入所述結(jié)果文檔中,用于構(gòu)建所述回答模板。
6.如權(quán)利要求5所述的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,還包括匹配重排與置信度剔除步驟,對所述結(jié)果文檔和關(guān)鍵詞與所述用戶問題進行匹配度計算,并根據(jù)計算結(jié)果進行置信度剔除,保留高置信度的所述結(jié)果文檔作為最終輸出文檔,用于構(gòu)建所述回答模板。
7.如權(quán)利要求6所述的基于知識圖譜的軍事領(lǐng)域知識問答生成方法,其特征在于,使用bm25算法進行所述匹配重排,將每個所述結(jié)果文檔對所述用戶問題的查詢計算bm25得分,得分計算公式為:
8.一種計算機系統(tǒng),包括存儲器、處理器及存儲在存儲器上的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序以實現(xiàn)權(quán)利要求1至7任意一項所述基于知識圖譜的軍事領(lǐng)域知識問答生成方法的步驟。
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7任意一項所述基于知識圖譜的軍事領(lǐng)域知識問答生成方法的步驟。
10.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7任意一項所述基于知識圖譜的軍事領(lǐng)域知識問答生成方法的步驟。