日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法及裝置

文檔序號:39728327發(fā)布日期:2024-10-22 13:31閱讀:2來源:國知局
用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法及裝置

本公開涉及信息,尤其涉及用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法及裝置。


背景技術(shù):

1、知識圖譜已成為人工智能技術(shù)研發(fā)的重要支柱。它具備了強大的語義處理和數(shù)據(jù)關(guān)聯(lián)能力,為智能化發(fā)展打下了堅實的基礎(chǔ)。資源描述框架(resource?descriptionframework,rdf)成為了知識圖譜的事實標(biāo)準(zhǔn),并得到廣泛應(yīng)用。rdf模型使用類似圖形的數(shù)據(jù)結(jié)構(gòu)以可擴展的方式來描述萬維網(wǎng)上的資源以及資源之間相互關(guān)系。相應(yīng)地,萬維網(wǎng)聯(lián)盟(world?wide?web?consortium,w3c)提出了sparql查詢語言作為rdf模型的標(biāo)準(zhǔn)圖查詢語言,用于從rdf圖中檢索數(shù)據(jù)。正則路徑查詢是用于檢查兩個頂點之間是否存在一條路徑,且這條路徑必須符合使用正則表達(dá)式指定的路徑模式。由于正則路徑查詢的表達(dá)性很高,很多查詢語言都試圖實現(xiàn)這個特性,比如g、pgql,sparql也通過引入屬性路徑(propertypath)實現(xiàn)正則路徑查詢。近些年正則路徑查詢被廣泛研究和討論,已經(jīng)成為一個焦點問題。

2、近年來,知識圖譜規(guī)模以前所未有的速度增長,包含數(shù)百萬個頂點(106)和數(shù)億條邊(108)的知識圖譜已經(jīng)常見。如dbpedia、yago和freebase等,影響著越來越多的領(lǐng)域。管理和查詢?nèi)绱她嫶蟮闹R圖譜帶來了巨大的挑戰(zhàn)。為解決這些挑戰(zhàn),過去二十年開發(fā)了各種三元組存儲系統(tǒng),并開發(fā)了多個基準(zhǔn)測試來評估和改進(jìn)它們的性能。盡管許多現(xiàn)有基準(zhǔn)測試對通用的sparql查詢有用,但目前還缺乏針對正則路徑查詢(rpqs)設(shè)計的基準(zhǔn)測試。但現(xiàn)有的基準(zhǔn)測試未能解決rpqs的獨特性和性能需求,如模式匹配和路徑遍歷,全面評估三元組存儲系統(tǒng)處理rpq語句的能力方面存在空白。

3、sp2bench是一個針對sparql查詢性能的基準(zhǔn)測試框架?;鶞?zhǔn)測試基于dblp場景,包括數(shù)據(jù)生成器和一組精心設(shè)計的基準(zhǔn)查詢。通過數(shù)據(jù)生成器支持創(chuàng)建類似于數(shù)據(jù)庫系統(tǒng)和邏輯編程(dblp)的大型rdf文檔,反映了原始dblp數(shù)據(jù)集中遇到的關(guān)鍵特征和社會世界分布。生成的文檔涵蓋各種rdf構(gòu)造,如空白節(jié)點。同時設(shè)計了17個有意義的基準(zhǔn)查詢,涵蓋了最重要的sparql構(gòu)造和操作符組合,同時在復(fù)雜性和結(jié)果大小等特征上有所變化。這些查詢經(jīng)過深入研究數(shù)據(jù)特征的設(shè)計,可以預(yù)測查詢對sparql引擎所帶來的挑戰(zhàn),有助于解釋基準(zhǔn)測試結(jié)果。通過數(shù)據(jù)生成和查詢設(shè)計,sp2bench提供了全面的sparql性能評估框架,旨在測試sparql引擎在不同情境下可能面臨的挑戰(zhàn),并為引擎性能的改進(jìn)提供支持。

4、lubm是一個針對網(wǎng)絡(luò)本體語言(owl)知識庫系統(tǒng)的基準(zhǔn)測試工具。提供了一個針對大規(guī)模owl應(yīng)用的合成數(shù)據(jù)集,可擴展到任意大小,具有代表性的大學(xué)領(lǐng)域本體論。這些數(shù)據(jù)集反映了語義網(wǎng)領(lǐng)域的特殊概念和結(jié)構(gòu),如類和屬性,旨在模擬真實語義網(wǎng)系統(tǒng)中的數(shù)據(jù)。同時包含14個具有多種屬性的查詢,旨在評估系統(tǒng)對不同類型查詢的回答能力。通過比較系統(tǒng)在回答這些查詢時的性能,可以評估系統(tǒng)的推理能力、存儲機制和查詢響應(yīng)時間等方面的表現(xiàn)。

5、作為主要的導(dǎo)航查詢形式,正則路徑查詢在知識圖領(lǐng)域引起了相當(dāng)大的關(guān)注,近些年被廣泛研究和討論,已經(jīng)成為一個焦點問題。目前所有的測試基準(zhǔn)都不是針對正則路徑查詢而設(shè)計的,因而不能很好的反應(yīng)rpqs的獨特性和性能需求,如模式匹配和路徑遍歷,全面評估三元組存儲系統(tǒng)處理rpq語句的能力方面存在空白。


技術(shù)實現(xiàn)思路

1、為解決現(xiàn)有問題,本公開提供一種用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法及裝置、終端和存儲介質(zhì)。

2、本公開采用以下的技術(shù)方案。

3、本公開的實施例提供一種用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,所述用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法包括:通過數(shù)據(jù)生成器基于目標(biāo)三元組存儲系統(tǒng)創(chuàng)建模擬真實世界的圖結(jié)構(gòu)數(shù)據(jù);通過基準(zhǔn)測試查詢集對所述圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)查詢,得到查詢結(jié)果,其中,所述基準(zhǔn)測試查詢集覆蓋正則路徑查詢中的路徑遍歷模式、復(fù)雜性級別和操作符的各種組合;基于所述查詢結(jié)果對所述目標(biāo)三元組存儲系統(tǒng)進(jìn)行評估。

4、本公開的另一實施例提供了一種用于知識圖譜的正則路徑查詢的基準(zhǔn)測試裝置,所述配置裝置包括:數(shù)據(jù)生成模塊,配置為通過數(shù)據(jù)生成器基于目標(biāo)三元組存儲系統(tǒng)創(chuàng)建模擬真實世界的圖結(jié)構(gòu)數(shù)據(jù);數(shù)據(jù)查詢模塊,配置為通過基準(zhǔn)測試查詢集對所述圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)查詢,得到查詢結(jié)果,其中,所述基準(zhǔn)測試查詢集覆蓋正則路徑查詢中的路徑遍歷模式、復(fù)雜性級別和操作符的各種組合;結(jié)果評估模塊,配置為基于所述查詢結(jié)果對所述目標(biāo)三元組存儲系統(tǒng)進(jìn)行評估。

5、本公開的基準(zhǔn)測試查詢集覆蓋正則路徑查詢中的路徑遍歷模式、復(fù)雜性級別和操作符的各種組合,解決了rdf系統(tǒng)中的rpq的獨特需求,可以全面評估rpq算法的效率和性能,從而可以揭示當(dāng)前rpq算法中的缺陷以及未來優(yōu)化的方向。



技術(shù)特征:

1.一種用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法包括:

2.根據(jù)權(quán)利要求1所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述圖結(jié)構(gòu)數(shù)據(jù)符合冪律分布。

3.根據(jù)權(quán)利要求1所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,創(chuàng)建模擬真實世界的圖結(jié)構(gòu)數(shù)據(jù)包括:每隔n年進(jìn)行數(shù)據(jù)插入,n根據(jù)數(shù)據(jù)規(guī)模自定義。

4.根據(jù)權(quán)利要求1所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述數(shù)據(jù)生成器提供了用于確定三元組數(shù)量的參數(shù),并且具有平臺無關(guān)性和可擴展性。

5.根據(jù)權(quán)利要求1所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述基準(zhǔn)測試查詢集包括第一查詢、第二查詢、第三查詢、第四查詢、第五查詢、第六查詢、第七查詢、第八查詢、第九查詢、第十查詢和第十一查詢;

6.根據(jù)權(quán)利要求5所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述第一查詢包括第一子查詢、第二子查詢和第三子查詢,所述第一子查詢用于測試引擎如何處理深層遞歸關(guān)系,所述第二子查詢涉及三元組的多個連接,所述第三子查詢從連接機構(gòu)與其存檔的文章的篩選開始。

7.根據(jù)權(quán)利要求5所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述第二查詢包括第四子查詢、第五子查詢和第六子查詢,所述第四子查詢用于測試基本屬性檢索的效率,所述第五子查詢增加檢索維度,所述第六子查詢添加屬性,以評估引擎處理復(fù)雜檢索的能力。

8.根據(jù)權(quán)利要求5所述的用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法,其特征在于,所述第四查詢包括第七子查詢、第八子查詢和第九子查詢,所述第七子查詢用于評估引擎在無限遞歸遍歷和大型數(shù)據(jù)集上的處理能力,所述第八子查詢通過跟蹤共同作者路徑并考慮層次前輩關(guān)系,增加了查詢的復(fù)雜性,以檢驗系統(tǒng)對分層數(shù)據(jù)的管理能力,所述第九子查詢用于評估執(zhí)行非零長度路徑遍歷的效率。

9.一種用于知識圖譜的正則路徑查詢的基準(zhǔn)測試裝置,其特征在于,所述用于知識圖譜的正則路徑查詢的基準(zhǔn)測試裝置包括:


技術(shù)總結(jié)
本公開提供用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法及裝置。用于知識圖譜的正則路徑查詢的基準(zhǔn)測試方法包括:通過數(shù)據(jù)生成器基于目標(biāo)三元組存儲系統(tǒng)創(chuàng)建模擬真實世界的圖結(jié)構(gòu)數(shù)據(jù);通過基準(zhǔn)測試查詢集對圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)查詢,得到查詢結(jié)果,其中,基準(zhǔn)測試查詢集覆蓋正則路徑查詢中的路徑遍歷模式、復(fù)雜性級別和操作符的各種組合;基于查詢結(jié)果對目標(biāo)三元組存儲系統(tǒng)進(jìn)行評估。本公開的基準(zhǔn)測試查詢集覆蓋正則路徑查詢中的路徑遍歷模式、復(fù)雜性級別和操作符的各種組合,解決了RDF系統(tǒng)中的RPQ的獨特需求,可以全面評估RPQ算法的效率和性能,從而可以揭示當(dāng)前RPQ算法中的缺陷以及未來優(yōu)化的方向。

技術(shù)研發(fā)人員:王鑫,馬夢露,王惠
受保護的技術(shù)使用者:天津大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1