日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

依照自然語言查詢進行文獻檢索的系統(tǒng)和方法

文檔序號:6556747閱讀:194來源:國知局
專利名稱:依照自然語言查詢進行文獻檢索的系統(tǒng)和方法
技術領域
本發(fā)明涉及依照自然語言查詢進行文獻檢索的系統(tǒng)。特別地,本發(fā)明涉及適合于向用戶提供多個事項查詢的檢索結(jié)果的用于對文獻進行檢索的系統(tǒng)和方法。
背景技術
常規(guī)地,眾所周知,一種系統(tǒng)(文獻檢索系統(tǒng))用于依照用戶的檢索請求(查詢)從數(shù)據(jù)庫檢索符合所述檢索請求的文獻(文獻數(shù)據(jù))。關鍵字或自然語言被用于所述檢索請求。例如,已經(jīng)對其應用了在日本專利申請公開7-182373(以后稱為現(xiàn)有技術)中描述的技術的文獻檢索系統(tǒng)被認為是這種類型的文獻檢索系統(tǒng)?,F(xiàn)有技術的特征在于,檢索到的文獻的摘要被作為檢索結(jié)果生成,并且所述摘要與所述文獻(原始文獻)一起被提供給用戶。根據(jù)現(xiàn)有技術,用戶可以容易地從提供的摘要中判斷與該摘要一起提供的原始文獻是否基于本人的意愿。
然而,在上述的現(xiàn)有技術中,沒有假設通過利用自然語言(問句)的用戶查詢對多個事項(用戶感興趣的事項)進行查詢。存在一種可能性,如果在查詢中包括諸如“講解XX和YY”的兩個或多個事項,多個單獨的文獻(命中文獻(hit document))或摘要被當作檢索結(jié)果獲取。
例如,當查詢諸如“講解行李的顏色和制造商”的兩個(多個)事項的查詢語句時,利用上面描述的現(xiàn)有技術,可以獲得如下的命中文獻a)包括所有單詞“行李”、“顏色”以及“制造商”的文獻;b)包括單詞“行李”與“顏色”的文獻;c)包括單詞“顏色”與“制造商”的文獻;以及d)包括單詞“行李”與“制造商”的文獻。
在此,盡管可能找到落入上述a)項的文獻,但不能總是找到這樣的文獻。例如,在一些情況下,沒有找到落入上述a)項的文獻,而只能找到落入b)和d)項的文獻。在這種情況下,落入b)和d)項的文獻被作為分離的信息項分別提供。然而,作為問題的答案,所提供的這些單項的信息是不夠的。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種系統(tǒng)和方法,其用于向用戶提供能夠闡明單個詞語(term)查詢的相互關系的檢索結(jié)果,所述查詢與來自用戶的查詢多個事項的問句相關。
根據(jù)本發(fā)明的實施例,提供了一種用于依照自然語言查詢進行文獻檢索的系統(tǒng)。所述系統(tǒng)包括第一界面,用于接受以自然語言表示的用戶指定的第一問句;問題分析裝置,用于分析通過所述第一界面接受的所述第一問句,當所述第一問句查詢多個事項時,所述問題分析裝置生成多個第二問句,該第二文句用于對來自所述第一問句的所述多個事項中的每一個單獨地進行查詢;搜索引擎,其被配置為根據(jù)由所述問題分析裝置生成的所述多個第二問句,通過索引檢索從詞法索引數(shù)據(jù)庫(morphological indexdatabase)檢索與由所述多個第二問句查詢的各個事項相匹配的文獻,所述詞法索引數(shù)據(jù)庫存儲多篇文獻的詞法分析結(jié)果作為索引;以及第二界面,用于向用戶提供所述第一問題的檢索結(jié)果,在所述檢索結(jié)果中反映了通過所述搜索引擎的所述多個第二問句的文獻檢索的結(jié)果。


所述附圖,其被并入并且構(gòu)成本說明書的一部分,與上面給出的一般性描述以及下面給出的實施例的詳細描述一起,用于解釋本發(fā)明的原理。
圖1是框圖,示出了根據(jù)本發(fā)明實施例的文獻檢索系統(tǒng)的構(gòu)造;圖2是流程圖,示出了在本實施例中通過問題分析單元13的問題分析處理的程序,所述處理包括問句生成處理;
圖3是示圖,示出了在本實施例中用戶指定的問句Q的例子;圖4A和4B是示圖,分別示出了從問句Q生成的問句Q1和問句Q2的例子;圖5A和5B是示圖,分別示出了作為問句Q1的檢索結(jié)果的命中文獻D1和文獻摘要A1的例子;圖6A和6B是示圖,分別示出了作為問句Q2的檢索結(jié)果的命中文獻D2和文獻摘要A2的例子;圖7是示圖,示出了問句Q1和Q2的檢索結(jié)果已經(jīng)被互相聯(lián)系起來的例子;圖8A和8B是示圖,分別示出了當已獲取了作為問句Q1的檢索結(jié)果的命中文獻D1a和命中文獻D1b時,命中文獻D1a和文獻摘要A1a的例子;圖8C和8D是示圖,分別示出了當已獲取了作為問句Q1的檢索結(jié)果的命中文獻D1a和D1b時,命中文獻D1b和文獻摘要A1b的例子;圖9A和9B是示圖,分別示出了當已獲取了作為問句Q2的檢索結(jié)果的命中文獻D2a和命中文獻D2b時,命中文獻D2a和文獻摘要A2a的例子;圖9C和9D是示圖,分別示出了當已獲取了作為問句Q2的檢索結(jié)果的命中文獻D2a和命中文獻D2b時,命中文獻D2b和文獻摘要A2b的例子;以及圖10是示圖,示出了在本實施例中應用的檢索請求/調(diào)整屏幕的例子。
具體實施例方式
下面將參照附圖描述本發(fā)明的實施例。圖1是框圖,其示出了根據(jù)本發(fā)明實施例的文獻檢索系統(tǒng)的結(jié)構(gòu)。所述文獻檢索系統(tǒng)被提供為用于依照用戶的請求(查詢)進行自然語言檢索的系統(tǒng)。所述文獻檢索系統(tǒng)包括用戶界面11,檢索/響應服務器12,問題分析單元13,詞法分析單元14,詞法搜索引擎15,詞法索引數(shù)據(jù)庫16,摘要生成單元17,連接單元18以及調(diào)整信息存儲單元19。
用戶界面11包括條件輸入界面111,結(jié)果顯示界面112以及連接調(diào)整界面(concatenation tuning interface)113。條件輸入界面(第一界面)111具有將基于用戶的檢索請求的,例如,自然語言查詢(即,問句)的檢索請求作為檢索條件輸入的界面功能。結(jié)果顯示界面(第二界面)112具有響應于檢索請求向用戶提供檢索結(jié)果的界面功能。連接調(diào)整界面(第三界面)113具有后面描述的連接調(diào)整功能。在本實施例中,用戶界面11被包括在文獻檢索系統(tǒng)中。然而,所述用戶界面11也可以獨立于所述文獻檢索系統(tǒng)而被提供。例如,用戶界面11可以被包括在經(jīng)由通信線路(例如,網(wǎng)絡)連接到圖1所示的文獻系統(tǒng)的客戶終端中。
檢索/響應服務器12傳送指示由用戶界面11輸入(接受)的檢索請求的問句到用于依照所述問句執(zhí)行檢索的問題分析單元13。檢索/響應服務器12使得用戶界面11向用戶提供摘要或文獻,作為檢索請求的響應。所述摘要由摘要生成單元17生成。上述提供給用戶的文獻是由連接單元18生成的新文獻,例如,在其中已經(jīng)將摘要和檢索的文獻互相連接起來的新文獻。
問題分析單元13通過利用詞法分析單元14對問句執(zhí)行詞法分析和語義分析。當所分析的問句是用于查詢多個事項的問句(第一問句)時,問題分析單元13生成用于對來自所述問句的多個事項中的各個事項進行獨立地查詢的多個問句(第二問句)。
詞法分析單元14對從問題分析單元13請求的問句執(zhí)行詞法分析。詞法搜索引擎15對由問題分析單元13生成的每一個問句進行詞法(索引)檢索。利用構(gòu)成相應問句的語素,參照詞法索引數(shù)據(jù)庫16進行所述詞法檢索。數(shù)據(jù)庫16存儲關于多篇文獻的信息,所述文獻是通過詞法搜索引擎15進行檢索的目標。更詳細地,數(shù)據(jù)庫16存儲上述的多篇文獻的詞法分析結(jié)果作為索引(詞法索引)。所述詞法索引的每一個為由多篇文獻的詞法分析和語義分析所提取的每個語素作準備。所述詞法索引包括關于存在相應語素的所有文獻的文獻信息。所述文獻信息包括指示每一篇存在相應語素的文獻以及在每篇文獻中的所述語素的位置的信息。因此,詞法搜索引擎15獲取對應于所述問句的檢索結(jié)果,即,通過利用存儲在數(shù)據(jù)庫16中的詞法索引對每一個問句進行詞法檢索而對于所述問句命中的文獻。
摘要生成單元17利用詞法分析單元14對由詞法搜索引擎15檢索到的文獻,執(zhí)行詞法分析和語義分析。摘要生成單元17使得所述檢索到的文獻的詞法分析和語義分析的結(jié)果與對應于所述文獻的問句的詞法分析和語義分析的結(jié)果相關聯(lián)。摘要生成單元17基于這種關聯(lián)從檢索到的文獻生成所述文獻的摘要。該摘要可以被視為問句的檢索結(jié)果,其與用于生成摘要的文獻相似,即,作為所述問句的檢索結(jié)果而獲得的文獻。
連接單元18,基于對于由問題分析單元13生成的問句(第二問句)而檢索的文獻(命中文獻),以及從所述文獻生成的摘要,生成新文獻(檢索結(jié)果文獻)。此檢索結(jié)果文獻是通過連接文獻或摘要(即,檢索結(jié)果)生成的,所述文獻或摘要對應于多個生成的問句(即,不同的問句)。如此,從對應于多個生成的問句(第二問句)的詞法搜索引擎15和摘要生成單元17的檢索結(jié)果,連接單元18生成新的文獻,在其中連接了對應于所述多個問句的檢索結(jié)果。調(diào)整信息存儲單元19存儲調(diào)整信息,所述調(diào)整信息包括由連接單元18進行的連接處理的條件(連接條件)。
可以通過這樣的方式獲得用戶界面11,檢索/響應服務器12,問題分析單元13,詞法分析單元14,詞法搜索引擎15,摘要生成單元17以及連接單元18,例如,計算機讀取和執(zhí)行存儲在計算機的外部存儲單元的具體軟件程序。當所述程序被預先存儲在計算機可讀存儲介質(zhì)中時,它可以是分布式的。另外,可以經(jīng)由網(wǎng)絡下載所述程序。
現(xiàn)在,將描述圖1所示的文獻檢索系統(tǒng)的檢索處理。首先,假定檢索請求/調(diào)整屏幕由在客戶終端的顯示單元上的用戶界面11的條件輸入界面111顯示。所述檢索請求/調(diào)整屏幕被提供為圖形用戶界面屏幕,并且正如后面所述包括問句輸入?yún)^(qū)F1(參照圖10)。通過利用所述客戶終端,用戶能夠在檢索請求/調(diào)整屏幕上的問句輸入?yún)^(qū)F1中進行輸入自然語言的問句的操作。
現(xiàn)在假定,通過輸入問句的操作,用戶已經(jīng)根據(jù)由所述問句指示的檢索條件向圖1所示的文獻檢索系統(tǒng)請求了檢索(自然語言檢索)。條件輸入界面111依照用戶的問句輸入操作從客戶終端輸入問句。條件輸入界面111接受輸入的問句作為使用自然語言的用戶查詢(檢索請求)。條件輸入界面111將這個問句傳送到檢索/響應服務器12。
已經(jīng)從條件輸入界面111接收到所述問句的檢索/響應服務器12,傳送所述問句到用于依照所述問句執(zhí)行自然語言檢索的問題分析單元13。已經(jīng)從檢索/響應服務器12接收到所述問句的問題分析單元13,傳送所述問句到詞法分析單元14,從而向所述單元14請求所述問句的詞法分析。如此,詞法分析單元14對從問題分析單元13傳送的問句進行詞法分析,并且以單詞為單位劃分所述問句。詞法分析單元14向問句分析單元13返回所述問句的詞法分析結(jié)果。
問題分析單元13通過利用由詞法分析單元14獲得的詞法分析結(jié)果來分析所述問句的含義,所述詞法分析結(jié)果與從檢索/響應服務器12接收的問句有關。如此,問題分析單元13通過利用詞法分析單元14,對從檢索/響應服務器12接收的問句執(zhí)行詞法分析和語義分析。問題分析單元13基于所述問句的詞法分析和語義分析的結(jié)果,確定所述問句是否查詢多個事項。
如果上述問句為用于查詢多個事項的問句(第一問句),問題分析單元13生成多個問句(第二問句),其用于對來自所述第一問句的多個事項中的各個事項單獨地進行查詢。即,所述多個生成的第二問句被生成為每一個查詢一個事項的問句。問題分析單元13將從所述第一問句生成的多個第二問句傳送到詞法搜索引擎15,從而由所述引擎15基于所述多個第二問句的每一個,進行詞法檢索。
詞法搜索引擎15基于從用戶指定的第一問句生成的多個第二問句中的每一個執(zhí)行檢索。也就是說,詞法搜索引擎15利用存儲在詞法索引數(shù)據(jù)庫16中的詞法索引,從所述數(shù)據(jù)庫16檢索符合所述多個第二問句的每一個的文獻(命中文獻)。這時,包括了所有包含在所述問句中的單詞的文獻可以被定義為命中文獻。此外,包括了任何一個包含在所述問句中的單詞的文獻可以被定義為命中文獻。
詞法搜索引擎15傳送與所述第二問句相匹配的命中文獻到摘要生成單元17和連接單元18,作為所述多個第二問句的詞法分析結(jié)果。詞法搜索引擎15還向摘要生成單元17傳送與所述多個第二問句有關的由問題分析單元13獲得的詞法分析和語義分析的結(jié)果。
接收到了來自詞法搜索引擎15的所述多個第二問句的檢索結(jié)果,摘要生成單元17執(zhí)行下面描述的摘要生成處理。首先,摘要生成單元17利用詞法分析單元14對相關于所述多個第二問句的命中文獻進行詞法分析和語義分析。摘要生成單元17對相關于所述多個第二問句的命中文獻的每一篇進行下面的比較和相關。摘要生成單元17將所述命中文獻的詞法分析和語義分析的結(jié)果與所述第二問句的詞法分析和語義分析的結(jié)果進行比較和相關(第二問句對應與所述命中文獻)。摘要生成單元17通過對每篇命中文獻的這種比較和相關,在所述命中文獻中指定適用于摘要的部分,來生成每篇命中文獻的摘要。
現(xiàn)在,將給出關于通過摘要生成單元17的進行摘要生成的詳細描述。在本實施例中,可以被指定為摘要的文獻部分被稱為目標范圍(targetrange)。摘要生成單元17將命中文獻劃分為多個文獻部分,例如,以逐段為基礎,以逐個換行為基礎,或以表示句子結(jié)束的逐個符號為基礎。摘要生成單元17將所述劃分的文獻部分的每一個處理為目標范圍。摘要生成單元17以逐個范圍為基礎,將相應文獻部分的詞法分析和語義分析的結(jié)果與相應第二問句的詞法分析和語義分析的結(jié)果進行比較和相關。
通過這種比較和相關,摘要生成單元17為相關于第二問句的每篇命中文獻,指定與所述第二問句最接近的范圍。摘要生成單元17在為每篇命中文獻所指定的范圍中生成文獻部分(即,至少為命中文獻的一部分),作為每篇命中文獻的摘要。相似地,摘要生成單元17生成與所述多個第二問句中的余下的一個(或一些)相關的一篇命中文獻(或多篇命中文獻)的摘要(或多條摘要)。摘要生成單元17將相關于所述多個第二問句的命中文獻的摘要傳送到檢索/響應服務器12和連接單元18,作為所述多個第二問句的檢索結(jié)果。
連接單元18通過利用由詞法搜索引擎15傳送的所述多個第二問句的檢索結(jié)果(命中文獻),以及由摘要生成單元17傳送的所述多個第二問句的檢索結(jié)果(所述命中文獻的摘要),執(zhí)行連接處理。連接單元18依照由存儲在調(diào)整信息存儲單元19中的調(diào)整條件所表示的連接條件,執(zhí)行此連接處理。
在通過連接單元18進行的連接處理中,響應于從所述用戶指定的第一問句生成的多個第二問句中的每一個,選擇所述檢索結(jié)果(例如,命中文獻的摘要)中的相應一個。于是,已經(jīng)與所述選擇的檢索結(jié)果相連接的一篇文獻被當作所述第一問句的檢索結(jié)果(檢索結(jié)果文獻)而生成。依照通過連接單元18的連接處理而生成的文獻,被經(jīng)由檢索/響應服務器12傳送到所述用戶界面11的結(jié)果顯示界面112,以及通過界面112向用戶提供傳送的文獻。
現(xiàn)在,參照在圖2中示出的流程圖,將給出問題分析處理的詳細描述,所述處理包括通過問題分析單元13進行的問句生成處理。首先,問題分析單元13利用詞法分析單元14對從檢索/響應服務器12接收的第一問句執(zhí)行詞法分析(步驟S1)。在步驟S1中,詞法分析單元14利用詞法分析單元14對于第一問句的的詞法分析結(jié)果,分析所述問句的含義。所述語義分析允許詞法分析單元14,關于滿足預定條件的特定單詞,指定該單詞的含義(例如,時間、人物、地點等等)。
接下來,問題分析單元13將包括在得到語義分析的第一問句中的每個名詞分類到能夠與所述查詢相關的詞語的類型(步驟S2)。這里,作為能夠與所述查詢相關的詞語的類型,已經(jīng)被預先確定普通名詞;專有名詞;與組織(organization)有關的詞語;與區(qū)域(area)有關的詞語;與單位有關的詞語(例如,結(jié)合數(shù)字使用的后置詞);與估計(evaluation)有關的詞語;等等。
然后,問題分析單元13對在步驟S2中分類的名詞之間的連接關系進行估計(步驟S3)。這里,當所述第一問句為日語時,基于存在于名詞之間的后置詞(對應于在英語中的前置詞“of”)的連接關系被估計。當所述第一問句為英語時,基于存在于名詞之間的前置詞“of”的連接關系被估計。問題分析單元13基于在步驟S3中的連接關系的估計結(jié)果,指定(提取)對應于以上問句的主格的名詞(步驟S4)。
問題分析單元13確定在所述第一問句中是否包括未處理的名詞(即,除了對應于主格的名詞之外的未處理名詞)(步驟S5)。如果在所述第一問句中包括了未處理的名詞,問題分析單元13從所述第一問句提取一個未處理的名詞(步驟S6)。問題分析單元13連接(結(jié)合)對應于在步驟S4中指定的主格的名詞;在步驟S6中提取的名詞;以及包括在所述第一問句中表示查詢的詞語,從而生成用于查詢一個事項的一個問句(第二問句)(步驟S7)。當?shù)谝粏柧錇槿照Z時,表示查詢的詞語包括動詞(諸如“oshiete”(講解))或表示所述第一問句特有的,例如,對象、地點以及方向的指示代詞(諸如nani(什么?)與doko(哪里?))。這些日語指示代詞對應于英語的疑問指示代詞或疑問副詞。
問題分析單元13在步驟S5到S7中重復所述處理操作,直到已經(jīng)從所述第一問句中消除了未處理的名詞。如此,問題分析單元13從用于查詢多個事項的第一問句生成與所述多個事項同樣數(shù)目的第二問句,所述第二問句用于查詢各自的一個事項。所述生成的多個第二問句被傳送到詞法搜索引擎15。
現(xiàn)在,將參照圖3、圖4A和4B、圖5A和5B、圖6A和圖6B以及圖7描述上面所描述的問題分析處理和連接處理的示例性例子。所述問題分析處理包括從用于查詢多個事項的第一問句生成多個用于查詢一個事項的第二問句的處理。所述連接處理包括例如,用于通過利用所述多個第二問句的檢索結(jié)果連接命中文獻的摘要的處理。
首先,假定已經(jīng)通過用戶的操作,向圖1所示的文獻檢索系統(tǒng)1的用戶界面11請求了圖3所示的通過問句(第一問句)Q的查詢(檢索請求)。所述問句Q是“講解ABC書的銷售價格和特征”。這里,假定問句Q用日語輸入。在圖3中,日語羅馬字母表示“ABC bukku no urine to tokuchouwo oshiete”也可以被表示為問句Q,對應于日語表示的表示。問句Q查詢被稱為“ABC書”的個人計算機的銷售價格和特征。利用詞法分析單元14通過詞法分析將這個問句Q分成“ABC bukku”(專有名詞)、“no”、“urine”、“to”、“tokuchou”、“wo”、“oshie”和“te”。
問題分析單元13通過利用所述詞法分析結(jié)果執(zhí)行上面的步驟S1到S4。如此,問題分析單元13從圖3所示的問句Q中提取“ABC書(ABCbukku)”作為對應于主格的名詞。
接下來,問題分析單元13隨后從問句Q提取作為除了充當對應于主格的名詞“ABC書(ABC bukku)”之外的名詞的“銷售價格(urine)”和“特征(tokuchou)”(步驟S6)。問題分析單元13通過利用對應于主格的名詞“ABC書”,以及“銷售價格”和“特征”,如下生成多個問句(問句Q1和問句Q2)(步驟S7)。首先,問題分析單元13通過將“銷售價格”和“特征”關于“ABC書”進行連接,生成“ABC書的銷售價格”和“ABC書的特征”。接下來,問題分析單元13從問句Q提取這樣的詞語,其用于表示能夠被“ABC書的銷售價格(ABC bukku no urine)”和“ABC書的特征(ABC bukku no tokuchou)以及后置詞(在日語中)連接的查詢。表示所述查詢的詞語是“動詞”,“什么?”,“哪里?”等等。這里,提取了動詞“講解(oshiete)”。然后,問題分析單元13將“ABC書的銷售價格(ABC bukku no urine)”和“ABC書的特征(ABCbukku no tokuchou)的每一個與“講解(oshiete)”相連接。該連接使得能夠生成在圖4A和4B中示出的問句(第二問句)Q1和Q2,即從問句(第一問句)Q分解得到的問句。問句Q1為“講解ABC書的銷售價格”(ABCbukku no urine wo oshiete),以及問句Q2為“講解ABC書的特征”(ABCbukku no tokuchou wo oshiete)。在日語中,將“ABC bukku no urine”(ABC書的銷售價格)和“ABC buuku no tokuchou”(ABC書的特征)的每一個與“oshiete”(講解)和后置詞“wo”連接。
詞法搜索引擎15通過根據(jù)問句Q1“講解ABC書的銷售價格”和問句Q2“講解ABC書的特征”的檢索處理,從詞法索引數(shù)據(jù)庫16對與問句Q1和Q2匹配的文獻進行檢索。另一方面,摘要生成單元17生成與問句Q1和Q2匹配的文獻(命中文獻)的摘要。
在本實施例中,假定已經(jīng)獲取了在圖5A中示出的命中文獻D1作為與問句Q1匹配的命中文獻,并且然后,已經(jīng)獲取了在圖5B中示出的摘要A1作為命中文獻D1的摘要。這里,摘要A1被作為命中文獻D1的一部分提供。相似地,假定已經(jīng)獲取了在圖6A中示出的命中文獻D2作為與問句Q2匹配的命中文獻,并且然后,生成了在圖6B中示出的摘要A2,作為命中文獻D2的摘要。這里,摘要A2被提供作為命中文獻D2本身。如此,獲取命中文獻D1和摘要A1作為問句Q1的檢索結(jié)果,以及獲取命中文獻D2和摘要A2作為問句Q2的檢索結(jié)果。
連接單元18從問句Q1的兩類檢索結(jié)果(D1和A1)以及問句Q2的兩類檢索結(jié)果(D2和A2),生成(獲取)圖3所示的問句Q的檢索結(jié)果(檢索結(jié)果文獻)。依照存儲在調(diào)整信息存儲單元19中的調(diào)整信息生成問句Q的檢索結(jié)果。這里,連接單元18使得問句Q1的兩類檢索結(jié)果(D1和A1)之一,例如,摘要A1,和問句Q2的兩類檢索結(jié)果(D2和A2)之一,例如,摘要A2,互相連接。這使得能夠生成在圖7中示出的文獻RD。此外,通過指定上述的調(diào)整信息,能夠使得問句Q1的兩類檢索結(jié)果之一,例如,命中文獻D1,和問句Q2的兩類檢索結(jié)果之一,例如,摘要A2,互相連接。相反,能夠使問句Q1的兩類檢索結(jié)果之一,例如,摘要A1,和問句Q2的兩類檢索結(jié)果之一,例如,命中文獻D2,互相連接。另外,還能夠使得所述命中文獻,即命中文獻D1和D2,互相連接。如此,可以依照本實施例中的調(diào)整信息選擇連接目標。如后面所描述的,可以依照用戶的操作設置調(diào)整信息。因為這個原因,可以向用戶提供能夠覆蓋更多用戶所要的信息的回答。
如此,當已經(jīng)獲取了從用戶指定的問句Q生成的兩個問句Q1和Q2中的每一個的檢索結(jié)果時,連接單元18使得問句Q1的檢索結(jié)果之一與問句Q2的檢索結(jié)果之一互相連接。該連接使得連接單元18可能生成問句Q(在圖3中示出的原始問句Q)的檢索結(jié)果(檢索結(jié)果文獻)。生成的檢索結(jié)果包括問句Q1和Q2的每一個的檢索結(jié)果。即,生成的檢索結(jié)果反應了問句Q1和Q2的每一個的檢索結(jié)果。這意味著生成的結(jié)果包括了用于由原始問句Q引起的兩個事項的查詢的檢索結(jié)果。因此,向用戶提供如此生成的檢索結(jié)果,即,相關于問句Q1的檢索結(jié)果(檢索結(jié)果文獻),從而使得用戶能夠清晰地認識到,與通過問句Q查詢的單獨事項的相關性。這里,通過連接單元18,可以為相關于問句Q的檢索結(jié)果文獻,設置鏈接信息。所述鏈接信息被用于參看原始文獻,所述原始文獻(也就是分別相關于問句Q1和Q2的查詢的命中文獻D1和D2)被用于生成檢索結(jié)果文獻。
同時,問句Q1和Q2分別為一個事項的查詢。因此,期望所述問句Q1和Q2的查詢的檢索結(jié)果(命中文獻和它們的摘要)與問句Q1和Q2的查詢完全匹配,而與諸如原始問句Q的兩個事項的查詢不同。因而,可以向用戶提供問句Q1和Q2的查詢的檢索結(jié)果(例如,命中文獻及其摘要中的至少一個),以便分別與問句Q1和Q2相聯(lián)系。在這種情況下,用戶可以容易地從問句Q1和Q2的每一個的檢索結(jié)果來設想原始問句的檢索結(jié)果。這里,刪去了通過連接單元18進行的上述連接處理。
現(xiàn)在,參照圖8A、8B、8C和8D;以及圖9A、9B、9C和9D,將給出對于連接處理的示例性例子的描述,在該情況下,已經(jīng)為從問句Q生成的問句Q1和Q1的每一個檢索了多篇文獻。連接單元18基本上生成了在相關于問句Q1的多篇命中文獻的摘要與相關于問句Q2的多篇命中文獻的摘要之間的所有組合,作為原始問句Q的檢索結(jié)果。
然而,當在相關于一個問句的多篇命中文獻的摘要中包括了被確定為相似內(nèi)容的多個摘要時,連接單元18如下處理所述多篇命中文獻的摘要。即,連接單元18只對被確定為相似內(nèi)容的多個摘要中的一個,作為多篇命中文獻的相應摘要進行處理。這里,在其中將多個摘要確定為相似內(nèi)容的條件如下。首先,通過問句Qi表示對應于多個摘要的一個問句。在這種情況下,上述條件為,在所述多個摘要中第一名詞的特征彼此相似,且在所述多個摘要中第二名詞的特征彼此相似,以及在所述多個摘要中詞語(對應于查詢的回答)的特征彼此相似。所述第一名詞、第二名詞和所述詞語被包括在所述多個摘要中。第一名詞對應于包括在問句Qi中的主格名詞。所述主格名詞意味著對應于主格的名詞。第二名詞表示與所述第一名詞具有連接關系的名詞,并且對應于與包括在問句Qi中的主格名詞具有連接關系的名詞。在日語的情形,具有與所述第一名詞的連接關系的名詞,意味著通過后置詞連接到所述第一名詞的名詞。
現(xiàn)在,假定相關于問句Q1的命中文獻分別是在圖8A和8C中示出的命中文獻D1a和D1b,并且它們的摘要分別是在圖8B和8D中示出的摘要A1a和A1b。相似地,相關于問句Q2的命中文獻分別是在圖9A和9C中示出的命中文獻D2a和D2b,并且它們的摘要分別是在圖9B和9D中示出的摘要A2a和A2b。
連接單元18基本上將,在對應于問句Q1的摘要A1a和A1b的每一個與對應于問句Q2的摘要A2a和A2b的每一個之間的所有組合,處理為原始問句Q的檢索結(jié)果。即,連接單元18生成下面的文獻,作為原始問句Q的檢索結(jié)果(1)已經(jīng)將摘要A1a和A2a互相連接的文獻;(2)已經(jīng)將摘要A1a和A2b互相連接的文獻;(3)已經(jīng)將摘要A1b和A2a互相連接的文獻;(4)已經(jīng)將摘要A1b和A2b互相連接的文獻。
然而,當對應于問句Q1的摘要A1a和A1b互相類似時,連接單元18使得通過摘要A1a和A1b中的一個來表示對應于問句Q1的摘要。相似地,在對應于問句Q2的摘要A2a和A2b互相類似的情況下,連接單元18使得通過摘要A2a和A2b中的一個來表示對應于問句Q2的摘要。
從圖8B和8D可以明顯看出,包括在對應于問句Q1的摘要A1a和A1b的每一個中的第一名詞(專有名詞)為“ABC書”。包括在摘要A1a和A1b的每一個中的第二名詞,即,對應于連接到問句Q1的主格名詞“ABC書”的名詞“銷售價格”的名詞是“價格”。包括在摘要A1a和A1b的每一個中的,用于表示對查詢“講解銷售價格”的回答的詞語,是220,000日元(數(shù)值+單位)。即,在對應于問句Q1的摘要A1a和A1b中,單詞或詞語的特征是彼此相同(相似)的。因此,連接單元18確定對應于問句Q1的摘要A1a和A1b在其內(nèi)容上是彼此相似的。連接單元18使得對應于問句Q1的摘要由摘要A1a和A1b中的任何一個來表示,例如,由摘要A1a表示。在這種情況下,連接單元18從上面四種組合中生成在項(1)和(2)中示出的兩種組合,作為原始問句Q的檢索結(jié)果。當連接問句Q1和Q2的檢索結(jié)果作為原始問句Q的檢索結(jié)果時,這能夠減少不必要的組合的數(shù)目。相似地,這還能應用于相關于問句Q1和Q2的命中文獻被作為連接目標進行處理的情況,如后面所描述的。
現(xiàn)在,參照圖10,將給出通過用戶界面11的連接調(diào)整界面113來設置調(diào)整信息的描述。圖10示出了檢索請求/調(diào)整屏幕的例子。首先,假定用戶為了輸入問句,已經(jīng)通過使用客戶終端(或文獻檢索系統(tǒng)的輸入裝置)進行了預定操作。然后,連接調(diào)整界面113在客戶終端的顯示單元上顯示圖10所示的檢索請求/調(diào)整屏幕。
所述檢索請求/調(diào)整屏幕包括問句輸入?yún)^(qū)101,連接調(diào)整器區(qū)102以及檢索指令區(qū)103。問句輸入?yún)^(qū)101包括問句輸入欄F1,用于使得用戶輸入問句(第一問句)。連接調(diào)整器區(qū)102包括復選框CB1、CB2、CB3、CB4和CB5,用于使得用戶可以設置關于通過連接單元18進行的連接處理的連接條件。檢索指令區(qū)103包括檢索執(zhí)行按鈕B1。所述按鈕B1使得用戶能夠指示圖1所示的系統(tǒng)根據(jù)在問句輸入欄F1中輸入的問句執(zhí)行檢索,并且根據(jù)在連接調(diào)整器區(qū)102中輸入的連接條件來執(zhí)行連接處理。
復選框CB1使得用戶能夠指示圖1所示的系統(tǒng),是否將在問句輸入欄F1中輸入的用戶指定的第一問句分解成多個第二問句,并且然后,是否連接所述多個第二問句的檢索結(jié)果。上面的實施例假定了這樣的情況,即在復選框CB1中已經(jīng)指示了檢索結(jié)果的連接。
復選框CB2使得用戶能夠指示所述系統(tǒng),是否在檢索結(jié)果的連接中,相比于摘要連接,更優(yōu)先考慮文獻連接。即,通過使用復選框CB2,用戶能夠指示所述系統(tǒng),摘要和文獻的連接中的哪一個應該被優(yōu)先考慮。上面的實施例假定了這樣的情況,即在復選框CB2中已經(jīng)指示,無法相比于摘要連接更優(yōu)先地考慮文獻連接(即,相比于文獻連接更優(yōu)先地考慮摘要連接)。如果已經(jīng)指示優(yōu)先考慮文獻連接,則使得圖5A所示的命中文獻D1和圖6A所示的命中文獻D2互相連接。
復選框CB3使得用戶能夠指示所述系統(tǒng),是否在連接文獻時設置文獻的最大行數(shù)“x”。連接調(diào)整器區(qū)102包括最大行數(shù)輸入欄F2,用于用戶輸入文獻的最大行數(shù)“x”。所述欄F2被分配與復選框CB3相關。如果已經(jīng)指示設置文獻的最大行數(shù)“x”并且將被連接的文獻的行數(shù)超過了“x”,例如,可以用摘要來代替所述文獻。復選框CB4使得用戶能夠指示所述系統(tǒng),當在一個第二問句中已經(jīng)獲取了多個檢索結(jié)果時,是否將相關于多個第二問句中的一個(即,相同問句)的多個檢索結(jié)果互相連接。
復選框CB5使得用戶能夠指示所述系統(tǒng),是否為所述第二問句的每一個指定將被連接的檢索結(jié)果(即,連接目標)的類型(摘要或者目標文獻)。當通過利用復選框CB5指示了指定將被連接的檢索結(jié)果的類型時,連接調(diào)整界面113在復選框CB5附近顯示輸入欄,其用于用戶為所述第二問句的每一個指定將被連接的檢索結(jié)果的類型。通過利用該輸入欄,用戶能夠指示連接調(diào)整界面113,例如,將摘要A1用作為問句Q1的檢索結(jié)果并且將命中文獻D2用作為問句Q2的檢索結(jié)果。
還能夠在連接調(diào)整器區(qū)102中分配復選框,其用于使得用戶能夠指示,是否以問句順序或以其逆序,使對應于多個第二問句的檢索結(jié)果互相連接。
本領域技術人員將容易地想到額外的優(yōu)點和變型。因此,本發(fā)明在其廣義方面不受限于在這里示出和描述的具體細節(jié)和代表性實施例。因此,無需偏離由所附權(quán)利要求及其等同內(nèi)容所定義的一般發(fā)明概念的精神或范圍,可以進行各種的變型。
權(quán)利要求
1.一種用于依照自然語言查詢進行文獻檢索的系統(tǒng),包括第一界面,用于接受以自然語言表示的用戶指定的第一問句;問題分析裝置,用于分析通過所述第一界面接受的所述第一問句,當所述第一問句查詢多個事項時,所述問題分析裝置生成多個第二問句,所述第二問句用于對來自所述第一問句的所述多個事項中的每一個單獨地進行查詢;搜索引擎,其被配置為根據(jù)由所述問題分析裝置生成的所述多個第二問句,通過索引檢索從詞法索引數(shù)據(jù)庫檢索與由所述多個第二問句查詢的各個事項相匹配的文獻,所述詞法索引數(shù)據(jù)庫存儲多篇文獻的詞法分析結(jié)果作為索引;以及第二界面,用于向用戶提供所述第一問題的檢索結(jié)果,在所述檢索結(jié)果中反映了通過所述搜索引擎的所述多個第二問句的文獻檢索的結(jié)果。
2.根據(jù)權(quán)利要求1的系統(tǒng),其特征在于,進一步包括連接裝置,其用于通過連接所述多個第二問句的檢索結(jié)果來生成檢索結(jié)果文獻,所述檢索結(jié)果文獻表示所述第一問題的檢索結(jié)果,其中通過所述搜索引擎的所述多個第二問句的文獻檢索的結(jié)果被反映在所述多個第二問句的所述檢索結(jié)果上,其中,所述第二界面向用戶提供由所述連接裝置生成的檢索結(jié)果文獻,作為所述第一問題的檢索結(jié)果。
3.根據(jù)權(quán)利要求2的系統(tǒng),其特征在于,當關于所述多個第二問句中的一個的多個檢索結(jié)果存在并且所述多個檢索結(jié)果包括多個互相類似的檢索結(jié)果時,所述連接裝置只處理所述類似的檢索結(jié)果中的一個,作為所述一個第二問句的檢索結(jié)果。
4.根據(jù)權(quán)利要求2的系統(tǒng),其特征在于,進一步包括存儲單元,其用于存儲包括連接條件的調(diào)整信息,所述連接條件與所述連接裝置進行的連接有關,其中,所述連接裝置依照存儲在所述存儲單元中的所述調(diào)整信息,連接所述多個第二問句的檢索結(jié)果。
5.根據(jù)權(quán)利要求4的系統(tǒng),進一步包括摘要生成裝置,其用于生成通過所述搜索引擎對所述多個第二問句的每一個進行文獻檢索而獲取的文獻的摘要,其中,所述調(diào)整信息,在通過所述搜索引擎的所述文獻檢索而獲取的文獻和通過所述摘要生成裝置生成的所述文獻的摘要中,指定哪一個被用作將被通過所述連接裝置互相連接的所述多個第二問句的每一個的檢索結(jié)果,以及所述連接裝置,在通過所述搜索引擎的所述文獻檢索而獲取的所述文獻和通過所述摘要生成裝置生成的所述文獻的所述摘要中,選擇任何一個作為將被依照所述調(diào)整信息互相連接的所述多個第二問句的每一個的檢索結(jié)果。
6.根據(jù)權(quán)利要求4的系統(tǒng),其特征在于,進一步包括第三界面,其用于向用戶提供用戶界面屏幕,該屏幕使得所述用戶指定所述連接條件,所述第三界面還用于在所述存儲單元中存儲所述調(diào)整信息,所述調(diào)整信息包括在所述用戶界面屏幕上由所述用戶指定的所述連接條件。
7.根據(jù)權(quán)利要求6的系統(tǒng),其特征在于,所述用戶界面屏幕包括這樣的區(qū)域,其使得用戶,在通過所述搜索引擎的所述文獻檢索而獲取的所述文獻和通過所述摘要生成裝置生成的所述文獻的所述摘要中,指定哪一個被用作為將被通過所述連接裝置互相連接的所述多個第二問句的每一個的檢索結(jié)果。
8.根據(jù)權(quán)利要求6的系統(tǒng),其特征在于所述用戶界面屏幕包括這樣的區(qū)域,其使得用戶指定可用于所述連接裝置的連接的文獻的最大行數(shù);以及當將被連接文獻的行數(shù)超過在所述用戶界面屏幕上由所述用戶指定的所述最大行數(shù)時,所述連接裝置用所述文獻的摘要取代將被連接的所述文獻。
9.根據(jù)權(quán)利要求6的系統(tǒng),其特征在于,當關于所述多個第二問句中的一個存在多個檢索結(jié)果時,所述用戶界面屏幕包括這樣的區(qū)域,其使得用戶指示所述系統(tǒng),是否將所述多個檢索結(jié)果互相連接作為所述一個第二問句的檢索結(jié)果。
10.根據(jù)權(quán)利要求2的系統(tǒng),其特征在于,所述連接裝置設置鏈接信息,其用于從表示所述第一問句的檢索結(jié)果的檢索結(jié)果文獻查閱通過所述搜索引擎的所述多個第二問句的文獻檢索而獲取的文獻。
11.一種依照自然語言查詢進行文獻檢索的方法,包括接受以自然語言表示的用戶指定的第一問句;分析所述接受的第一問句,所述分析包括生成多個第二問句,其用于當所述第一問句查詢多個事項時,對來自所述第一問句的所述多個事項中的每一個單獨地進行查詢;根據(jù)所述多個第二問句,通過索引檢索從詞法索引數(shù)據(jù)庫,對與由所述多個第二問句查詢的各個事項相匹配的文獻進行檢索,所述詞法索引數(shù)據(jù)庫存儲多篇文獻的詞法分析結(jié)果作為索引;以及向用戶提供所述第一問題的檢索結(jié)果,在所述檢索結(jié)果中反映了所述多個第二問句的文獻檢索的結(jié)果。
12.根據(jù)權(quán)利要求11的方法,其特征在于,進一步包括生成檢索結(jié)果文獻,其用于通過連接所述多個第二問句的檢索結(jié)果來表示所述第一問句的檢索結(jié)果,其中所述多個第二問句的文獻檢索的結(jié)果被反映在所述多個第二問句的所述檢索結(jié)果上;其中,向用戶提供所述生成的檢索結(jié)果文獻,作為所述第一問句的檢索結(jié)果。
13.一種計算機程序產(chǎn)品,用于依照自然語言查詢的文獻檢索,其特征在于,包括計算機可讀程序代碼裝置,用于使得計算機接受以自然語言表示的用戶指定的第一問句;計算機可讀程序代碼裝置,用于使得所述計算機分析所述接受的第一問句并且生成多個第二問句,所述多個第二問句用于當所述第一問句查詢多個事項時,對來自所述第一問句的所述多個事項的每一個單獨地進行查詢;計算機可讀程序代碼裝置,用于使得所述計算機依據(jù)所述多個第二問句,通過執(zhí)行索引檢索從詞法索引數(shù)據(jù)庫檢索與由所述多個第二問句查詢的各個事項相匹配的文獻,所述詞法索引數(shù)據(jù)庫存儲多篇文獻的詞法分析結(jié)果作為索引;計算機可讀程序代碼裝置,用于使得所述計算機向用戶提供所述第一問句的檢索結(jié)果,在所述結(jié)果中反映了所述多個第二問句的文獻檢索的結(jié)果。
14.根據(jù)權(quán)利要求13的計算機程序產(chǎn)品,其特征在于,進一步包括這樣的計算機程序代碼裝置,其用于使得所述計算機生成檢索結(jié)果文獻,所述檢索結(jié)果文獻通過連接所述多個第二問句的檢索結(jié)果來表示所述第一問句的檢索結(jié)果,其中所述多個第二問句的文獻檢索的結(jié)果被反映在所述多個第二問句的所述檢索結(jié)果上,其中,向用戶提供所述生成的檢索結(jié)果文獻,作為所述第一問句的檢索結(jié)果。
全文摘要
第一界面(111)接收用戶指定的第一問句。問題分析單元(13)分析所述第一問句。當所述第一問句查詢多個事項時,問題分析單元(13)生成多個第二問句,其用于對來自所述第一問句的所述多個事項中的每一個單獨地進行查詢。搜索引擎(15)依照所述多個第二問句,從詞法索引數(shù)據(jù)庫(16),對與由所述多個第二問句查詢的各個事項相匹配的文獻進行檢索。第二界面(112)向用戶提供所述第一問題的檢索結(jié)果,在所述檢索結(jié)果上反映了通過所述搜索引擎(15)的所述多個第二問句的文獻檢索的結(jié)果。
文檔編號G06F17/30GK1834964SQ20061005738
公開日2006年9月20日 申請日期2006年3月14日 優(yōu)先權(quán)日2005年3月14日
發(fā)明者高知尾勝彥, 笹氣光一 申請人:株式會社東芝, 東芝解決方案株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1