基于泰勒級數(shù)估計的油井數(shù)據(jù)無損壓縮方法
【技術(shù)領(lǐng)域】
[0001] 本方法涉及基于泰勒級數(shù)估計的油井數(shù)據(jù)無損壓縮,可有效降低油井數(shù)據(jù)傳輸網(wǎng) 絡(luò)的負荷。
【背景技術(shù)】
[0002] 由于油田信息化程度的加深,傳輸數(shù)據(jù)量急劇增加,但受到油田地理環(huán)境的限制, 這些信息主要通過無線網(wǎng)絡(luò)傳輸。一種是內(nèi)部專用的無線網(wǎng)絡(luò),如ZigBee網(wǎng)絡(luò);另一種是 第三方運營網(wǎng)絡(luò),如GPRS或者3G網(wǎng)絡(luò)。前者帶寬較小,難以負荷越來越大的傳輸量;后者 帶寬大,但屬于收費網(wǎng)絡(luò),占用民用資源。因此,直接傳輸?shù)姆绞剑呀?jīng)不適用于數(shù)字化油田 大數(shù)據(jù)量的需求。目前已有一些研究油井數(shù)據(jù)壓縮的方法。RDP(Ramer-Douglas-Peucker) 算法,通過只保留曲線上的足以表達該曲線形狀特征的關(guān)鍵點,來實現(xiàn)數(shù)據(jù)壓縮,但數(shù)據(jù)精 度在刪除點處存在非常明顯的誤差,且屬于有損壓縮。還有人提出一種對大量數(shù)據(jù)做奇異 值分解,用得到的基向量來近似擬合數(shù)據(jù),達到數(shù)據(jù)壓縮的目的,但算法計算量大,無法滿 足油井數(shù)據(jù)的實時傳輸。此外,一些經(jīng)典通用的數(shù)據(jù)壓縮算法:霍夫曼壓縮編碼、算術(shù)編碼、 游程編碼、LZW算法等,這些算法都沒有考慮油井數(shù)據(jù)的特點,不能有效的實現(xiàn)油井數(shù)據(jù)的 壓縮。
【發(fā)明內(nèi)容】
[0003] 為了實現(xiàn)油井數(shù)據(jù)的高效傳輸,充分考慮其數(shù)據(jù)曲線相關(guān)性,提出一種新的無損 壓縮算法。首先利用泰勒級數(shù)分解擬合出油井數(shù)據(jù)曲線,然后進行后向估計,通過傳輸擬合 值與實際值的估計誤差,實現(xiàn)數(shù)據(jù)的無損壓縮。并且根據(jù)實際應用情況,設(shè)計自適應選擇最 小壓縮率的泰勒級數(shù)分解階數(shù)的方法。
[0004] 本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的。
[0005] 本發(fā)明的基于泰勒級數(shù)估計的油井數(shù)據(jù)無損壓縮方法,步驟為:
[0006] 1)根據(jù)油井實際采集數(shù)據(jù)情況,通過計算最小壓縮率,確定泰勒級數(shù)分解的最佳 階數(shù)M。
[0007] 所述的壓縮率計算,是通過以下步驟進行壓縮后的數(shù)據(jù)和壓縮前的數(shù)據(jù),量化之 后的位寬比。
[0008] 2)對采集到的數(shù)據(jù),按Μ階泰勒級數(shù)展開,求解系數(shù)(a。,ai,…,aM)。所述的泰勒 級數(shù)分解的系數(shù)確定是利用已知的前M+1個點,列出M+1個分解公式,通過解數(shù)學方程計算 而得。
[0009] 3)根據(jù)步驟1)和步驟2)得到的Μ和(a。,,…,aM),換算出第M+2點與前面M+1 個點的關(guān)系。
[0010] 所述的換算方法,是利用油井數(shù)據(jù)的相關(guān)性和泰勒級數(shù)的性質(zhì),根據(jù)求得的系數(shù)、 階數(shù)擬合出第M+2點的值
[0011] 4)根據(jù)步驟3)計算的估計值,得到第M+2點的誤差。
[0012] 所述估計值誤差的計算,是利用擬合得到的估計值,與實際值相減,得到誤差。
[0013] 5)根據(jù)步驟3)得到的已知點與已知點后一點的關(guān)系式,逐步計算出后續(xù)數(shù)據(jù)的 估計值,以及估計值與實際值的誤差。
[0014] 6)傳輸數(shù)據(jù)是步驟2)中M+1個的已知點和步驟5)計算得到的從M+2點開始的誤 差值。
[0015] 7)對接收到的數(shù)據(jù)進行解壓處理,是利用步驟1)至步驟3)的方法根據(jù)前M+1個 已知點計算出后續(xù)點的估計值,再疊加上誤差,即無損恢復出原始數(shù)據(jù)。
[0016] 有益效果
[0017] 本發(fā)明方法通過泰勒級數(shù)展開估計實現(xiàn)數(shù)據(jù)無損壓縮,具有時間空間復雜度低的 特點,可適用于油田數(shù)據(jù)遠程傳輸系統(tǒng),通過某油田的實際系統(tǒng)驗證,可將傳輸網(wǎng)絡(luò)數(shù)據(jù)負 荷降低至45%。
【附圖說明】
[0018] 圖1是本發(fā)明方法的系統(tǒng)實現(xiàn)框圖;
[0019] 圖2是利用不同階數(shù)的冪函數(shù)對電參數(shù)數(shù)據(jù)進行壓縮效果圖。
【具體實施方式】
[0020] 下面結(jié)合附圖和實施例對本發(fā)明做進一步說明。
[0021] 實施例
[0022] 1)把實際采集到的離散型油井數(shù)據(jù)按Μ階泰勒級數(shù)分解。
[0023] 所述分解形式是,油井數(shù)據(jù)函數(shù)描述為:yn=f(xn) |xn=nTs,ne[1,Ν],其中,Ts 是采樣周期。函數(shù)分解為M階:yn= 3
[0024] 2)確定按步驟1)中泰勒級數(shù)分解的變量:Μ(函數(shù)的最佳階數(shù));aM~a。(函數(shù)的 系數(shù))。
[0025] 首先根據(jù)求解線性方程的Cramer法則,要確定M+1個系數(shù)需要M+1個獨立的線性 方程,引入假設(shè)條件:en=0,ne[1,M+1]。
[0026] 可以將步驟1)的Μ階分解式修正為
[0027] 改寫成矩陣形式:y=Xa。又因為xn=nTs,ne[1,Ν],所以X是范德蒙矩陣,只 與擬合階數(shù)Μ有關(guān)系,后面記做ΧΜ+1,滿足滿秩條件:r(XM+1) =Μ+1,存在唯一的逆矩陣即系 數(shù)向量:a=ΧΜ+1 最佳階數(shù)Μ,是根據(jù)最小壓縮率確定的,具體方法參見步驟6)。
[0028] 3)根據(jù)步驟2)得到的系數(shù)a和前Μ+1個已知點X,換算出與第Μ+2點的關(guān)系,從 而估計出第M+2點的值,得到估計值與實際值的誤差。
[0029] 第M+2點的估計值
[0030]而m和:^+1都只與擬合階數(shù)Μ的取值有關(guān)。令,改寫為關(guān)于y的線性組 合:=辦1>,湘+/?+…咖估計誤差為:^
[0031]4)按照上述步驟1)、步驟2)、步驟3)的方法,把第2到M+2位數(shù)據(jù)看做第1到M+1 位數(shù)據(jù),使用同樣的估計算法,逐步得到后續(xù)數(shù)據(jù)對應的誤差值。 A/+1
[0032]此后估計第M+i點時:i'.u+,=Σ&Λ+,-:得估計誤差序列:E= (eM+2,eM+3,…,eN) /=1
[0033] 5)壓縮處理完成后的傳輸數(shù)據(jù)。
[0034] 在傳輸過程中只需傳輸初始的M+1個點的數(shù)據(jù)序列Yinit=(ydy2,…,yM+1)和估計 誤差序列{E},即待傳輸?shù)臄?shù)據(jù)序列為:Y&ans=(ydy2,…,yM,eM+1,…,eN)
[0035] 6)對接收數(shù)據(jù)進行解壓處理,恢復出原始數(shù)據(jù)。
[0036] 接收端解壓過程即為壓縮的逆過程,即首先通過擬合階數(shù)Μ可以得到出范德蒙矩 陣ΧΜ+1,然后利用Μ+1個初始序列{Yinit}根據(jù)步驟1)和步驟2)就可以得到泰勒級數(shù)系數(shù) 向量a,再用該泰勒級數(shù)估計出下一點數(shù)據(jù)Λ?+2,最后用接收到的誤差eM+2對估計值九12進 行修正,即可得到第M+2點的真實值yM+2。重復上述解壓過程,最終可實現(xiàn)數(shù)據(jù)還原。
[0037] 7)從傳感器采集到數(shù)據(jù)開始,截取一個周期,利用步驟1)至步驟4)的方法進行壓 縮計算,從Μ= 1開始,得到一個暫時的最大估計誤差幅值:ΔE=max(E)-min(E)。計算后 續(xù)M+1階的△E,依次循環(huán),當最大估計誤差幅值由減小的趨勢變?yōu)樵龃髸r,即可跳出循環(huán), 確定最佳泰勒級數(shù)的擬合階數(shù)。利用不同階數(shù)的冪函數(shù)對電參數(shù)數(shù)據(jù)進行壓縮,得到的壓 縮結(jié)果如圖2所示。
【主權(quán)項】
1.基于泰勒級數(shù)估計的油井數(shù)據(jù)無損壓縮方法,其特征在于,包含以下步驟: 步驟一:根據(jù)油井實際采集數(shù)據(jù)情況,通過計算最小壓縮率,確定泰勒級數(shù)分解的最佳 階數(shù)M。 所述的壓縮率計算,是通過以下步驟進行壓縮后的數(shù)據(jù)和壓縮前的數(shù)據(jù),量化之后的 位寬比。 步驟二:對采集到的數(shù)據(jù),按Μ階泰勒級數(shù)展開,求解系數(shù)(a。,ai,…,aM)。 所述的泰勒級數(shù)分解的系數(shù)確定是利用已知的前M+1個點,列出M+1個分解公式,通過 解數(shù)學方程計算而得。 步驟三:根據(jù)步驟一和步驟二得到的Μ和(a。,,…,aM),換算出第M+2點與前面M+1個 點的關(guān)系。 所述的換算方法,是利用油井數(shù)據(jù)的相關(guān)性和泰勒級數(shù)的性質(zhì),根據(jù)求得的系數(shù)、階數(shù) 擬合出第M+2點的值 步驟四:根據(jù)步驟三計算的估計值,得到第M+2點的誤差。 所述估計值誤差的計算,是利用擬合得到的估計值,與實際值相減,得到誤差。 步驟五:根據(jù)步驟三得到的已知點與已知點后一點的關(guān)系式,逐步計算出后續(xù)數(shù)據(jù)的 估計值,以及估計值與實際值的誤差。 步驟六:傳輸數(shù)據(jù)是步驟二中M+1個的已知點和步驟五計算得到的從M+2點開始的誤 差值。對接收到的數(shù)據(jù)進行解壓處理,是利用步驟一至步驟三的方法根據(jù)前M+1個已知點 計算出后續(xù)點的估計值,再疊加上誤差,即無損恢復出原始數(shù)據(jù)。
【專利摘要】本發(fā)明是一種基于泰勒級數(shù)估計的油井數(shù)據(jù)無損壓縮方法,屬于數(shù)據(jù)壓縮處理領(lǐng)域。該方法利用泰勒級數(shù)分解擬合出油井數(shù)據(jù)曲線,然后進行后向估計,通過傳輸擬合值與實際值的估計誤差,實現(xiàn)數(shù)據(jù)的無損壓縮。并且根據(jù)實際應用情況,設(shè)計自適應選擇最小壓縮率的泰勒級數(shù)分解階數(shù)的方法。適用于油田數(shù)據(jù)遠程傳輸系統(tǒng),有效降低傳輸網(wǎng)絡(luò)數(shù)據(jù)負荷。
【IPC分類】H03M7/30, G06F17/30
【公開號】CN105306066
【申請?zhí)枴緾N201510796740
【發(fā)明人】王衛(wèi)江, 高巍, 史玥婷
【申請人】北京理工大學
【公開日】2016年2月3日
【申請日】2015年11月18日