日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于異質圖的空間多組學技術空間域識別方法及系統(tǒng)

文檔序號:39729514發(fā)布日期:2024-10-22 13:34閱讀:9來源:國知局
一種基于異質圖的空間多組學技術空間域識別方法及系統(tǒng)

本發(fā)明屬于生物信息學,尤其涉及一種基于異質圖的空間多組學技術空間域識別方法及系統(tǒng)。


背景技術:

1、本部分的陳述僅僅是提供了與本發(fā)明相關的背景技術信息,不必然構成在先技術。

2、隨著生物信息學和基因組學技術的迅猛發(fā)展,多組學數(shù)據分析成為了研究復雜生物系統(tǒng)中基因表達、蛋白質相互作用及代謝途徑等方面的重要手段。傳統(tǒng)的多組學分析方法通常依賴于將不同類型的生物學數(shù)據分開處理和分析,這種方法雖然在一定程度上推動了生物醫(yī)學研究的進展,但在處理空間多組學數(shù)據時顯示出一定的局限性,特別是在空間分辨率和數(shù)據整合方面。

3、空間多組學技術是近年來生物信息學領域的重要突破,它能夠在單細胞水平上提供空間位置信息,從而使研究人員能夠在細胞甚至亞細胞水平上探究基因表達、蛋白質分布及其功能。然而,生物組織是一個復雜的系統(tǒng),利用傳統(tǒng)的空間組學分析技術往往缺乏效率和準確性,尤其是在識別和整合來自不同空間區(qū)域的異質數(shù)據時面臨巨大挑戰(zhàn)。

4、異質圖技術(heterogeneous?graph),作為一種有效處理異質數(shù)據的方法,為整合和分析來自不同數(shù)據源的信息提供了可能。但其在空間多組學數(shù)據的應用尚處于初級階段,急需開發(fā)一種能夠有效利用異質圖技術來解決空間域識別問題的新方法。


技術實現(xiàn)思路

1、為克服上述現(xiàn)有技術的不足,本發(fā)明提供了一種基于異質圖的空間多組學技術空間域識別方法,能夠有效整合和分析空間多組學數(shù)據,在多個視角探究空間組學數(shù)據,提高空間域識別的準確性和效率,為深入理解細胞間的空間功能關系提供了新的工具和視角。

2、為實現(xiàn)上述目的,本發(fā)明的一個或多個實施例提供了如下技術方案:

3、第一方面,公開了一種基于異質圖的空間多組學技術空間域識別方法,包括:

4、獲取空間組學數(shù)據并進行數(shù)據預處理,獲得基因表達數(shù)據;

5、利用細胞的空間位置信息將預處理后的空間組學數(shù)據的組織圖像按照細胞個數(shù)劃分為多個子圖像,從多個子圖像中提取特征表示;

6、基于提取的特征表示構建不同視角下的鄰接矩陣;

7、對每一個視角構建一組圖編碼器,每一組圖編碼器包含兩層gcn,分別對不同視角下構建的鄰接矩陣和基因表達數(shù)據進行處理,得到圖編碼特征,gcn為圖卷積神經網絡;

8、基于注意力機制構建異質圖:利用注意力機制計算圖編碼特征中每一個視角的潛在特征,將多個視角下的潛在特征相加,即為所有視角的聯(lián)合潛在特征;

9、基于所有視角的聯(lián)合潛在特征計算聯(lián)合概率密度和經驗概率密度,基于聯(lián)合概率密度和經驗概率密度,定義自監(jiān)督的目標函數(shù),構建訓練模型;

10、將待識別的空間組學數(shù)據輸入至訓練后的模型獲得多組學空間域信息。

11、作為進一步的技術方案,對獲取的空間組學數(shù)據進行數(shù)據預處理,包括:刪除空間組學數(shù)據中表達量小于三個細胞的基因和線粒體基因;

12、然后對空間組學數(shù)據正則化并取對數(shù),最后篩選所需數(shù)據量的高表達基因,即得到基因表達數(shù)據。

13、作為進一步的技術方案,對于多個子圖像,每一個細胞對應一個子圖像。

14、作為進一步的技術方案,從多個子圖像中提取特征表示,具體為:采用特征提取器,將高維的圖像數(shù)據轉換為低維的特征表示。

15、作為進一步的技術方案,每一組圖編碼器包含兩層gcn,其中,每一層?gcn?提取的特征綜合了鄰近節(jié)點的信息。

16、作為進一步的技術方案,圖編碼特征的具體表達為:

17、

18、表示第層的圖編碼特征,是一個矩陣,其大小與輸入特征矩陣相同;是輸入的鄰接矩陣經過預處理后的鄰接矩陣;是的度矩陣,是一個對角矩陣,其對角線上的元素是每個節(jié)點的度;表示第層的圖編碼特征,是上一層的輸出;表示第層到第層的權重矩陣,是一個可學習的參數(shù)矩陣;表示激活函數(shù)。

19、第二方面,公開了一種基于異質圖的空間多組學技術空間域識別系統(tǒng),包括:

20、基因表達數(shù)據獲取模塊,被配置為:獲取空間組學數(shù)據并進行數(shù)據預處理,獲得基因表達數(shù)據;

21、特征表示提取模塊,被配置為:利用細胞的空間位置信息將預處理后的空間組學數(shù)據的組織圖像按照細胞個數(shù)劃分為多個子圖像,從多個子圖像中提取特征表示;

22、鄰接矩陣構建模塊,被配置為:基于提取的特征表示構建不同視角下的鄰接矩陣;

23、圖編碼特征獲取模塊,被配置為:對每一個視角構建一組圖編碼器,每一組圖編碼器包含兩層gcn,分別對不同視角下構建的鄰接矩陣和基因表達數(shù)據進行處理,得到圖編碼特征,gcn為圖卷積神經網絡;

24、聯(lián)合潛在特征獲取模塊,被配置為:基于注意力機制構建異質圖:利用注意力機制計算圖編碼特征中每一個視角的潛在特征,將多個視角下的潛在特征相加,即為所有視角的聯(lián)合潛在特征;

25、模型訓練模塊,被配置為:基于所有視角的聯(lián)合潛在特征計算聯(lián)合概率密度和經驗概率密度,基于聯(lián)合概率密度和經驗概率密度,定義自監(jiān)督的目標函數(shù),構建訓練模型;

26、識別模塊,被配置為:將待識別的空間組學數(shù)據輸入至訓練后的模型獲得多組學空間域信息。

27、以上一個或多個技術方案存在以下有益效果:

28、本發(fā)明技術方案基于異質圖的空間多組學技術空間域識別方法,該方法能夠有效整合和分析空間多組學數(shù)據,在多個視角探究空間組學數(shù)據,提高空間域識別的準確性和效率,為深入理解細胞間的空間功能關系提供了新的工具和視角。

29、本發(fā)明附加方面的優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。



技術特征:

1.一種基于異質圖的空間多組學技術空間域識別方法,其特征是,包括:

2.如權利要求1所述的一種基于異質圖的空間多組學技術空間域識別方法,其特征是,對獲取的空間組學數(shù)據進行數(shù)據預處理,包括:刪除空間組學數(shù)據中表達量小于三個細胞的基因和線粒體基因;

3.如權利要求1所述的一種基于異質圖的空間多組學技術空間域識別方法,其特征是,對于多個子圖像,每一個細胞對應一個子圖像。

4.如權利要求1所述的一種基于異質圖的空間多組學技術空間域識別方法,其特征是,從多個子圖像中提取特征表示,具體為:采用特征提取器,將高維的圖像數(shù)據轉換為低維的特征表示。

5.如權利要求1所述的一種基于異質圖的空間多組學技術空間域識別方法,其特征是,每一組圖編碼器包含兩層gcn,其中,每一層?gcn?提取的特征綜合了鄰近節(jié)點的信息。

6.如權利要求1所述的一種基于異質圖的空間多組學技術空間域識別方法,其特征是,圖編碼特征的具體表達為:

7.一種基于異質圖的空間多組學技術空間域識別系統(tǒng),其特征是,包括:

8.如權利要求7所述的一種基于異質圖的空間多組學技術空間域識別系統(tǒng),其特征是,對獲取的空間組學數(shù)據進行數(shù)據預處理,包括:刪除空間組學數(shù)據中表達量小于三個細胞的基因和線粒體基因;

9.如權利要求7所述的一種基于異質圖的空間多組學技術空間域識別系統(tǒng),其特征是,對于多個子圖像,每一個細胞對應一個子圖像。

10.如權利要求7所述的一種基于異質圖的空間多組學技術空間域識別系統(tǒng),其特征是,從多個子圖像中提取特征表示,具體為:采用特征提取器,將高維的圖像數(shù)據轉換為低維的特征表示。


技術總結
本發(fā)明提出了一種基于異質圖的空間多組學技術空間域識別方法及系統(tǒng),屬于生物信息學技術領域。方法包括:獲取空間組學數(shù)據并進行數(shù)據預處理,得到基因表達數(shù)據;利用細胞的空間位置信息將預處理后的空間組學數(shù)據的組織圖像按照細胞個數(shù)劃分為多個子圖像;基于提取的特征表示構建不同視角下的鄰接矩陣;對每一個視角構建一組圖編碼器,得到圖編碼特征;基于注意力機制構建異質圖;構建訓練模型;將待識別的空間組學數(shù)據輸入至訓練后的模型獲得多組學空間域信息。該方法能夠有效整合和分析空間多組學數(shù)據,在多個視角探究空間組學數(shù)據,提高空間域識別的準確性和效率,為深入理解細胞間的空間功能關系提供了新的工具和視角。

技術研發(fā)人員:張威,高瑞,于娜,張道良,李浩楊,江正帥,隋新儀
受保護的技術使用者:山東大學
技術研發(fā)日:
技術公布日:2024/10/21
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1