日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種抗菌蛋白質或多肽活性關系表征的方法

文檔序號:6367259閱讀:345來源:國知局
專利名稱:一種抗菌蛋白質或多肽活性關系表征的方法
技術領域
本發(fā)明氨基酸結構表征領域。
背景技術
蛋白質的諸多生物學功能與特定肽鏈的氨基酸排列順序亦有著十分密切的關系,因此研究肽的定量構效 關系對于研究其在生物體內的作用機理,以及肽類新藥的研究與開發(fā),同時對蛋白質的結構與功能研究都具有十分重要的意義。多肽具有高活性、高選擇性及副作用小等特點,現已成為藥物研究熱點之一。非編碼氨基酸在自然界普遍存在,在藥物設計中對氨基酸結構改造或多肽修飾起到重要作用。近年來隨著擬肽學的發(fā)展,已認識到需要對含有非標準編碼氨基酸在內的肽及其衍生物進行定量構效關系(QSAR)研究才能滿足相關學科領域發(fā)展要求。在QSAR研究中,普遍采用氨基酸殘基的參數定量描述多肽的化學結構。目前已有理化性質和量化計算描述子,這些描述子主要表征編碼氨基酸,由于非編碼氨基酸多樣性以及實驗參數收集困難,使得對其發(fā)展一組高效的描述子體系變得極為艱難,因此該類研究報道很少。結構拓撲描述子是完全不同于傳統(tǒng)物理化學參數的結構表征方法,它基于分子圖中拓撲不變量將化合物轉化為一組具數學抽象意義的特征參數,從而在純理論層面上實現分子結構表征,如Winer指數、Randic指數和Balaban指數等在QSAR研究中得到了廣泛地應用。

發(fā)明內容
本發(fā)明的目的是通過拓撲計算得到一種新型氨基酸拓撲描述子矢量,它能對任何天然及非天然氨基酸結構進行定量表征,進而用于表征抗菌肽活性關系。本發(fā)明的上述目的是通過如下技術方案實現的一種抗菌蛋白質或多肽活性關系表征方法,包括如下步驟
1)選取氨基酸,使用描述子計算軟件對每個氨基酸生成拓撲描述子參數;
2)采用主成分分析(PCA)進行變量位數壓縮提取,得到各種氨基酸的拓撲描述子矢
量;
3)對待表征活性關系的蛋白質或多肽用拓撲描述子矢量描述子進行結構表征;
4)將步驟3得到的描述子變量用于GA-PLS或SMR-MLR建模分析。具體而言,步驟I是將166種氨基酸使用描述子計算軟件對每個氨基酸生成至少85個拓撲描述子參數,其中優(yōu)選為85個拓撲描述子參數。可采用的計算軟件包括Chem3D8. O、Codessa 2. 7 和 Dragon L I 等。在本發(fā)明中,采用的166種氨基酸來源于從多篇文獻。其中,1-20為20種編碼氨基酸,其余是非編碼氨基酸及人工修飾非蛋白氨基酸,如鳥氨酸、羥脯氨酸、高絲氨酸等。由于拓撲描述子表征分子整體結構特征,不同描述子參數之間可能存在較大信息重疊,且直接使用85種參數來表征序列中單個氨基酸殘基將會導致造成實際應用過于復雜、干擾因素太多等問題。因此,在步驟2中,采用主成分分析(PCA)進行變量維數壓縮提取。首先對原始變量矩陣I166x85進行數據標準化處理(autoscaling),在此基礎上運用PCA得到了 6個顯著主成分,其分別解釋原始變量矩陣66. 35%,8. 23%,6. 63%,4. 84%,4. 601%和
2.86%的方差,累積解釋方差為93. 52%。對于每個氨基酸所對應的6個顯著主成分得分,它是由氨基酸85個原始變量值與每個主成分得分系數的乘積計算而來,當使用這6個主成分得分矢量來替代原始變量矩陣時僅損失6. 48%的信息。這里稱166種氨基酸6個顯著成分得分為氨基酸拓撲描述子矢量VSTPV (principal component score Vector of Structuraland Topological Variables),其值參見表 I。表I 166種氨基酸名稱及拓撲描述子矢量VSTPV
權利要求
1.一種抗菌蛋白質或多肽的活性關系表征方法,包括如下步驟1)選取氨基酸,使用描述子計算軟件對每個氨基酸生成拓撲描述子參數;2)采用主成分分析(PCA)進行變量位數壓縮提取,得到各種氨基酸的拓撲描述子矢量;3)對待表征活性關系的蛋白質或多肽用拓撲描述子矢量描述子進行結構表征;4)將步驟3得到的描述子變量用于GA-PLS或SMR-MLR建模分析。
2.如權利要求1所述的方法,其中步驟1是將166種氨基酸使用描述子計算軟件對每 個氨基酸生成至少85個拓撲描述子參數,優(yōu)選為85個拓撲描述子參數。
3.如權利要求2所述的方法,其中所述描述子計算軟件包括Chem3D8. 0、Codessa 2.7 和 Dragon 1. 1 等。
4.如權利要求2所述的方法,其中所述氨基酸為20種編碼氨基酸,其余是非編碼氨基 酸及人工修飾非蛋白氨基酸。
5.如權利要求1-4任一項所述的方法,其中步驟2是指采用主成分分析(PCA)進行變 量維數壓縮提取首先對原始變量矩陣石66X85進行數據標準化處理(autoscaling),在此 基礎上運用PCA得到了 6個顯著主成分,其分別解釋原始變量矩陣66. 35%,8. 23%,6. 63%、 4. 84%,4. 601%和2. 86%的方差,累積解釋方差為93. 52% ;對于每個氨基酸所對應的6個顯 著主成分得分,它是由氨基酸85個原始變量值與每個主成分得分系數的乘積計算而來,即 為氨基酸拓撲描述子矢量。
6.如權利要求1-5任一項所述的方法,其中在步驟3中,當使用拓撲描述子矢量對蛋 白質或多肽類似序列進行表征時,所包含全部氨基酸殘基依次由相應拓撲描述子矢量所代 表,對具有《個氨基酸殘基的序列,共可用6X/7個拓撲描述子矢量串聯表征。
7.如權利要求1-6任一項所述的方法,其中步驟3所述的多肽為陽離子抗菌肽或牛乳 鐵蛋白水解妝。
8.如權利要求1-7任一項所述的方法,其中步驟4中所述的建模分析是指對步驟3得 到的拓撲描述子矢量分析,包括a.用遺傳算法-偏最小二乘方法或逐步回歸方法挑選與 抗菌活性密切相關的結構特征;b.用偏最小二乘法或多元回歸法建立抗菌肽定量構效關 系分析模型。
9.如權利要求1-8任一項所述的方法在抗菌蛋白質或多肽活性關系表征中的應用。
10.如權利要求1-8任一項所述的方法在蛋白質或多肽活性改性修飾中的應用。
全文摘要
本發(fā)明公開了一種抗菌蛋白質或多肽活性關系表征的方法,從表征分子的85個結構參量和拓撲指數出發(fā),經主成分分析(PCA)得到一種包含166個氨基酸體系的特征描述子:氨基酸拓撲結構信息矢量(VSTPV).將其應用于101個陽離子抗菌肽和28個牛乳鐵蛋白水解肽(BPPs))的定量構效關系(QSAR)研究,均有較好的擬合和預測能力,交叉驗證相關系數和相關系數都在0.70以上。研究表明氨基酸殘基拓撲結構信息矢量VSTPV能很好的表征編碼與非編碼氨基酸并能建立預測能力較強的多肽及其衍生物QSAR模型。
文檔編號G06F19/24GK102663271SQ201210139079
公開日2012年9月12日 申請日期2012年5月8日 優(yōu)先權日2012年5月8日
發(fā)明者張云茹, 林治華, 舒茂, 路亞闊 申請人:重慶理工大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1