本發(fā)明屬于分子標記的技術領域,具體涉及一種玉米單株穗重主效QTL、其獲得方法及應用。
背景技術:
玉米是重要的糧食與飼料作物,是世界三大作物之一,且我國目前玉米已上升為第一大糧食作物。高產(chǎn)是玉米育種工作者追求的永恒主題和方向,也是玉米育種的重要目標。產(chǎn)量性狀是由多基因控制的數(shù)量性狀,一個復雜、多元的經(jīng)濟性狀,是有相互關聯(lián)的多基因控制的一系列生理生化過程的最終體現(xiàn)。但僅通過表型分析難以詳盡闡明影響產(chǎn)量形成的具體原因。因此,從分子水平了解產(chǎn)量及相關性狀的關系,對玉米產(chǎn)量的遺傳改了具有重要意義。構建玉米遺傳圖譜并鑒定玉米產(chǎn)量相關性狀如單株產(chǎn)量、百粒重、穗長、穗粗、穗行數(shù)、行粒數(shù)、出籽率等QTL定位及其基因效應的分析,是產(chǎn)量相關性狀QTL進行分子標記輔助育種的基礎。
QTL(quantitative trait locus的縮寫),為數(shù)量性狀座位或者數(shù)量性狀基因座,指的是控制數(shù)量性狀的基因在基因組中的位置。目前,在MAIZEGDB(http://www.maizegdb.org/)和GREMENE網(wǎng)站上注冊了大量關于玉米產(chǎn)量構成因子的QTL。但以上QTL定位所用圖譜大都以第二代分子標記SSR為主。在遺傳圖譜的構建中,SSR技術只能對重復序列區(qū)域進行染色體定位,因此若要構建高密度的遺傳圖譜則必須結合其他分子標記技術以增加相鄰重復序列之間的遺傳標記數(shù)目。
分子標記發(fā)展經(jīng)過第一代(RFLP為代表)、第二代(SSR為代表)的歷程,新一代高通量測序技術和豐富的基因分型技術催生了第三代SNP的快速發(fā)展。與AFLP、RFLP、RAPD和SSR標記相比,SNP(Single nucleotide polymorphism)即單核苷酸多態(tài)性,具有密度高、代表性強、遺傳穩(wěn)定性好和易于實現(xiàn)自動化分析檢測等優(yōu)點,現(xiàn)已廣泛應用于植物遺傳連鎖圖譜構建、QTL定位以及生物多態(tài)性的研究等方面。同時SNP標記的發(fā)展促進了遺傳圖譜、基因定位、關聯(lián)分析等對植物復雜數(shù)量性狀的遺傳研究。研究證明:多數(shù)SNP變異與基因功能密切相關,通過基因定位、關聯(lián)分析可以發(fā)掘這些SNP位點信息并應用于作物遺傳育種。但傳統(tǒng)的SNP開發(fā)和分型技術由于成本較高、耗時較長、較為繁瑣、在基因組上分布不均勻、密度低等缺點限制其進一步應用。
技術實現(xiàn)要素:
針對現(xiàn)有技術中玉米產(chǎn)量QTL定位所用遺傳圖譜標記密度較低,QTL定位置信區(qū)間較大,難以直接對定位QTL進行候選基因預測等問題,本發(fā)明采用GBS簡略基因組測序技術,構建玉米高密度SNP遺傳圖譜,結合考察的玉米單穗粒重表型性狀進行全基因組掃描,獲得與目標性狀QTL緊密連鎖的SNP分子標記。
本發(fā)明提供了一種玉米單株穗重主效QTL,該QTL包括qEW-1、qEW-2、qEW-3、qEW-4和qEW-5,qEW-1定位在第4號染色體上,位于分子標記mk1399和mk1419之間;分子標記mk1399的序列如SEQ ID NO.1所示,分子標記mk1419的序列如SEQ ID NO.2所示;qEW-2定位在第4號染色體上,位于分子標記mk1650和mk1660之間,分子標記mk1650的序列如SEQ ID NO.3所示,分子標記mk1660的序列如SEQ ID NO.4所示;qEW-3定位在第7號染色體上,位于分子標記mk2462和mk2467之間;分子標記mk2462的序列如SEQ ID NO.5所示,分子標記mk2467的序列如SEQ ID NO.6所示;qEW-4定位在第7號染色體上,位于分子標記mk2468和mk2473之間;分子標記mk2468的序列如SEQ ID NO.7所示,分子標記mk2473的序列如SEQ ID NO.8所示;qEW-5定位在第7號染色體上,位于分子標記mk2483和mk2484之間,分子標記mk2483的序列如SEQ ID NO.9所示,分子標記mk2484的序列如SEQ ID NO.10所示。
本發(fā)明還提供了一種玉米單株穗重主效QTL的獲得方法,該方法包括以下步驟:
(1)選擇玉米自交系SG-3為母本,玉米自交系SG-5為父本配置雜交組合,構建F2群體;
(2)提取兩親本和F2群體的DNA,對F2群體DNA樣本進行GBS測序分型,基于玉米親本基因型檢測結果,進行親本間多態(tài)性標記開發(fā);
(3)采用binmap的方式,對所有標記進行bin的劃分,構建遺傳圖譜,并使用winQTLcart2.5軟件復合區(qū)間作圖法進行QTL分析。
進一步的,步驟(1)中,構建包含199個單株的F2遺傳群體。
進一步的,步驟(2)中,選用限制性內切酶MseI、HaeIII進行酶切,樣本合格后建庫,于HiSeq PE150測序平臺上測序;原始測序數(shù)據(jù)經(jīng)過基本質控后,與參考基因組進行比對,進行變異檢測及篩選。
進一步的,步驟(2)中,過濾掉親本信息缺失的位點;篩選父母本都為純合且親本間具有多態(tài)性的位點。
進一步的,步驟(3)中,采用binmap的方式,對所有標記進行bin的劃分,窗口設置為15個,使用R/qtl進行遺傳距離的計算,使用perl腳本進行畫圖。
進一步的,步驟(3)中,使用winQTLcart2.5軟件復合區(qū)間作圖法進行QTL分析,搜索步長設定為1cM。
本發(fā)明還提供了玉米單株穗重主效QTL在玉米單株穗重性狀育種中的應用。
本發(fā)明的有益效果為:本發(fā)明以高產(chǎn)早熟玉米自交系SG5為母本、產(chǎn)量性狀相對較差的玉米自交系SG7為父本配置雜交組合,并構建其F2遺傳群體;并對F2遺傳群體進行GBS測序分型,同時結合基于SG5、SG7雙親發(fā)掘的差異SNP進行基因型分析。調查F2單穗產(chǎn)量性狀,同時利用winQTLcart2.5軟件復合區(qū)間作圖法對F2單穗產(chǎn)量性狀進行QTL分析,分析主效QTL所在染色體區(qū)域和遺傳效應,為挖掘控制玉米單穗產(chǎn)量性狀主效QTL及連鎖標記提供理論依據(jù),獲得與目標QTL緊密連鎖的SNP分子標記,為玉米單穗產(chǎn)量性狀QTL候選基因預測、克隆及分子標記輔助育種奠定基礎。
具體實施方式
下面結合實施例對本發(fā)明的實施方案進行詳細描述,但是本領域技術人員將會理解,下列實施例僅用于說明本發(fā)明,而不應視為限制本發(fā)明的范圍。
實施例1
本發(fā)明使用本地高產(chǎn)早熟玉米自交系SG-3為母本、產(chǎn)量相對較差的自交系SG-5為父本配置的雜交組合,構建其F2群體;對F2群體進行GBS測序分型,同時結合兩親本間開發(fā)的SNP標記進行基因型分析,構建遺傳連鎖圖譜。再調查F2的單穗產(chǎn)量性狀,應用QTL Cartographer v2.5軟件復合區(qū)間作圖法對單株產(chǎn)量性狀QTL分析,分析主效QTL所在染色體區(qū)域和遺傳效應。
本發(fā)明方法具體包括下列步驟:
1、親本選擇及群體構建:選擇高產(chǎn)早熟且抗灰斑病玉米自交系SG-3為母本、產(chǎn)量相對較差的自交系SG-5為父本配置雜交組合,南繁加代并構建其包含199個單株的F2遺傳群體。
2、表型調查:考察P1、P2和F2單穗產(chǎn)量性狀。
3、群體GBS測序分型:對構建的F2群體DNA樣本(6葉期幼苗)進行GBS測序。GBS技術包括DNA制備、限制性內切酶酶切、加接頭、文庫構建、PCR反應、測序、生物分析的步驟;
(1)采用CTAB法提取P1、P2和F2群體基因組DNA;
(2)酶切:0.1-1μg基因組DNA用限制性內切酶MseI和HaeIII進行雙酶切,以得到適合的marker密度;
(3)加Pl和P2接頭:酶切后的片段兩端加Pl和P2Adapter(可與酶切DNA缺口互補);
(4)片斷選擇:PCR擴增兩端分別含有Pl和P2接頭的tag序列,DNA片段pooling,電泳回收需要區(qū)間的DNA;
(5)高通量測序:Cluster制備,上機測序;
(6)將檢測合格的DNA文庫進行Illumina HiseqTM測序,產(chǎn)出原始數(shù)據(jù)(即raw data或raw reads),結果以FASTQ文件格式存儲(文件名:*.fq)。原始測序數(shù)據(jù)中會包含接頭信息,低質量堿基,未測出的堿基,為保證信息分析質量,這些信息會對后續(xù)的信息分析造成很大的干擾,分析前需將這些干擾信息去除掉,最終得到的數(shù)據(jù)即為有效數(shù)據(jù),我們稱之為clean dates或clean reads。將clean data與NCBI的核苷酸數(shù)據(jù)庫進行比對,沒有發(fā)現(xiàn)其他來源的DNA污染。
(7)統(tǒng)計clean reads兩端為MseI捕獲的Reads數(shù)、捕獲的Reads數(shù)占Clean reads數(shù)的比率,即酶捕獲率。得出的酶捕獲率平均為98.45%,酶切效果良好,建庫合格。
(8)使用BWA比對軟件(參數(shù):mem-t 4-k 32-M-R),將親本和子代clean data的PE reads與參考基因組進行比對;使用SAMtools將比對結果進行格式轉換,轉換成SAM/BAM files;使用Perl腳本統(tǒng)計比對率和覆蓋度;使用SAMtools對比對結果進行排序(參數(shù):sort),用于變異檢測。參考基因組下載地址:ftp://ftp.ensemblgenomes.org/pub/plants/release-29/fasta/zea_mays/dna/2 ea_mays.AGPv3.29.dna.toplevel.fa.gz。
(9)對BWA比對結果進行過濾:特比對到基因組上唯一位置的reads挑選出來,進行后續(xù)分析;采用GATK(-type UnifiedGenotyper)對過濾后的bam文件進行群體SNP檢測。
(10)基于玉米親本基因型檢測結果,進行親本間多態(tài)性標記開發(fā)。過濾掉親本信息缺失的位點;篩選父母本都為純合且親本間具有多態(tài)性的位點(例如:在某個SNP位點親本1基因型為“GG”,親本2基因型為“AA”,親本基因型都為純合,且親本間基因型不相同)。完成親本間標記開發(fā)后,提取199子代在上述XX個親本多態(tài)性標記位點的基因型。
4、對分型后的子代標記進行篩選,得到高質量遺傳標記,采用binmap的方式,對所有標記進行bin的劃分,窗口設置為15個,使用R/qtl進行遺傳距離的計算,使用perl腳本進行畫圖。使用winQTLcart2.5軟件復合區(qū)間作圖法(CIM)進行QTL分析,搜索步長設定為1cM,采用的LOD臨界值為1000次permutation的閾值。
根據(jù)上述方法獲得了與玉米單株穗重性狀的QTL,與玉米單株穗重性狀的QTL定位結果如表1所示。由表1可知,本發(fā)明得到與單株穗重性狀的5個QTL位點,該QTL包括qEW-1、qEW-2、qEW-3、qEW-4和qEW-5;qEW-1定位在第4號染色體上,位于分子標記mk1399和mk1419之間,LOD值為4.2;qEW-2定位在第4號染色體上,位于分子標記mk1650和mk1660之間,LOD值為5.2;qEW-3定位在第7號染色體上,位于分子標記mk2462和mk2467之間,LOD值為5.2;qEW-4定位在第7號染色體上,位于分子標記mk2468和mk2473之間,LOD值為5.1;qEW-5定位在第7號染色體上,位于分子標記mk2483和mk2484之間,LOD值為4.4。
表1 與玉米單株穗重性狀的QTL定位結果
分子標記的信息如表2所示。分子標記mk1399的序列如SEQ ID NO.1所示,mk1399核苷酸序列第51處的核苷酸為G或T;分子標記mk1419的序列如SEQ ID NO.2所示,mk1419核苷酸序列第51處的核苷酸為G或A;分子標記mk1650的序列如SEQ ID NO.3所示,mk1650核苷酸序列第51處的核苷酸為T或A;分子標記mk1660的序列如SEQ ID NO.4所示,mk1660核苷酸序列第51處的核苷酸為A或G;分子標記mk2462的序列如SEQ ID NO.5所示,mk2462核苷酸序列第51處的核苷酸為C或T;分子標記mk2467的序列如SEQ ID NO.6所示,mk2467核苷酸序列第51處的核苷酸為A或C;分子標記mk2468的序列如SEQ ID NO.7所示,mk2468核苷酸序列第51處的核苷酸為C或T;分子標記mk2473的序列如SEQ ID NO.8所示,mk2473核苷酸序列第51處的核苷酸為G或A;分子標記mk2483的序列如SEQ ID NO.9所示,分子標記mk2483核苷酸序列第51處的核苷酸為A或C;分子標記mk2484的序列如SEQ ID NO.10所示,mk2484核苷酸序列第51處的核苷酸為G或A。
表2 與玉米單穗產(chǎn)量性狀的QTL的分子標記信息
實施例2
選取6個已知單株穗重的玉米品系,其中,3個品系為玉米高產(chǎn),3個品系為玉米低產(chǎn)。
分別提取上述6個品系的DNA基因組,用限制性內切酶MseI和HaeIII進行雙酶切,對DNA樣本(6葉期幼苗)進行GBS測序。
檢測實施例1開發(fā)的5個QTL位點和10個分子標記,利用5個QTL位點和10個分子標記能將玉米高產(chǎn)和玉米低產(chǎn)區(qū)別開來,單株穗重鑒定與分子標記結果一致。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明實質內容上所作的任何修改、等同替換和簡單改進等,均應包含在本發(fā)明的保護范圍之內。
序列表
<110> 六盤水師范學院
<120> 玉米單株穗重主效QTL、其獲得方法及應用
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 101
<212> DNA
<213> 人工序列
<400> 1
aaggaagaag gtgacttttc aaaataccct tatgttttct ataatctttt gaggttttaa 60
acttttacat cttagtccat aattataaaa catgtacaaa t 101
<210> 2
<211> 101
<212> DNA
<213> 人工序列
<400> 2
gcgagtcttg tgattaatta aaattcatcg attgtgcaaa tacgaatttg ggaatttagt 60
tcagacatcc gatttcatcc caaacaaatt tattagaatt c 101
<210> 3
<211> 101
<212> DNA
<213> 人工序列
<400> 3
aaggaagaag gtgacttttc aaaataccct tatgttttct ataatctttt gaggttttaa 60
acttttacat cttagtccat aattataaaa catgtacaaa t 101
<210> 4
<211> 101
<212> DNA
<213> 人工序列
<400> 4
aaatgagatt ggttcgttag tcttttatag tttcttataa ctcaattatg actccgccgg 60
cttgacttgt ggattggttg ctttgaccat cagatgcttg a 101
<210> 5
<211> 101
<212> DNA
<213> 人工序列
<400> 5
atgtgttgtg ggaaaactta cctgaacttg tatttcacca ttgtgaagtc cgattgcttc 60
atgttgcata agaattacag tttatatttg caaatatata t 101
<210> 6
<211> 101
<212> DNA
<213> 人工序列
<400> 6
acaacttgcc ttatacttgc gataacttgt tgtccagatg ttgacccaaa agttgggctt 60
ctgattcctc gtcacctcgc ctctactcgt agcaatacat a 101
<210> 7
<211> 101
<212> DNA
<213> 人工序列
<400> 7
gctcgaataa taacataaaa gatagtaata gtcgattaca tcatgatgtc cgagacatcc 60
acatagtctt taacaattat caaagtgcgg aaatgaaaca t 101
<210> 8
<211> 101
<212> DNA
<213> 人工序列
<400> 8
tatgctttaa ctcttgtagc ttcgcatgaa agacacgcac tacaagatcc ggacgatctt 60
gcggtgtctg cccagggaga agctccctcc ttatctcatc c 101
<210> 9
<211> 101
<212> DNA
<213> 人工序列
<400> 9
aagtaggaca tgataggtct gaggacactt gccttcacca ggttgttgct aagagggatc 60
ttcggcaaca cactcaggaa cctcggactg ctcgttgtct a 101
<210> 10
<211> 101
<212> DNA
<213> 人工序列
<400> 10
ttcggaagag aagcgccggg gatgagatcg atctgatgct caatgccacg gaggggagga 60
agacccggtg gtaagtccgt aggataaaca tcagcatact c 101