一種sgRNA的設(shè)計方法及構(gòu)建的慢病毒載體、質(zhì)粒的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于基因編輯和載體設(shè)計領(lǐng)域,具體涉及一種sgRNA的設(shè)計方法及含有 CRISPR/Cas9系統(tǒng)的靶向敲除質(zhì)粒和慢病毒載體的優(yōu)化設(shè)計和應(yīng)用。
【背景技術(shù)】
[0002] CRISPR(Clustered regularly interspaced short palindromic repeats),被稱 為規(guī)律成簇間隔短回文重復(fù),實際上就是一種基因編輯器,是細菌用以保護自身對抗噬菌 體的一個系統(tǒng),也是一種對付攻擊者的基因武器。過去幾年的一系列報道指出,它可以用來 刪除、添加、激活或抑制其他生物體的目標(biāo)基因,這些目標(biāo)基因包括人、老鼠、斑馬魚、細菌、 果蠅、酵母、線蟲和農(nóng)作物細胞內(nèi)的基因。
[0003] CRISPR簇是一個廣泛存在于細菌和古生菌基因組中的特殊DNA重復(fù)序列家族, 其序列由一個前導(dǎo)區(qū)(Leader)、多個短而高度保守的重復(fù)序列區(qū)(Itepeat)和多個間隔區(qū) (Spacer)組成。前導(dǎo)區(qū)一般位于CRISPR簇上游,是富含AT長度為300~500bp的區(qū)域, 被認(rèn)為可能是CRISPR簇的啟動子序列。重復(fù)序列區(qū)長度為21~48bp,含有回文序列,可 形成發(fā)卡結(jié)構(gòu)。重復(fù)序列之間被長度為26~72bp的間隔區(qū)隔開。Spacer區(qū)域由俘獲的 外源DNA組成,類似免疫記憶,當(dāng)含有同樣序列的外源DNA入侵時,可被細菌識別,并進行剪 切使之表達沉默,達到保護自身安全的目的。通過對CRISPR簇的側(cè)翼序列分析發(fā)現(xiàn),在其 附近存在一個多態(tài)性家族基因。該家族編碼的蛋白質(zhì)均含有可與核酸發(fā)生作用的功能域 (具有核酸酶、解旋酶、整合酶和聚合酶等活性),并且與CRISPR區(qū)域共同發(fā)揮作用,因此被 命名為CRISPR關(guān)聯(lián)基因 (CRISPR associated),縮寫為Cas。目前發(fā)現(xiàn)的Cas包括Casl~ CaslO等多種類型。Cas基因與CRISPR共同進化,構(gòu)成一個高度保守的系統(tǒng)。
[0004] CRISPR的工作原理是,當(dāng)細菌抵御噬菌體等外源DNA入侵時,在前導(dǎo)區(qū)的調(diào)控下, CRISPR被轉(zhuǎn)錄為長的RNA前體(Pre RISPR RNA,pre-crRNA),然后加工成一系列短的含有 保守重復(fù)序列和間隔區(qū)的成熟crRNA,最終識別并結(jié)合到與其互補的外源DNA序列上發(fā)揮 剪切作用。目前發(fā)現(xiàn)的CRISPR/Cas系統(tǒng)有三種不同類型即I型、II型和III型,它們存在 于大約40%已測序的真細菌和90%已測序的古細菌中。其中II型的組成較為簡單,以Cas9 蛋白以及向?qū)NA (gRNA)為核心組成,也是目前研宄最深入的類型。
[0005] 在II型系統(tǒng)中,pre-crRNA的加工由Cas家族中的Cas9單獨參與。Cas9含 有在氨基末端的RuvC和蛋白質(zhì)中部的HNH2個獨特的活性位點,在crRNA成熟和雙鏈 DNA剪切中發(fā)揮作用。此外,pre-crRNA轉(zhuǎn)錄的同時,與其重復(fù)序列互補的反式激活 crRNA (Trans-activating crRNA,tracrRNA)也轉(zhuǎn)錄出來,并且激發(fā)Cas9和雙鏈RNA特異性 RNase III核酸酶對pre-crRNA進行加工。加工成熟后,crRNA、tracrRNA和Cas9組成復(fù)合 體,識別并結(jié)合于crRNA互補的序列,然后解開DNA雙鏈,形成R-loop,使crRNA與互補鏈雜 交,另一條鏈保持游離的單鏈狀態(tài),然后由Cas9中的HNH活性位點剪切crRNA的互補DNA 鏈,RuvC活性位點剪切非互補鏈,最終導(dǎo)致DNA雙鏈斷裂(DSB)。CRISPR/Cas9的剪切位點 位于 crRNA 互補序列下游鄰近的 PAM 區(qū)(Protospacer Adjacent Motif)的 5'-N20-NGG-3' 特征區(qū)域中的NGG位點,而這種特征的序列在每8bp的隨機DNA序列中就重復(fù)出現(xiàn)一次。
[0006] 與過去數(shù)十年里進行基因工程改造的其它任何方法相比,CRISPR技術(shù)的優(yōu)點在于 它使用單一的酶。這種酶不需要改變設(shè)定目標(biāo)的每一個點,只需要使用一個不同的RNA副 本對它進行重新編輯,這很容易設(shè)計和實現(xiàn)。為促進CRISPR - Cas9基因編輯技術(shù)的廣泛 應(yīng)用,進一步提高切割效率非常必要。另外,該技術(shù)目前還存在脫靶問題,因為已經(jīng)發(fā)現(xiàn),對 于長度為20bp的SgRNA,即使有3 - 4個非匹配堿基序列,也可能會有切割效果。因此本發(fā) 明的目的之一就是怎樣設(shè)計高效、低脫靶的sgRNA。
[0007] 哈佛醫(yī)學(xué)院的George Church研宄小組生成了一種Cas9突變體,它不會引致雙鏈 斷裂,每個缺口只影響一條DNA鏈。如果使用2個SgRNA識別臨近的靶序列,這一策略可造 成雙鏈斷裂,但它通常不會導(dǎo)致非同源末端連接(雙鏈斷裂的一種細胞修復(fù)機制)引起的 插入或刪除。因此,這種方法會減少脫靶效應(yīng)。但這種方法會需要2個SgRNA才能作用,使 系統(tǒng)復(fù)雜性增加,不便操作。為了克服該不足,本發(fā)明的解決方案是,把sgRNA的長度從20 個寡核苷酸減少到17bp。我們發(fā)現(xiàn),只要有一個核苷酸不匹配,基因敲除效果幾乎完全消 失,因此可以極大地減少脫靶效應(yīng)。
[0008] 慢病毒載體是基因治療中最有前途的基因轉(zhuǎn)移方法之一。慢病毒(Lentivirus) 載體是以HIV-I (人類免疫缺陷I型病毒)為基礎(chǔ)發(fā)展起來的基因治療載體。慢病毒載體 較逆轉(zhuǎn)錄病毒載體有更廣的宿主范圍,慢病毒能夠有效感染未進入細胞周期的細胞和有絲 分裂后的細胞。慢病毒表達載體包含包裝、轉(zhuǎn)染、穩(wěn)定整合所需要的遺傳信息。慢病毒包裝 質(zhì)粒轉(zhuǎn)錄翻譯后,提供所有的包裝RNA和重組的假病毒載體所需要的所有輔助蛋白。該載 體可以將外源基因有效地整合到宿主染色體上,從而達到持久性表達。對于一些較難轉(zhuǎn)染 的細胞,如神經(jīng)元細胞、肝細胞、心肌細胞、腫瘤細胞、內(nèi)皮細胞、干細胞、不分化的細胞等, 能大大提高目的基因轉(zhuǎn)導(dǎo)效率。而且目的基因整合到宿主細胞基因組的幾率也大大增加, 從而達到良好的的基因治療或基因敲除效果。在美國已經(jīng)開展了慢病毒基因治療的臨床研 宄,效果非常理想,因此具有廣闊的應(yīng)用前景。
[0009] 第三代慢病毒包裝系統(tǒng)由一個目的基因質(zhì)粒、兩個包裝質(zhì)粒、一個包膜質(zhì)粒組成。 其中包裝質(zhì)粒在CMV啟動子的控制下,表達HIV復(fù)制所需的全部反式激活蛋白,但不產(chǎn)生病 毒包膜蛋白及輔助蛋白vpu ;包膜蛋白質(zhì)粒編碼水泡性口炎病毒G蛋白(VSVG),應(yīng)用VSVG 包膜的假構(gòu)型慢病毒載體擴大了載體的靶細胞嗜性范圍,而且增加了載體的穩(wěn)定性,允許 通過高速離心對載體進行濃縮,提高了滴度;轉(zhuǎn)移質(zhì)粒中除含有包裝、逆轉(zhuǎn)錄及整合所需的 順式序列,還保留350bp的gag和RRE,并在其中插入目的基因或標(biāo)志基因(如綠色熒光蛋 白GFP)。為產(chǎn)生高滴度的病毒顆粒,需要利用將攜帶目的基因/sgRNA的慢病毒載體和包裝 質(zhì)粒同時共轉(zhuǎn)染293T細胞,在細胞中進行病毒的包裝,包裝好的假病毒顆粒分泌到細胞外 的培養(yǎng)基中,離心取得上清液后,濃縮可獲得高滴度病毒。宿主細胞的感染后,目的基因進 入到宿主細胞,經(jīng)過反轉(zhuǎn)錄,整合到基因組,從而高水平的表達效應(yīng)分子。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明的目的之一在于提供一種sgRNA設(shè)計的方法;
[0011] 本發(fā)明的目的之二在于提供可實現(xiàn)高效基因敲除的慢病毒載體;
[0012] 本發(fā)明的目的之三在于提供可實現(xiàn)高效基因敲除的瞬時轉(zhuǎn)染質(zhì)粒。
[0013] 本發(fā)明采用的技術(shù)方案為:
[0014] -種SgRNA的設(shè)計方法,該方法中,SgRNA設(shè)計的長度為17bp或18bp,SgRNA的末 端帶有G或A ;祀序列為(N16)GNGG、(N16)ANGG、(N16)CNCC或(N16)TNCC ;當(dāng)?shù)谝粋€堿基為 A、C或T,在前面加 g。
[0015] 進一步,該方法還包括:在 TagScan((Genome_wide Tag Scanner)http://ccg. vital-it.ch/tagger/tagscan.html)數(shù)據(jù)庫中搜索基因組中是否有類似序列;對于17bp 長(如GN15G)NGG)的sgRNA,當(dāng)另有完全匹配的序列,拋棄該sgRNA,再測試其他合適序列; 對于18bp長(如gN16G)NGG)的sgRNA,當(dāng)另有且只有1個非匹配核苷酸的序列,也拋棄該 sgRNA,繼續(xù)測試其他具有設(shè)計的sgRNA序列。
[0016] 優(yōu)選地,該sgRNA的設(shè)計中,GC含量為40 - 80 %。
[0017] 更優(yōu)選地,靶序列位于ORF編碼序列的中端或前端。
[0018] 優(yōu)選地,該sgRNA的設(shè)計中,sgRNA的末端帶有G,靶序列為(N16) GNGG或(N16) CNCCo
[0019] CRISPR編輯系統(tǒng)使用來源于 Streptococcus pyogenes 細菌的 Cas9 (SpyCas9)。該 系統(tǒng)要求在革E序列的3'末端存在NGG的PAM(protospacer adjacent motif)位點。大規(guī) 模篩查發(fā)現(xiàn),NGG前端一個核苷酸對sgRNA的功效影響極大:若為G,則效率最高;若為A, 效率次高。因此,為增強sgRNA打靶效率,我們所設(shè)計的sgRNA的末端帶有G或A。靶序列 為(N16)GNGG、(N16)ANGG、(N16)CNCC或(N16)TNCC。平均每16個堿基對就可設(shè)計出一個 優(yōu)化的sgRNA。由于U6啟動子必須從G開始進行轉(zhuǎn)錄,若第一個堿基為A、C或T,在