經(jīng)修飾的級聯(lián)核糖核蛋白及其用途
【專利摘要】一種用于適應(yīng)性抗病毒防御的成簇規(guī)律間隔短回文重復(fù)序列(CRISPR)相關(guān)復(fù)合物(級聯(lián));所述級聯(lián)蛋白質(zhì)復(fù)合物至少包含CRISPR相關(guān)蛋白質(zhì)亞基Cas7、Cas5和Cas6,其包括至少一個具有額外的氨基酸序列的亞基,該額外的氨基酸序列具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性。所述具有額外的活性的級聯(lián)復(fù)合物與RNA分子組合,以產(chǎn)生核糖核蛋白復(fù)合物。該RNA分子被選擇為與靶序列具有實質(zhì)互補性。靶向的核糖核蛋白可用作遺傳工程工具,在同源重組、非同源末端連接、基因修飾、基因整合、突變修復(fù)中用于核酸的精確切割,或用于它們的可視化、轉(zhuǎn)錄激活或抑制。與FokI二聚體融合的一對核糖核苷酸可用于在DNA中產(chǎn)生雙鏈斷裂,從而以序列特異性的方式促進這些應(yīng)用。
【專利說明】經(jīng)修飾的級聯(lián)核糖核蛋白及其用途
[0001] 本發(fā)明涉及遺傳工程領(lǐng)域,更具體地涉及生物體(包括原核生物和真核生物)的 基因和/或基因組修飾領(lǐng)域。本發(fā)明還涉及制作在基因組分析和遺傳修飾方法中使用(無 論體內(nèi)還是體外)的位點特異性工具的方法。本發(fā)明更具體地涉及以序列特異性方式識別 并關(guān)聯(lián)于核酸序列的核糖核蛋白的領(lǐng)域。
[0002] 細菌和古細菌具有多種多樣的針對侵入性DNA的防御機制。所謂的CRISPR/Cas 防御系統(tǒng)通過將質(zhì)粒和病毒DNA片段整合到宿主染色體上的成簇規(guī)律間隔短回文重復(fù)序 列(CRISPR)的基因座中來提供適應(yīng)性免疫。病毒或質(zhì)粒來源的序列,被稱為間隔區(qū),由重 復(fù)的宿主來源的序列彼此隔開。這些重復(fù)元件是該免疫系統(tǒng)的遺傳記憶,并且每個CRISPR 基因座都含有在先前遇到外來遺傳元件期間獲得的獨特"間隔區(qū)"序列的多樣的所有組成 成分(repertoire) 〇
[0003] 外來DNA的獲得是免疫的第一步,但是保護則需要將CRISPR轉(zhuǎn)錄,并且需要將這 些長的轉(zhuǎn)錄物加工成短的CRISPR來源的RNA(crRNA),這些CRISPR來源的RNA各自含有與 外來核酸攻擊物(challenger)互補的獨特間隔區(qū)序列。
[0004] 除了 CrRNA,在若干生物體中的遺傳實驗已表明,獲得免疫力的步驟、CrRNA生物 發(fā)生和靶向干擾還需要一組獨特的CRISPR相關(guān)(Cas)蛋白質(zhì)。另外,來自在系統(tǒng)發(fā)生上不 同的CRISPR系統(tǒng)的Cas蛋白亞組已被證明裝配成包括crRNA的大復(fù)合物。
[0005] 最近對CRISPR/Cas系統(tǒng)的多樣性的重新評估導(dǎo)致分類為三種不同的類型 (Makarova K?等人(2011)Nature Reviews Microbiology-A0P, 2011 年 5 月 9 日; doi : 10. 1038/nrmicro2577),這些類型在cas基因含量上有所不同,并在整個CRISPR防御 途徑中顯現(xiàn)出很大的差異。(本說明書中對CRISPR相關(guān)基因采用了 Makarova分類和命名 法。)CRISPR基因座的RNA轉(zhuǎn)錄物(前crRNA)在I型和III型系統(tǒng)中被CRISPR相關(guān)(Cas) 內(nèi)切核糖核酸酶或在II型系統(tǒng)中被RNAase III在重復(fù)序列上特異性切割;生成的crRNA 被Cas蛋白復(fù)合物所利用,作為引導(dǎo)RNA來檢測入侵DNA或RNA的互補序列。靶核酸的切 割已在體外針對以尺子錨定機制(ruler-anchored mechanism)切割RNA的強烈火球菌 (Pyrococcus furiosus) III-B型系統(tǒng)得到證實,并且最近在體內(nèi)針對在互補祀序列(原間 隔區(qū)(protospacer))上切割 DNA 的嗜熱鏈球菌(Streptococcus thermophiles) II 型系統(tǒng) 得到證實。相比之下,對I型系統(tǒng)而言,CRISPR干擾的機制仍然在很大程度上是未知的。
[0006] 模式生物體大腸桿菌(Escherichia coli)菌株K12擁有CRISPR/Cas I-E型(之 前被稱為CRISPR E亞型(Cse))。它含有八個cas基因(casl、cas2、cas3和csel、cse2、 cas7、cas5、cas6e)和下游CRISPR(2型重復(fù))。在大腸桿菌K12中,這八個cas基因編碼在 CRISPR基因座的上游。Casl和Cas2似乎不是靶向干擾所需要的,而很有可能參與新靶序列 的獲得。相比之下,六種〇 &8蛋白刃861、〇862工&83、0&87工 &85和〇8866(之前也分別被稱 為CasA、CasB、Cas3、CasC/Cse4、CasD和CasE/Cse3)對于針對入噬菌體攻擊的保護而言 是必需的。這些蛋白質(zhì)中的五種<861、〇862乂 &87、0&85和0&866(之前分別被稱為0 &8八、 CasB、CasC/Cse4、CasD 和 CasE/Cse3)與 crRNA -起裝配以形成被稱為級聯(lián)(Cascade)的 多亞基核糖核蛋白(RNP)。
[0007] 在大腸桿菌中,級聯(lián)(Cascade)是一種405kDa的核糖核蛋白復(fù)合物,其由化學(xué)計 量不等的五種功能上必需的Cas蛋白Csel 1CseZ2CasT6CasS1Casee1 (即,按以前的命名法為 CasA1B2C6D1E 1)以及61-nt CRISPR來源的RNA所組成。級聯(lián)是專性RNP,其依賴于crRNA以 供復(fù)合物裝配和穩(wěn)定性以及入侵核酸序列的鑒別。級聯(lián)是一種監(jiān)視復(fù)合物,其發(fā)現(xiàn)并結(jié)合 與crRNA的間隔區(qū)序列互補的外來核酸。
[0008]標題為"Structural basis for CRISPR RNA-guided DNA recognition by Cascade" 的 Jore 等人(2011),Nature Structural&Molecular Biologyl8:529 - 537 描述 了前crRNA轉(zhuǎn)錄物如何被級聯(lián)的Cas6e亞基所切割,從而導(dǎo)致成熟的6 Int crRNA被CRISPR 復(fù)合物所保留。crRNA作為引導(dǎo)RNA,用于通過crRNA間隔區(qū)與互補的原間隔區(qū)之間的堿基 配對,級聯(lián)與雙鏈(ds)DNA分子的序列特異性結(jié)合,從而形成所謂的R-環(huán)。已知這是一個 ATP非依賴性的過程。
[0009]標題為 "Small CRISPR RNAs guide antiviral defense in prokaryotes,'的 fcouns S. J. J?等人(2008),Science 321:960-964 教導(dǎo)了載有 crRNA 的級聯(lián)需要 Cas3 來 形成體內(nèi)噬菌體抗性。
[0010]標題為 "CRISPR interference: RNA-directed adaptive immunity in bacteria and archaea,' 的 Marraffini L.和 Sontheimer E. (2010), Nature Reviews Genetics 11:181-190是一篇綜述文章,其總結(jié)了本領(lǐng)域現(xiàn)有技術(shù)的知識狀態(tài)。針對基于CRISPR的應(yīng) 用和技術(shù)提出了一些建議,但這主要是在產(chǎn)生用于乳制品行業(yè)的馴化細菌的噬菌體抗性株 的領(lǐng)域。提出強烈火球菌中crRNP復(fù)合物對RNA分子的體外特異性切割還有待于進一步開 發(fā)。還提出對CRISPR系統(tǒng)的操作是一種可能的在醫(yī)院中減少抗生素抗性菌株傳播的方式。 作者強調(diào),將需要進一步的研究工作來探索該技術(shù)在這些領(lǐng)域的潛在效用。
[0011] 名稱為"Genetic cluster of strains of Streptococcus thermophilus having unique rheological properties for dairy fermentation,'的 US2011236530A1(Manoury 等人)公開了能發(fā)酵牛奶從而使其具有高度粘性和弱拉絲性(weakly ropy)的某些嗜熱鏈 球菌(S. thermophilus)菌株。公開了限定序列的特定CRISPR基因座。
[0012] 名稱為"Cas6polypeptidesandmethodsofuse"的US2011217739A1(Terns 等人)公開了具有Cas6內(nèi)切核糖核酸酶活性的多肽。該多肽切割具有Cas6識別域和切 割位點的靶RNA多核苷酸。切割可在體外或體內(nèi)進行。對諸如大腸桿菌或沃氏富鹽菌 (Haloferaxvolcanii)的微生物進行遺傳修飾以使其表達Cas6內(nèi)切核糖核酸酶活性。
[0013]名稱為"BifidobacteriaCRISPRsequences,'的W02010054154 (Danisco)公開了 在雙歧桿菌中發(fā)現(xiàn)的各種CRISPR序列,以及它們在制備細菌的遺傳改變的菌株中的用途, 其中該遺傳改變的菌株在其噬菌體抗性特征方面進行了改變。
[0014]名稱為"Prokaryotic RNAi-like system and methods of use" 的 US2011189776A1 (Terns等人)描述了在體外或在原核微生物體內(nèi)滅活靶多核苷酸的方法。 該方法使用具有5-10個核苷酸的5'區(qū)的psiRNA,該核苷酸選自來自緊臨間隔區(qū)上游的 CRISPR基因座的重復(fù)序列。3'區(qū)與靶多核苷酸的一部分實質(zhì)互補。還描述了在psiRNA和 靶多核苷酸的存在下具有內(nèi)切核酸酶活性的多肽。
[0015]名稱為"UseofCRISPRassociatedgenes(CAS)" 的EP2341149A1 (Danisco)描 述了一個或多個Cas基因如何能用于調(diào)節(jié)細菌細胞對噬菌體的抗性;特別是在乳制品中提 供起子培養(yǎng)物或益生菌培養(yǎng)物的細菌。
[0016] 名稱為 "Compositions and methods for downregulating prokaryotic genes,' 的 W02010075424 (The Regents of the University of California)公開了包含 CRISPR 陣列的分離的多核苷酸。CRISPR的至少一個間隔區(qū)與原核生物的基因互補,從而能夠下調(diào) 該基因的表達;特別是當該基因與生物燃料生產(chǎn)相關(guān)時。
[0017]名稱為"Culture s with improved phage resistance" 的 W02008108989 (Danisco)公開了選擇細菌的噬菌體抗性菌株,以及選擇具有與噬菌體RNA 的區(qū)域有100%同一性的額外的間隔區(qū)的菌株。描述了用于乳制品行業(yè)的改良的菌株組合 以及起子培養(yǎng)物輪換。描述了用作生物防治劑的某些噬菌體。
[0018]名稱為"Molecular typing and subtyping of Salmonella by identification of the variable nucleotide sequences of the CRISPR loci" 的 W02009115861(Institut Pasteur)公開了檢測和鑒定沙門氏菌屬(Salmonella)細菌的方法,該方法利用了它們包 含在CRISPR基因座中的可變核苷酸序列。
[0019]名稱為 " Det ec t ion and typ ing of bact er ial s trains " 的 W02006073445 (Danisco)描述了食物產(chǎn)品、膳食補充劑和環(huán)境樣品中的細菌菌株的檢測和 分型。通過特定CRISPR核苷酸序列來鑒定乳桿菌屬(Lactobacillus)的菌株。
[0020] 標題為 "Genome editing with engineered zinc finger nucleases" 的 Urnov F 等人(2010),Nature 11:636 - 646是一篇關(guān)于鋅指核酸酶及其如何已經(jīng)在一系列模式生 物中的反向遺傳學(xué)領(lǐng)域中發(fā)揮作用的綜述文章。已經(jīng)開發(fā)了鋅指核酸酶,從而使得精確靶 向基因組切割成為可能,其后是在隨后的修復(fù)過程中的基因修飾。然而,鋅指核酸酶是通過 將一些鋅指DNA結(jié)合域與DNA切割域融合而產(chǎn)生的。DNA序列特異性是通過串聯(lián)地偶聯(lián)若 干鋅指而實現(xiàn)的,其中每個鋅指均識別三核苷酸基序。該技術(shù)的顯著缺點在于需要為每一 個需要進行切割的新DNA基因座開發(fā)新的鋅指。這需要蛋白質(zhì)工程和廣泛的篩選,以確保 DNA結(jié)合的特異性。
[0021] 在遺傳工程和基因組研究領(lǐng)域中,持續(xù)需要用于序列/位點特異性核酸檢測和/ 或切割的改進試劑。
[0022] 本發(fā)明人驚奇地發(fā)現(xiàn),某些表達具有解旋酶-核酸酶活性的Cas3的細菌將Cas3 表達為與Csel的融合體。本發(fā)明人還出乎意料地已經(jīng)能夠生產(chǎn)Csel與其他核酸酶的人工 融合體。
[0023] 本發(fā)明人還發(fā)現(xiàn),級聯(lián)進行的Cas3非依賴性靶DNA識別標記出DNA以供Cas3切 害I],并且發(fā)現(xiàn)該級聯(lián)DNA結(jié)合受該靶DNA的拓撲學(xué)要求支配。
[0024] 本發(fā)明人進一步發(fā)現(xiàn),級聯(lián)無法結(jié)合松弛的靶質(zhì)粒,但令人驚訝的是級聯(lián)對具有 負超螺旋(nSC)拓撲結(jié)構(gòu)的靶標顯現(xiàn)出高親和性。
[0025] 因此,在第一方面,本發(fā)明提供了一種用于抗病毒防御的成簇規(guī)律間隔短回文重 復(fù)序列(CRISPR)相關(guān)復(fù)合物(級聯(lián)),該級聯(lián)蛋白復(fù)合物或其部分至少包含如下CRISPR相 關(guān)蛋白質(zhì)亞基:
[0026]-Cas7(或COG 1857),其具有SEQ ID NO: 3的氨基酸序列或與之有至少18%同一 性的序列,
[0027] 4&85(或〇?1688),其具有5£0 10勵:4的氨基酸序列或與之有至少17%同一性 的序列,和
[0028] -Cas6(或COG 1583),其具有SEQ ID NO: 5的氨基酸序列或與之有至少16%同一 性的序列;
[0029] 并且其中至少一個亞基包括提供核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑 制活性的額外的氨基酸序列。
[0030] 包括具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨基酸 序列的亞基是可被稱為"連接到至少一個功能性部分上的亞基"的一個實例;功能性部分是 由所述額外的氨基酸序列組成的多肽或蛋白質(zhì)。轉(zhuǎn)錄激活活性可以是導(dǎo)致期望基因的激活 或上調(diào)的活性;轉(zhuǎn)錄抑制活性導(dǎo)致期望基因的抑制或下調(diào)。如下文所進一步描述的,基因的 選擇是由于具有RNA分子的本發(fā)明級聯(lián)復(fù)合物的靶向。
[0031] 具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨基酸序列 優(yōu)選由連續(xù)的氨基酸殘基形成。這些額外的氨基酸可被視為多肽或蛋白質(zhì),其為連續(xù)的,并 形成所關(guān)注的Cas或Cse亞基的一部分。這樣的多肽或蛋白質(zhì)序列優(yōu)選地通常不是任何 Cas或Cse亞基氨基酸序列的部分。換言之,具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn) 錄抑制活性的額外的氨基酸序列可能不同于Cas或Cse亞基氨基酸序列或其部分,即可能 不同于Cas3亞基氨基酸序列或其部分。
[0032] 根據(jù)需要,具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨 基酸序列可獲自或來源于相同的生物體,例如大腸桿菌,作為Cas或Cse亞基。
[0033] 除以上內(nèi)容以外和/或可替代地,具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn) 錄抑制活性的額外的氨基酸序列可能是與Cas或Cse亞基的氨基酸序列"異源"的。因此, 所述額外的氨基酸序列可獲自或來源于與Cas和/或Cse亞基所來源或起源的生物體不同 的生物體。
[0034] 本文中,序列同一性可通過在國家生物技術(shù)信息中心(National Center for Biotechnology Information)網(wǎng)絡(luò)服務(wù)器上的BLAST和隨后的Cobalt多序列比對來確定, 在該網(wǎng)絡(luò)服務(wù)器上將所討論的序列與參考序列(例如,SEQ ID N0:3、4或5)進行比較??梢?依據(jù)基于BL0SUM62矩陣的序列相似性百分比,或與給定的參考序列(例如,SEQ ID N0:3、4 或5)的同一性百分比來定義氨基酸序列。序列的相似性或同一性涉及在計算與參考序列 的保守百分比之前進行最優(yōu)排列的初始步驟,并反映序列的進化關(guān)系的度量。
[0035] Cas7可具有與SEQ ID N0:3至少31%的序列相似性;Cas5可具有與SEQ ID N0:4 至少26%的序列相似性。Cas6可具有與SEQ ID N0:5至少27%的序列相似性。
[0036]對于 Csel/CasA(502 個氛基酸):
[0037] >gi 116130667 I ref I NP_417240. 11 含有 CRISP RNA(crRNA)的級聯(lián)抗病毒復(fù)合蛋 白[大腸桿菌菌株K-12亞株MG1655]
[0038] MNLLIDNWIPVRPRNGGKVQIINLQSLYCSRDQWRLSLPRDDMELAALALLVCIGQIIAPAKDDVEFRH RIMNPLTEDEFQQLIAPWIDMFYLNHAEHPFMQTKGVKANDVTPMEKLLAGVSGATNCAFVNQPGQGEALCGGCTAI ALFNQANQAPGFGGGFKSGLRGGTPVTTFVRGIDLRSTVLLNVLTLPRLQKQFPNESHTENQPTWIKPIKSNESIPA SSIGFVRGLFWQPAHIELCDPIGIGKCSCCGQESNLRYTGFLKEKFTFTVNGLWPHPHSPCLVTVKKGEVEEKFLAF TTSAPSWTQISRVVVDKIIQNENGNRVAAVVNQFRNIAPQSPLELIMGGYRNNQASILERRHDVLMFNQGWQQYGNV INEIVTVGLGYKTALRKALYTFAEGFKNKDFKGAGVSVHETAERHFYRQSELLIPDVLANVNFSQADEVIADLRDKL HQLCEMLFNQSVAPYAHHPKLISTLALARATLYKHLRELKPQGGPSNG[SEQIDN0:1]
[0039]對于Cse2/CasB(160個氨基酸):
[0040] >gi 116130666|ref|NP_417239. 11 含有CRISPRNA(crRNA)的級聯(lián)抗病毒復(fù)合蛋 白[大腸桿菌菌株K-12亞株MG1655]
[0041] MADEIDAMALYRAWQQLDNGSCAQIRRVSEPDELRDIPAFYRLVQPFGWENPRHQQALLRMVFCLSAG KNVIRHQDKKSEQTTGISLGRALANSGRINERRIFQLIRADRTADMVQLRRLLTHAEPVLDWPLMARMLTWWGKRE RQQLLEDFVLTTNKNA[SEQIDNO:2]
[0042]對于Cas7/CasC/Cse4(363 個氛基酸):
[0043] >gi 116130665IrefINP_417238. 11 含有CRISPRNA(crRNA)的級聯(lián)抗病毒復(fù)合蛋 白[大腸桿菌菌株K-12亞株MG1655]
[0044] MSNFINIHVLISHSPSCLNRDDMNMQKDAIFGGKRRVRISSQSLKRAMRKSGYYAQNIGESSLRTIHLA QLRDVLRQKLGERFDQKIIDKTLALLSGKSVDEAEKISADAVTPWVVGEIAWFCEQVAKAEADNLDDKKLLKVLKED IAAIRVNLQQGVDIALSGRMATSGMMTELGKVDGAMSIAHAITTHQVDSDIDWFTAVDDLQEQGSAHLGTQEFSSGV FYRYANINLAQLQENLGGASREQALEIATHVVHMLATEVPGAKQRTYAAFNPADMVMVNFSDMPLSMANAFEKAVKA KDGFLQPSIQAFNQYWDRVANGYGLNGAAAQFSLSDVDPITAQVKQMPTLEQLKSWVRNNGEA[SEQIDNO:3]
[0045]對于Cas5/CasD(224個氛基酸):
[0046] >giI9Olll483IrefINPjl7237.2I含有CRISPRNA(crRNA)的級聯(lián)抗病毒復(fù)合蛋 白[大腸桿菌菌株K-12亞株MG1655]
[0047] MRSYLILRLAGPMQAWGQPTFEGTRPTGRFPTRSGLLGLLGACLGIQRDDTSSLQALSESVQFAVRCDE LILDDRRVSVTGLRDYHTVLGAREDYRGLKSHETIQTWREYLCDASFTVALWLTPHATMVISELEKAVLKPRYTPYL GRRSCPLTHPLFLGTCQASDPQKALLNYEPVGGDIYSEESVTGHHLKFTARDEPMITLPRQFASREWYVIKGGMDVS Q[SEQIDNO:4]
[0048]對于Cas6e/CasE(199AA):
[0049] >gi 116130663IrefINP_417236.IICRISPRRNA前體切割酶;含有CRISP RNA(crRNA)的級聯(lián)抗病毒復(fù)合蛋白[大腸桿菌菌株K-12亞株MG1655]
[0050] MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATVI KTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARVEDVHPISERP QYFS⑶GKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL[SEQIDNO:5]
[0051] 在定義落入本發(fā)明范圍內(nèi)的序列變體的范圍時,為避免疑問,以下為分別對變異 程度的可選限制,將應(yīng)用于SEQ ID NO: 1、2、3、4或5中的每一個,起始于如依據(jù)上述各個 同一性百分比所規(guī)定的變體的相應(yīng)最寬范圍。因此,變體的范圍可包括:至少16%、或至少 17%、或至少18%、或至少19%、或至少20%、或至少21 %、或至少22%、或至少23%、或至 少24%、或至少25%、或至少26%、或至少27%、或至少28%、或至少29%、或至少30%、 或至少31 %、或至少32%、或至少33%、或至少34%、或至少35%、或至少36 %、或至少 37 %、或至少38 %、或至少39 %、或至少40 %、或至少41 %、或至少42 %、或至少43 %,至少 44 %、或至少45 %、或至少46 %、或至少47 %、或至少48 %、或至少49 %、或至少50 %、或至 少51 %、或至少52 %、或至少53 %、或至少54%、或至少55 %、或至少56 %、或至少57 %、或 至少58 %、或至少59 %、或至少60 %、或至少61 %、或至少62 %、或至少63 %、或至少64 %、 或至少65 %、或至少66 %、或至少67%、或至少68%、或至少69%、或至少70%、或至少 71 %,至少72 %、或至少73 %、或至少74 %、或至少75 %、或至少76 %、或至少77 %、或至少 78 %、或至少79 %、或至少80 %、或至少81 %、或至少82 %、或至少83 %、或至少84%、或至 少85 %、或至少86 %、或至少87 %、或至少88 %、或至少89 %、或至少90 %、或至少91 %、或 至少92 %、或至少93 %、或至少94 %、或至少95 %、或至少96 %、或至少97 %、或至少98 %、 或至少99 %或100 %的氨基酸序列同一性。
[0052] 本文中,在Cas蛋白亞基的定義中一直使用Makarova等人(2011)的命名法。 Makarova等人的文章在第5頁的表2中列出了 Cas基因以及它們所屬的家族和超家族的名 稱。本文中,對Cas蛋白或Cse蛋白亞基的引用包括對其一部分由這些亞基構(gòu)成的家族或 超家族的交叉引用。
[0053] 本文中,本發(fā)明的Cas和Cse亞基的參考序列可被定義為編碼氨基酸序列的核苷 酸序列。例如,針對Cas7的SEQ ID NO: 3的氨基酸序列還包括編碼該氨基酸序列的所有核 酸序列。因此,包含在本發(fā)明范圍內(nèi)的Cas7變體包括與參考核酸序列至少具有所限定的氨 基酸同一性或相似性百分比的核苷酸序列;以及具有介于該下限與100%之間的所有可能 的同一性或相似性百分比的核苷酸序列。
[0054] 本發(fā)明的級聯(lián)復(fù)合物可由從超過一種不同的細菌或古細菌原核生物衍生或修飾 得到的亞基組成。并且,來自不同Cas亞型的亞基可以混合。
[0055] 在一個優(yōu)選的方面,Cas6亞基為以下SEQ ID NO: 17的Cas6e亞基,或為與SEQ ID NO: 17有至少16%同一1丨生的序列。
[0056] 優(yōu)選的 Cas6e 亞基的序列為〉gi 116130663 I ref I NP_417236. 11 CRISPR RNA 前體切 割酶;含有CRISP RNA(crRNA)的級聯(lián)抗病毒復(fù)合蛋白[大腸桿菌菌株K-12亞株MG1655]:
[0057] MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATVI KTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARVEDVHPISERP QYFS⑶GKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL[SEQ ID NO:17]
[0058] 本發(fā)明的級聯(lián)復(fù)合物或其部分一其包含至少一個包括具有核酸或染色質(zhì)修飾、可 視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨基酸序列的亞基一可進一步包含具有SEQ ID N0:2的氨基酸序列或與之有至少20%同一性的序列的Cse2(或YgcK樣)亞基或其部分。 或者,Cse亞基被限定為與SEQ ID NO:2有至少38%的相似性。任選地,在本發(fā)明的蛋白質(zhì) 復(fù)合物中,是Cse2亞基包括具有核酸或染色質(zhì)修飾活性的額外的氨基酸序列。
[0059] 此外或可替代地,本發(fā)明的級聯(lián)復(fù)合物可進一步包含具有SEQ ID NO: 1的氨基酸 序列或與之有至少9%同一性的序列的Csel (或YgcL樣)亞基或其部分。任選地,在本發(fā) 明的蛋白質(zhì)復(fù)合物中,是Csel亞基包括具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄 抑制活性的額外的氨基酸序列。
[0060] 在優(yōu)選的實施方案中,本發(fā)明的級聯(lián)復(fù)合物為I型CRISPR-Cas系統(tǒng)蛋白質(zhì)復(fù)合 物;更優(yōu)選為I-E亞型CRISPR-Cas蛋白質(zhì)復(fù)合物,或其可基于I-A型或I-B型復(fù)合物。I-C、 D或F型復(fù)合物是可能的。
[0061] 在基于大腸桿菌系統(tǒng)的特別優(yōu)選的實施方案中,亞基可具有以下化學(xué)計量: Csel1CseS2CasY6CasS 1CasG1 或 Csel1CseS2CasY6CasS1CasGe 10
[0062] 具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨基酸序列 可通過在天然或人工蛋白質(zhì)表達系統(tǒng)中表達而翻譯性地融合,或者通過化學(xué)合成步驟共 價連接到至少一個亞基上;優(yōu)選地,至少一個功能性部分至少融合或連接到Csel、Cse2、 Cas7、Cas5、Cas6或Cas6e亞基中至少之一的N末端區(qū)域和/或C末端區(qū)域上。在特別優(yōu)選 的實施方案中,具有核酸或染色質(zhì)修飾活性的額外的氨基酸序列融合或連接到Csel、Cse2 或Cas5亞基的N末端或C末端上;更優(yōu)選地,該連接位于Csel亞基的N末端、Cse2亞基的 N末端或Cas7亞基的N末端的區(qū)域。
[0063] 具有核酸或染色質(zhì)修飾、激活、抑制或可視化活性的額外的氨基酸序列可為蛋白 質(zhì);任選地選自解旋酶、核酸酶、核酸酶-解旋酶、DNA甲基轉(zhuǎn)移酶(例如,Dam)或DNA脫甲 基酶、組蛋白甲基轉(zhuǎn)移酶、組蛋白脫甲基酶、乙酰化酶、脫乙酰酶、磷酸酶、激酶、轉(zhuǎn)錄(輔) 激活物、RNA聚合酶亞基、轉(zhuǎn)錄阻抑物、DNA結(jié)合蛋白、DNA結(jié)構(gòu)化蛋白、標志物蛋白、報告蛋 白、突光蛋白、配體結(jié)合蛋白(例如,mCherry或重金屬結(jié)合蛋白)、信號肽(例如,Tat-信 號序列)、亞細胞定位序列(例如,核定位序列)或抗體表位。
[0064] 所關(guān)注的蛋白質(zhì)可為來自除級聯(lián)蛋白亞基具有其序列起源的細菌物種以外的物 種的異源蛋白質(zhì)。
[0065] 當?shù)鞍踪|(zhì)為核酸酶時,它可為選自諸如FokI的II型限制性內(nèi)切核酸酶或其突變 體或活性部分中的核酸酶。其他可使用的II型限制性內(nèi)切核酸酶包括Ec 〇Rl、EC〇RV、BgII、 BamHI、BsgI和BspMI。優(yōu)選地,本發(fā)明的一種蛋白質(zhì)復(fù)合物可與FokI的N末端結(jié)構(gòu)域融 合,而本發(fā)明的另一種蛋白質(zhì)復(fù)合物可與FokI的C末端結(jié)構(gòu)域融合。隨后這兩種蛋白質(zhì)復(fù) 合物可一起使用,以實現(xiàn)核酸中有利的基因座特異性雙鏈切割,借此,如RNA組分(下文將 定義和描述)所指導(dǎo)的,并且由于靶核酸鏈(下文也將更詳細地描述)中所謂的"原間隔區(qū) 鄰近基序"(PAM)序列的存在,遺傳物質(zhì)中切割的位置由使用者來設(shè)計和選擇。
[0066] 在一個優(yōu)選的實施方案中,本發(fā)明的蛋白質(zhì)復(fù)合物具有為經(jīng)修飾的限制性內(nèi)切核 酸酶如FokI的額外的氨基酸序列。該修飾優(yōu)選地位于催化域中。在優(yōu)選的實施方案中,經(jīng) 修飾的FokI為與蛋白質(zhì)復(fù)合物的Csel蛋白融合的KKR Sharkey或ELD Sharkey。在本發(fā) 明的這些復(fù)合物的優(yōu)選應(yīng)用中,這些復(fù)合物中的兩種(KKR Sharkey和ELD Sharkey)可以 組合在一起。采用經(jīng)不同修飾的FokI的蛋白質(zhì)復(fù)合物的異二聚體對在核酸的靶向雙鏈切 割中具有特別的優(yōu)勢。若使用同型二聚體,則由于非特異性活性,有可能在非靶位點處具有 更多的切割。異二聚體方法有利地提高了材料樣品中切割的保真度。
[0067] 以上所限定和描述的含有具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制 活性的額外的氨基酸序列的級聯(lián)復(fù)合物是本發(fā)明總體系統(tǒng)的組成部分,其有利地允許使用 者采用本文所限定的核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制實體中的任一個,以 預(yù)先確定的方式選擇需要進行切割、標記或以某種方式進行其他改變(例如,甲基化)的精 確遺傳基因座。該系統(tǒng)的其他組成部分是RNA分子,其充當將本發(fā)明的級聯(lián)復(fù)合物引導(dǎo)至 打算進行修飾、切割或標記的DNA或RNA上的正確基因座的引導(dǎo)物。
[0068]優(yōu)選地,本發(fā)明的級聯(lián)復(fù)合物還包含RNA分子,該RNA分子包含與期望的靶核酸序 列有至少50%同一性的核糖核苷酸序列,并且其中該蛋白質(zhì)復(fù)合物與RNA分子形成核糖核 蛋白復(fù)合物。優(yōu)選地,當RNA分子與其預(yù)期靶核酸序列雜交時,形成核糖核蛋白復(fù)合物。當 級聯(lián)-功能性部分組合的必需組分、RNA分子和核酸(DNA或RNA)在合適的生理條件下(無 論是在體內(nèi)還是在體外)一起存在時,形成核糖核蛋白復(fù)合物。不希望受到任何特定理論 的束縛,本發(fā)明人認為,在dsDNA尤其是負超螺旋DNA的情況下,與dsDNA關(guān)聯(lián)的級聯(lián)復(fù)合 物會導(dǎo)致雙鏈的局部解旋,這隨后使RNA與一條鏈關(guān)聯(lián);然后整個核糖核蛋白復(fù)合物沿著 DNA鏈移動,直至到達與該RNA序列的至少一部分實質(zhì)互補的靶序列,在此位點處在RNA和 DNA鏈之間發(fā)生穩(wěn)定的相互作用,并且功能性部分的功能發(fā)揮作用,無論是通過在該基因座 處DNA的修飾、核酸酶切割還是標記。
[0069] 在優(yōu)選的實施方案中,RNA分子的一部分具有與祀核酸序列至少50%的同一'丨生; 更優(yōu)選與靶序列至少95%的同一性。在更優(yōu)選的實施方案中,RNA分子的該部分沿其長度 與靶DNA序列實質(zhì)互補;S卩,只有一個、兩個、三個、四個或五個可能連續(xù)或不連續(xù)的錯配。 RNA分子(或其部分)可具有與靶序列至少51 %、或至少52%、或至少53%、或至少54%、 或至少55%、或至少56%、或至少57%、或至少58%、或至少59 %、或至少60 %、或至少 61 %、或至少62 %、或至少63 %、或至少64 %、或至少65 %、或至少66 %、或至少67 %、或至 少68 %、或至少69 %、或至少70 %、或至少71 %、或至少72 %、或至少73 %、或至少74 %、或 至少75 %、或至少76 %、或至少77 %、或至少78 %、或至少79 %、或至少80 %、或至少81 %、 或至少82 %、或至少83 %、或至少84%、或至少85%、或至少86%、或至少87%、或至少 88 %、或至少89 %、或至少90 %、或至少91 %、或至少92 %、或至少93 %、或至少94%、或至 少95%、或至少96%、或至少97%、或至少98%、或至少99%或100%的同一性。
[0070] 靶核酸可為DNA (ss或ds)或RNA。
[0071] 在其他優(yōu)選的實施方案中,RNA分子或其部分具有與靶核酸至少70%的同一性。 在這樣的同一性水平下,靶核酸優(yōu)選為dsDNA。
[0072] RNA分子將優(yōu)選地需要對靶核酸序列的高特異性和親和性。如優(yōu)選地通過非變 性凝膠電泳或者等溫滴定量熱法、表面等離子體共振或基于熒光的滴定法所確定的,在 IpM至I ii M、優(yōu)選I - IOOnM范圍內(nèi)的解離常數(shù)(Kd)是理想的??墒褂秒娪具w移率變動分 析(EMSA),也稱為凝膠阻滯分析(參見 Semenova E 等人(2011) Proc. Natl. Acad. Sci. USA 108:10098 - 10103)來確定親和力。
[0073] RNA分子優(yōu)選地模仿來自大自然的原核生物中被稱為CRISPR RNA (crRNA) 分子的那些分子。crRNA分子的結(jié)構(gòu)已經(jīng)確立并在Jore等人(2011)Nature Structural&Molecular Biology 529 - 537中更詳細地解釋。簡而言之,I-E型成熟 crRNA通常為61個核苷酸長,并由8個核苷酸的5' "柄"區(qū)、32個核苷酸的"間隔區(qū)"序列 和形成具有四核苷酸環(huán)的發(fā)夾的21個核苷酸的3'序列組成。然而,本發(fā)明中使用的RNA 不是必須要嚴格設(shè)計成天然存在的crRNA的設(shè)計,無論是在長度、區(qū)域或特異性RNA序列方 面。很明顯地,本發(fā)明中使用的RNA分子可基于公共數(shù)據(jù)庫中的或新發(fā)現(xiàn)的基因序列信息 來設(shè)計,然后人工制成,例如,全部或部分通過化學(xué)合成。本發(fā)明的RNA分子還可通過在遺 傳修飾的細胞或無細胞表達系統(tǒng)中表達的方式來設(shè)計和產(chǎn)生,這種選擇可包括部分或全部 RNA序列的合成。
[0074] crRNA 的結(jié)構(gòu)和要求也已在 Semenova E 等人(2011)Proc. Natl. Acad. Sci. USA 1^:10098 - 10103中描述。存在所謂的"SEED (種子)"部分,其形成間隔區(qū)序列的5'端, 并且其5'側(cè)翼為8個核苷酸的5'柄區(qū)。Semenova等人(2011)已經(jīng)發(fā)現(xiàn),SEED序列的所有 殘基應(yīng)與靶序列互補,盡管對于第6位的殘基而言,錯配是可被容忍的。類似地,在設(shè)計和 制備針對靶基因座的本發(fā)明核糖核蛋白復(fù)合物的RNA組分(即序列)時,可應(yīng)用針對SEED 序列的必要的匹配和錯配規(guī)則。
[0075]因此,本發(fā)明包括檢測和/或定位靶核酸分子中的單堿基改變的方法,其包括:使 核酸樣品與如上文所述的本發(fā)明的核糖核蛋白復(fù)合物接觸,或與如上文所述的本發(fā)明的級 聯(lián)復(fù)合物和單獨的RNA組分接觸,并且其中RNA組分(包括當在核糖核蛋白復(fù)合物中時) 的序列使得它借助8個核苷酸殘基的連續(xù)序列中的6位上的單堿基改變來區(qū)別正常的等位 基因和突變的等位基因。
[0076] 在本發(fā)明的實施方案中,RNA分子可具有在35 - 75個殘基范圍內(nèi)的長度。在優(yōu) 選的實施方案中,與需要的核酸序列互補并用于靶向該核酸序列的RNA部分為32或33個 殘基的長度。(在天然存在的crRNA的情況下,其將對應(yīng)于間隔區(qū)部分;如Semenova等人 (2011)的圖1所示)。
[0077] 本發(fā)明的核糖核蛋白復(fù)合物可另外具有RNA組分,該RNA組分包含位于與核酸靶 序列至少有基本互補實質(zhì)互補性的RNA序列的5'側(cè)的8個殘基。(與核酸靶序列至少有 基本互補實質(zhì)互補性的RNA序列將被理解為對應(yīng)于在crRNA的情況下對應(yīng)于作為間隔區(qū)序 列。RNA的5'側(cè)翼序列將被認為與crRNA的5'柄區(qū)相對應(yīng)。這在Semenova等人(2011) 的圖1中示出)。
[0078] 本發(fā)明的核糖核蛋白復(fù)合物可具有位于RNA序列的3'側(cè)的發(fā)夾和四核苷酸環(huán)形 成序列,該RNA序列與DNA靶序列至少有實質(zhì)互補性。(在crRNA的情況下,這將對應(yīng)于如 Semenova等人(2011)的圖1中所不的間隔區(qū)序列側(cè)翼的3'柄)。
[0079] 在一些實施方案中,該RNA可為CRISPR RNA (crRNA)。
[0080] 本發(fā)明的級聯(lián)蛋白和復(fù)合物在體外可針對其與RNA引導(dǎo)組分相結(jié)合從而在靶核 酸(其可為DNA或RNA)的存在下形成核糖核蛋白復(fù)合物的活性進行表征。電泳遷移率變 動分析(EMSA)可用作針對本發(fā)明的復(fù)合物與其核酸靶標之間的相互作用的功能分析?;?本地,將本發(fā)明的級聯(lián)-功能性部分復(fù)合物與核酸靶標混合,通過EMSA或通過功能性部分 的特定讀取來監(jiān)測該級聯(lián)-功能性部分復(fù)合物的穩(wěn)定的相互作用,例如靶DNA在期望的位 點處的內(nèi)切核苷酸切割。這可通過采用具有已知特異性并在靶DNA分子中具有切割位點的 市售酶的進一步的限制性片段長度分析來確定。
[0081] 可使用掃描/原子力顯微鏡(SFM/AFM)成像來實現(xiàn)在引導(dǎo)RNA的存在下本發(fā)明的 級聯(lián)蛋白或復(fù)合物與DNA或RNA的結(jié)合的可視化,并且這可提供一種針對本發(fā)明的功能性 復(fù)合物的存在的試驗。
[0082] 本發(fā)明還提供了一種編碼至少一種成簇規(guī)律間隔短回文重復(fù)序列(CRISPR)相關(guān) 蛋白質(zhì)亞基的核酸分子,該蛋白質(zhì)亞基選自:
[0083] a. Csel亞基,其具有SEQ ID NO: 1的氨基酸序列或與之有至少9%同一性的序列;
[0084] b.Cse2亞基,其具有SEQIDN0:2的氨基酸序列或與之有至少20%同一性的序 列;
[0085] c.Cas7亞基,其具有SEQ ID N0:3的氨基酸序列或與之有至少18%同一性的序 列;
[0086] d. Cas5亞基,其具有SEQ ID NO: 4的氨基酸序列或與之有至少17%同一性的序 列;
[0087] e.Cas6亞基,其具有SEQ ID N0:5的氨基酸序列或與之有至少16%同一性的序 列;并且
[0088] 其中至少a、b、c、d或e包括具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑 制活性的額外的氨基酸序列。
[0089] 具有核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨基酸序列 優(yōu)選地與CRISPR相關(guān)蛋白質(zhì)亞基融合。
[0090] 在上文限定的本發(fā)明的核酸中,核苷酸序列可以是分別編碼SEQIDN0:1、SEQ IDNO:2、SEQIDNO:3、SEQIDNO:4或SEQIDNO:5的核苷酸序列,或者在定義其變異序 列的范圍時,其可以是優(yōu)選在嚴格條件下,更優(yōu)選在極高嚴格性的條件下,可與該核苷酸序 列雜交的序列。各種嚴格的雜交條件將是本領(lǐng)域熟練的讀者所熟悉的。當兩個互補核酸 分子經(jīng)歷一定量的彼此氫鍵鍵合(稱為Watson-Crick堿基配對)時,發(fā)生核酸分子的雜 交。雜交的嚴格性可根據(jù)核酸周圍的環(huán)境(即化學(xué)/物理/生物)條件、溫度、雜交方法 的性質(zhì)以及所使用的核酸分子的組成和長度而不同。關(guān)于達到特定嚴格性程度所需的雜 交條件的計算在Sambrook等人,MolecularCloning:ALaboratoryManual(ColdSpring HarborLaboratoryPress,ColdSpringHarbor,NY, 2001);以及Tijssen,Laboratory TechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleic AcidProbes,第一部分第二章(Elsevier,紐約,1993)中描述。Tm是核酸分子的50%的 給定鏈與其互補鏈雜交時的溫度。以下是一組示例性的雜交條件,而非限定性的:
[0091] 極高嚴格件(允許享有至小90%同一;丨牛的序列雜奪)
[0092] 雜交:5xSSC,于 65°C,16 小時
[0093] 洗滌兩次:2xSSC,于室溫(RT),每次15分鐘
[0094] 洗滌兩次:0? 5xSSC,于65°C,每次20分鐘
[0095] 高嚴格件(允許享有至小80%同一;丨牛的序列雜奪)
[0096] 雜交:5x_6xSSC,于 65°C-7(TC,16-20 小時
[0097] 洗滌兩次:2xSSC,于RT,每次5-20分鐘
[0098] 洗滌兩次:lxSSC,于55°C_70°C,每次30分鐘
[0099] 低嚴格件(允許享有至小50%同一;丨牛的序列雜奪)
[0100] 雜交:6xSSC,于RT至 55°C,16-20 小時
[0101] 洗滌至少兩次:2x-3xSSC,于RT至55°C,每次20-30分鐘。
[0102] 核酸分子可為分尚的核酸分子,并且可為RNA或DNA分子。
[0103] 所述額外的氨基酸序列可選自解旋酶、核酸酶、核酸酶-解旋酶(例如,Cas3)、DNA 甲基轉(zhuǎn)移酶(例如,Dam)、DNA脫甲基酶、組蛋白甲基轉(zhuǎn)移酶、組蛋白脫甲基酶、乙?;?、脫 乙酰酶、磷酸酶、激酶、轉(zhuǎn)錄(輔)激活物、RNA聚合酶亞基、轉(zhuǎn)錄阻抑物、DNA結(jié)合蛋白、DNA 結(jié)構(gòu)化蛋白、標志物蛋白、報告蛋白、熒光蛋白、配體結(jié)合蛋白(例如,mCherry或重金屬結(jié) 合蛋白)、信號肽(例如,Tat-信號序列)、亞細胞定位序列(例如,核定位序列)或抗體表 位。所述額外的氨基酸序列可以是或來自從中衍生出相關(guān)級聯(lián)蛋白質(zhì)亞基的生物體的不同 蛋白質(zhì)。
[0104] 本發(fā)明包括一種包含如上文所限定的核酸分子的表達載體。一種表達載體可含有 編碼單一級聯(lián)蛋白質(zhì)亞基的核苷酸序列,并且還可含有編碼額外的氨基酸序列的核苷酸序 列,從而在表達時該亞基和額外的序列融合。其他表達載體可包含僅編碼不與任何額外的 氨基酸序列融合的一種或多種級聯(lián)蛋白質(zhì)亞基的核苷酸序列。
[0105]具有核酸或染色質(zhì)修飾活性的額外的氨基酸序列可通過接頭多肽與任何級聯(lián)亞 基融合。接頭可為多達約60個或多達約100個氨基酸殘基的任何長度。優(yōu)選地,接頭具有 在10個至60個、更優(yōu)選10-20個的范圍內(nèi)的氨基酸數(shù)目。氨基酸優(yōu)選地為極性的和/或 小的和 / 或帶電荷的氨基酸(例如,Gin、Ser、Thr、Pro、Ala、Glu、Asp、Lys、Arg、His、Asn、 Cys、Tyr)。接頭肽優(yōu)選地設(shè)計成獲得融合的功能性部分與級聯(lián)亞基的正確間隔及定位,其 中該部分與該級聯(lián)亞基融合以允許與靶核苷酸的適當?shù)南嗷プ饔谩?br>
[0106]本發(fā)明的表達載體(含有或不含有編碼在表達時將與級聯(lián)蛋白質(zhì)亞基融合的氨 基酸殘基的核苷酸序列)可進一步包含編碼如上文所限定的RNA分子的序列。因此,這樣 的表達載體可在合適的宿主中使用,以產(chǎn)生可靶向期望的核苷酸序列的本發(fā)明的核糖核蛋 白。
[0107]相應(yīng)地,本發(fā)明還提供了一種修飾、可視化靶核酸,或激活或抑制靶核酸的轉(zhuǎn)錄的 方法,該方法包括使核酸與如上文所限定的核糖核蛋白復(fù)合物接觸。該修飾可通過切割核 酸或與之結(jié)合來進行。
[0108]本發(fā)明還包括一種修飾、可視化靶核酸,或激活或抑制靶核酸的轉(zhuǎn)錄的方法,該方 法包括使核酸接觸如上文所限定的級聯(lián)蛋白質(zhì)復(fù)合物,加上如上文所限定的RNA分子。
[0109]按照上述方法,靶核酸的修飾、可視化或其轉(zhuǎn)錄的激活或抑制因此可在體外和在 無細胞環(huán)境中進行;即,該方法作為生化反應(yīng)進行,不論是游離在溶液中還是是否涉及固 相。例如,靶核酸可結(jié)合到固相上。
[0110] 在無細胞環(huán)境中,加入靶核酸、級聯(lián)蛋白質(zhì)復(fù)合物和RNA分子中的每一種的順序 由普通技術(shù)人員來選擇。這三種組分可同時加入,以任意期望的順序依次加入,或在不同的 時間并以期望的順序單獨加入。因此,將靶核酸和RNA同時加入到反應(yīng)混合物中,然后將本 發(fā)明的級聯(lián)蛋白質(zhì)復(fù)合物隨后以具體方法步驟的次序單獨地加入是可能的。
[0111] 靶核酸的修飾、可視化或其轉(zhuǎn)錄的激活或抑制可在細胞中原位進行,不論是分離 的細胞還是作為多細胞組織、器官或生物體的一部分。因此,在完整組織和器官的情況下以 及在生物體的情況下,該方法可在體內(nèi)進行,或者其可通過將細胞從完整組織、器官或生物 體中分離,然后使經(jīng)核糖核蛋白復(fù)合物處理過的細胞返回至其之前的位置或不同的位置來 進行,不論是在相同的還是不同的生物體內(nèi)。因此,該方法將包括同種異體移植、自體移植、 同種移植和異種移植。
[0112] 在這些實施方案中,本發(fā)明的核糖核蛋白復(fù)合物或級聯(lián)蛋白質(zhì)復(fù)合物需要適當?shù)?向細胞內(nèi)的遞送形式,其將是本領(lǐng)域技術(shù)人員所熟知的,包括顯微注射,不論是注射到細胞 質(zhì)內(nèi)還是注射到細胞核內(nèi)。
[0113]并且,在單獨存在時,RNA分子需要適當?shù)南蚣毎麅?nèi)的遞送形式,不論是與級聯(lián)蛋 白質(zhì)復(fù)合物同時、分別還是依次地。這樣的將RNA引入細胞的形式是本領(lǐng)域技術(shù)人員所熟 知的,并且可包括經(jīng)由常規(guī)轉(zhuǎn)染方法的體外或離體遞送??煞謩e使用諸如顯微注射和電穿 孔等物理方法,以及鈣共沉淀和市售的陽離子聚合物和脂質(zhì),以及細胞穿透肽、細胞穿透顆 粒(基因槍)。例如,病毒可用作遞送載體,不論是遞送至細胞質(zhì)和/或細胞核--例如,通 過本發(fā)明的級聯(lián)蛋白質(zhì)復(fù)合物或本發(fā)明的核糖核蛋白復(fù)合物與病毒顆粒的(可逆)融合。 可使用病毒遞送(例如,腺病毒遞送)或土壤桿菌(Agrobacterium)介導(dǎo)的遞送。
[0114]本發(fā)明還包括一種在細胞中修飾、可視化靶核酸、或激活或抑制靶核酸的轉(zhuǎn)錄的 方法,該方法包括用如上文所述的任何表達載體轉(zhuǎn)染、轉(zhuǎn)化或轉(zhuǎn)導(dǎo)該細胞。轉(zhuǎn)染、轉(zhuǎn)化或轉(zhuǎn) 導(dǎo)的方法是本領(lǐng)域技術(shù)人員所熟知的類型。在存在一種用于產(chǎn)生本發(fā)明的級聯(lián)復(fù)合物的表 達的表達載體且當RNA直接加入到細胞的情況下,可使用相同或不同的轉(zhuǎn)染、轉(zhuǎn)化或轉(zhuǎn)導(dǎo) 的方法。類似地,當存在一種正用于產(chǎn)生本發(fā)明的級聯(lián)-功能性融合復(fù)合物的表達的表達 載體且當另一種表達載體正用于通過表達而原位產(chǎn)生RNA時,可使用相同或不同的轉(zhuǎn)染、 轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的方法。
[0115] 在其他實施方案中,將編碼本發(fā)明的級聯(lián)復(fù)合物的mRNA引入細胞內(nèi),以使該級聯(lián) 復(fù)合物在細胞中表達。將級聯(lián)蛋白復(fù)合物引導(dǎo)至期望的靶序列的RNA也被引入至該細胞 中,不論是與該mRNA同時、分別還是依次地引入,從而在細胞中形成必需的核糖核蛋白復(fù) 合物。
[0116] 在上述修飾或可視化靶核酸的方法中,所述額外的氨基酸序列可以是標志物,并 且該標志物與靶核酸相關(guān)聯(lián);優(yōu)選地,其中該標志物為蛋白質(zhì);任選地為熒光蛋白,例如, 綠色熒光蛋白(GFP)或黃色熒光蛋白(YFP)或mCherry。不論在體外、離體還是體外,本 發(fā)明的方法可用于直接可視化核酸分子中的靶基因座,該核酸分子優(yōu)選為更高階結(jié)構(gòu)的形 式,諸如超螺旋質(zhì)?;蛉旧w或諸如mRNA的單鏈靶核酸。靶基因座的直接可視化可使用電 子顯微鏡檢查或熒光顯微鏡檢查。
[0117] 可以使用其他種類的標簽來標記靶核酸,包括有機染料分子、放射性標簽和可為 小分子的自旋標簽。
[0118] 在上述的本發(fā)明方法中,靶核酸為DNA ;優(yōu)選為dsDNA,盡管靶標可為RNA ;優(yōu)選為 mRNAo
[0119] 在用于修飾、可視化靶核酸、激活靶核酸的轉(zhuǎn)錄或抑制靶核酸的轉(zhuǎn)錄(其中靶核 酸為dsDNA)的本發(fā)明的方法中,具有核酸或染色質(zhì)修飾活性的額外的氨基酸序列可為核 酸酶或解旋酶_核酸酶,并且該修飾優(yōu)選為期望的基因座處的單鏈或雙鏈斷裂。采用這種 方式,可通過使用級聯(lián)-功能性部分復(fù)合物來使DNA的獨特序列特異性切割工程化。最終 核糖核蛋白復(fù)合物的RNA組分的所選序列為額外的氨基酸序列的作用提供了所需的序列 特異性。
[0120] 因此,本發(fā)明還提供了一種使細胞中的dsDNA分子在期望的基因座處進行非同源 末端連接,從而從該dsDNA分子中除去至少一部分核苷酸序列,任選地敲除一個基因或多 個基因的功能的方法,其中該方法包括采用如上文所述的任何修飾靶核酸的方法來制造雙 鏈斷裂。
[0121] 本發(fā)明進一步提供了一種將核酸同源重組到細胞中期望的基因座處的dsDNA分 子內(nèi)以修飾存在的核苷酸序列或插入期望的核苷酸序列的方法,其中該方法包括采用如上 文所述的任何修飾靶核酸的方法在期望的基因座處產(chǎn)生雙鏈或單鏈斷裂。
[0122] 本發(fā)明因此還提供了一種修飾、激活或抑制生物體中的基因表達的方法,該方法 包括根據(jù)上文所述的任何方法來修飾靶核酸序列、激活靶核酸序列的轉(zhuǎn)錄或抑制靶核酸序 列的轉(zhuǎn)錄,其中該核酸為dsDNA,并且該功能性部分選自DNA修飾酶(例如,脫甲基酶或脫乙 酰酶)、轉(zhuǎn)錄激活物或轉(zhuǎn)錄阻抑物。
[0123] 本發(fā)明另外提供了一種修飾、激活或抑制生物體中的基因表達的方法,該方法包 括根據(jù)上文所述的任何方法來修飾靶核酸序列、激活靶核酸序列的轉(zhuǎn)錄或抑制靶核酸序列 的轉(zhuǎn)錄,其中該核酸為mRNA,并且該功能性部分為核糖核酸酶;任選地選自內(nèi)切核酸酶、3' 外切核酸酶或5'外切核酸酶。
[0124] 在如上所述的本發(fā)明的任何方法中,經(jīng)受該方法的細胞可以是原核細胞。類似地, 該細胞可為以是真核細胞,例如,植物細胞、昆蟲細胞、酵母細胞、真菌細胞、哺乳動物細胞 或人細胞。當細胞是哺乳動物或人的細胞時,它可以是干細胞(但可能不是任何的人胚胎 干細胞)。本發(fā)明中使用的這類干細胞優(yōu)選為分離的干細胞。任選地,按照本發(fā)明的任何方 法對細胞進行體外轉(zhuǎn)染。
[0125] 優(yōu)選地,在本發(fā)明的任何方法中,靶核酸具有特定的三級結(jié)構(gòu),任選地為超螺旋 的,更優(yōu)選地其中該靶核酸為負超螺旋的。有利的是,本發(fā)明的核糖核蛋白復(fù)合物,不論是 在體外產(chǎn)生的,或在細胞內(nèi)形成的,還是通過細胞的表達機器在細胞內(nèi)形成的,均可用于靶 向以其他方式難以接近的基因座,以便應(yīng)用期望的組分的功能活性,不論是特異性序列的 標注或標記、核酸結(jié)構(gòu)的修飾、基因表達的開啟或關(guān)閉,還是涉及單鏈或雙鏈切割、隨后插 入一個或多個核苷酸殘基或盒的靶序列本身的修飾。
[0126] 本發(fā)明還包括一種藥物組合物,其包含如上文所述的本發(fā)明的級聯(lián)蛋白質(zhì)復(fù)合物 或核糖核蛋白復(fù)合物。
[0127] 本發(fā)明進一步包括一種藥物組合物,其包含如上文所述的本發(fā)明的分離的核酸或 表達載體。
[0128] 還提供了一種試劑盒,其包含如上文所述的本發(fā)明的級聯(lián)蛋白質(zhì)復(fù)合物,以及如 上文所述的本發(fā)明的RNA分子。
[0129] 本發(fā)明包括一種用作藥物的如上文所述的級聯(lián)蛋白質(zhì)復(fù)合物或核糖核蛋白復(fù)合 物或核酸或載體。
[0130] 本發(fā)明允許在指定的基因組基因座處物理地改變原核或真核宿主的DNA,或者改 變給定基因座處基因的表達模式的多種可能性??赏ㄟ^分別與合適的級聯(lián)_亞基融合的功 能域如核酸酶、甲基化酶、熒光蛋白、轉(zhuǎn)錄激活物或阻抑物,來對宿主基因組DNA進行切割、 或甲基化修飾、熒光可視化、轉(zhuǎn)錄激活或抑制。此外,級聯(lián)的RNA引導(dǎo)的RNA結(jié)合能力允許 用熒光級聯(lián)融合蛋白監(jiān)控活細胞中的RNA運輸,并提供了隔離或破壞宿主mRNA從而對宿主 細胞的基因表達水平造成干擾的方法。
[0131] 在本發(fā)明的任何方法中,可通過至少一種以下核苷酸三聯(lián)體的存在來限定靶核 酸,如果是 dsDNA 則優(yōu)選如此:5' -CTT-3'、5' -CAT-3'、5' -CCT-3' 或 5' -CTC-3'(或者如 果靶標為 RNA,則為 5' -CUU-3'、5' -CAU-3'、5' -CCU-3' 或 5' -CTC-3')。三聯(lián)體的位置是 在與本發(fā)明的核糖核蛋白的RNA分子組分雜交的序列相鄰的靶鏈上。三聯(lián)體標記靶鏈序列 中的位點,在該位點處,與核糖核蛋白的RNA分子組分的在靶標的5'至3'(下游)方向上 不發(fā)生堿基配對(然而,堿基配對在該位點的靶序列的上游發(fā)生,其具有本發(fā)明核糖核蛋 白的RNA分子組分的RNA序列的優(yōu)選長度)。在天然I型CRISPR系統(tǒng)的情況下,三聯(lián)體與 被稱為"PAM"(原間隔區(qū)鄰近基序)的序列相對應(yīng)。對于ssDNA或ssRNA靶標,三聯(lián)體之一 的存在并非如此必要。
[0132] 現(xiàn)將參考具體實施例和附圖對本發(fā)明進行詳細的描述,附圖中:
[0133] 圖1顯示了凝膠移位分析的結(jié)果,其中級聯(lián)結(jié)合負超螺旋(nSC)質(zhì)粒DNA而不結(jié) 合松弛的DNA。A)具有J3-級聯(lián)(含有靶向(J3) crRNA)的nSC質(zhì)粒DNA的凝膠移位。將 pUC-入與2倍漸增量的J3-級聯(lián)混合,pUC-入:級聯(lián)摩爾比從1:0. 5直至1:256摩爾比。 第一泳道和最后泳道僅含有PUC-A。B)具有R44-級聯(lián)(含有非靶向(R44)cRNA)的如(A) 中所述的凝膠移位。C)具有Nt. BspQI切刻的pUC-A的如(A)中所述的凝膠移位。D)具 有PdmI線性化的pUC-A的如(A)中所述的凝膠移位。E)針對游離J3-級聯(lián)的濃度繪制 的與J3-級聯(lián)結(jié)合的pUC-A分數(shù)的擬合給出了特異性結(jié)合的解離常數(shù)(Kd)。F)針對游離 R44-級聯(lián)的濃度繪制的與R44-級聯(lián)結(jié)合的pUC- A分數(shù)的擬合給出了非特異性結(jié)合的解離 常數(shù)(Kd)。G)使用原間隔區(qū)序列中獨特的BsmI限制位點,通過限制性分析監(jiān)測的級聯(lián)與 原間隔區(qū)的特異性結(jié)合。泳道1和5僅含pUC-入。泳道2和6含有與級聯(lián)混合的pUC-入。 泳道3和7含有與級聯(lián)混合的pUC-入,并且隨后加入BsmI。泳道4和8含有與BsmI混合的 pUC-A與級聯(lián)結(jié)合并且隨后對質(zhì)粒的一條鏈進行Nt. BspQI切割的pUC-A的凝膠移位。 泳道1和6僅含pUC-入。泳道2和7含有與級聯(lián)混合的pUC-入。泳道3和8含有與級聯(lián) 混合并且隨后進行Nt. BspQI切刻的pUC-入。泳道4和9含有與級聯(lián)混合的pUC-入,接著 加入與R-環(huán)中的替代鏈互補的ssDNA探針,隨后用Nt. BspQI進行切刻。泳道5和10含有 用Nt. BspQI切刻的pUC-入。H)與級聯(lián)結(jié)合并且隨后對質(zhì)粒進行Nt. BspQI切刻的pUC-入 的凝膠移位。泳道1和6僅含pUC-入。泳道2和7含有與級聯(lián)混合的pUC-入。泳道3和 8含有與級聯(lián)混合并且隨后進行Nt. BspQI切割的pUC-入。泳道4和9含有與級聯(lián)混合的 pUC-入,接著加入與R-環(huán)中的替代鏈互補的ssDNA探針,隨后用Nt. BspQI進行切割。泳道 5和10含有用Nt. BspQI切割的pUC-A。I)與級聯(lián)結(jié)合并且隨后對質(zhì)粒的兩條鏈都進行 EcoRI切割的pUC-入的凝膠移位。泳道1和6僅含pUC-入。泳道2和7含有與級聯(lián)混合 的pUC-入。泳道3和8含有與級聯(lián)混合并隨后進行EcoRI切割的pUC-入。泳道4和9含 有與級聯(lián)混合的PUC-入,接著加入與R-環(huán)中的替代鏈互補的ssDNA探針,并隨后用EcoRI 進行切割。泳道5和10含有用EcoRI切割的pUC-入。
[0134] 圖2示出了掃描力顯微照片,證明級聯(lián)如何誘導(dǎo)靶DNA在原間隔區(qū)結(jié)合時的彎曲。 A-P)具有包含靶向(J3)crRNA的J3-級聯(lián)的nSC質(zhì)粒DNA的掃描力顯微鏡圖像。pUC-X與 J3-級聯(lián)以1:7的pUC-X :級聯(lián)比例混合。每張圖像示出了 500x 500nm的表面區(qū)域。白點 對應(yīng)于級聯(lián)。
[0135] 圖3示出了 BiFC分析如何揭示級聯(lián)和Cas3在靶標識別后相互作用。A)表達級聯(lián) 八〇861和〇?15?1?71'111(其靶向入噬菌體基因組上的7個原間隔區(qū))以及0861-附55¥6皿8 和Cas3-C85Venu S融合蛋白的細胞的Venus熒光。B) (A)中的細胞的亮視野圖像。C) (A) 與(B)的重疊。D) X噬菌體感染的細胞的Venus熒光,該細胞表達級聯(lián)ACsel和CRISPR 7Tm,以及Csel-N155Venus和Cas3-C85Venus融合蛋白。E) (G)中的細胞的亮視野圖像。F) (G)與(H)的重疊。G) A噬菌體感染的細胞的Venus熒光,該細胞表達級聯(lián)A Csel和非靶 向CRISPR R44,以及N155Venus和C85Venus蛋白。H) (J)中的細胞的亮視野圖像。I) (J) 與(K)的重疊。J)每個菌株的4-7個個體細胞的熒光強度平均值,如使用LSM指示器(Carl Zeiss)的圖譜工具(profile tool)所確定的。
[0136] 圖4示出了 CRISPR-干擾期間Cas3核酸酶和解旋酶的活性。A)用pUC-入轉(zhuǎn)化表 達級聯(lián)、Cas3突變體和CRISPR J3的感受態(tài)BL21-AI細胞。對每個表達Cas3突變體的菌株 描述每微克pUC-X的菌落形成單位(cfu/iig DNA)。表達野生型(wt)Cas3和crispr j3 或crispr r44的細胞分別作為陽性對照和陰性對照。B)攜帶級聯(lián)、Cas3突變體和CRISPR 編碼質(zhì)粒以及puc-入的BL21-AI細胞在抑制cas基因和CRISPR表達的條件下生長。當t =O時,表達被誘導(dǎo)。示出了丟失PUC-A的細胞隨時間推移的百分數(shù),如通過氨芐青霉素 敏感細胞與氨芐青霉素抗性細胞的比例所確定的。
[0137] 圖5示出了級聯(lián)-Cas3融合復(fù)合物如何提供體內(nèi)抗性并具有體外核酸酶活性。A) 純化的級聯(lián)和級聯(lián)-Cas3融合復(fù)合物的考馬斯藍染色的SDS-PAGE。B)A噬菌體對表達級 聯(lián)_Cas3融合復(fù)合物和靶向(J3)或非靶向(R44)CRISPR的細胞的成斑率,以及對單獨表 達級聯(lián)和Cas3以及靶向(J3)CRISPR的細胞的成斑率。C)具有J3-級聯(lián)-Cas3融合復(fù)合 物的nSC靶質(zhì)粒的凝膠移位(在不存在二價金屬離子的情況下)。pUC-A與2倍漸增量的 J3-級聯(lián)-Cas3混合,pUC- X : J3-級聯(lián)-Cas3摩爾比從1: 0? 5至高達1:128摩爾比。第一 泳道和最后的泳道僅含有PUC- A。D)具有J3-級聯(lián)-Cas3融合復(fù)合物的nSC非靶質(zhì)粒的凝 膠移位電泳(在不存在二價金屬離子的情況下)。pUC-p7與2倍漸增量的J3-級聯(lián)-Cas3 混合,pUC-p7:J3-級聯(lián)-Cas3摩爾比從1:0. 5至高達1:128摩爾比。第一泳道和最后的泳 道僅含有pUC-p7。E)在IOmM MgCl2的存在下,nSC靶質(zhì)粒(pUC-入,左)或nSC非靶質(zhì)粒 (pUC-p7,右)與J3-級聯(lián)-Cas3的溫育。泳道1和7僅含有質(zhì)粒。F)在2mM ATP的存在下 進行的如(E)中所述的試驗。G)用突變的J3-級聯(lián)-Cas3K320N復(fù)合物進行的如(E)中所 述的試驗。H)在2mM ATP的存在下進行的如(G)中所述的試驗。
[0138] 圖6為顯示大腸桿菌中CRISPR-干擾I型途徑的模型的示意圖。
[0139] 圖7為顯示本發(fā)明的級聯(lián)-FokI融合實施方案如何被用來創(chuàng)建FokI二聚體的示 意圖,該FokI二聚體切割dsDNA以產(chǎn)生平末端作為非同源末端連接或同源重組過程的部 分。
[0140] 圖8示出了 BiFC分析如何揭示級聯(lián)和Cas3在靶標識別時相互作用。表達不含 Csel的級聯(lián)、Csel-N155Venus和Cas3-C85Venus以及CRISPR 7Tm(其靶向入噬菌體基因 組上的7個原間隔區(qū))或非靶向CRISPR R44的細胞的亮視野圖像和Venus熒光的重疊。表 達CRISPR7Tm的細胞僅在被入噬菌體感染時是熒光的,而表達CRISPR R44的細胞為非熒 光的。高強度的熒光點(細胞外)是由于反光的鹽晶體。白色線條對應(yīng)于10微米。
[0141] 圖9顯示了編碼CRISPR J3、級聯(lián)和Cas3(野生型或S483AT485A)的4個克隆的 pUC-A序列[SEQ ID NO: 39-42],表明它們是攜帶原間隔區(qū)(部分)缺失或攜帶種子區(qū)中 的單點突變的逃逸突變體,這解釋了為什么不能恢復(fù)這些質(zhì)粒。
[0142] 圖10示出了來自含有I-E型CRISPR/Cas系統(tǒng)的生物體的cas3基因的序列比 對。來自鏈霉菌(Str 印 tomyces sp.)SPB78(第一序列,登錄號:ZP_07272643.1)[SEQ ID N0:43]、灰色鏈霉菌(Streptomyces griseus)(第二序列,登錄號:YP_001825054) [SEQ ID N0:44]和嗜酸細鏈抱菌(Catenulispora acidiphila)DSM 44928(第三序列,登錄號: YP_003114638)[SEQ ID N0:45]中的cas3-csel基因以及包括來自灰色鏈霉菌的多肽接頭 序列的人工大腸桿菌Cas3-Csel融合蛋白[SEQ ID N0:46]的比對。
[0143]圖11示出了級聯(lián)KKK/EU)核酸酶對的設(shè)計,其中對FokI核酸酶結(jié)構(gòu)域進行突變,以 致只有由KKR和ELD核酸酶結(jié)構(gòu)域組成的異二聚體和相對的結(jié)合位點之間的距離可發(fā)生變 化,以確定級聯(lián)核酸酶對之間的最佳距離。
[0144] 圖12是示出了級聯(lián)-FokI核酸酶對的基因組靶向的示意圖。
[0145] 圖13示出了級聯(lián)-核酸酶復(fù)合物的SDS-PAGE凝膠。
[0146] 圖14示出了級聯(lián)KKK/ElD對質(zhì)粒DNA的體外切割試驗的電泳凝膠。
[0147] 圖15示出了級聯(lián)K_LD的切割模式和頻率[SEQ ID N0:47]。
[0148] 實施例--所用的材料與方法
[0149] 菌株、基因克隆、質(zhì)粒和載體
[0150] 全部使用大腸桿菌BL21-AI和大腸桿菌BL21(DE3)菌株。表1列出了本研究中 使用的所有質(zhì)粒。之前所述的PWUR408、pWUR480、pWUR404和pWUR547用來產(chǎn)生Str印-標 記II R44-級聯(lián),而pWUR408、pWUR514和pWUR630用來產(chǎn)生Str印-標記II J3-級聯(lián) (Jore 等人,(2011)Nature Structural&Molecular Biology 18, 529-536 ;Semenova 等人, (201I)Proceedings of the National Academy of Sciences of the United States of America l〇8,10〇98_101〇3)。pUC-入(pWUR610)和 pUC-p7 (PWUR6I3)已經(jīng)在別處(Jore 等人,2011 ;Semenova 等人,2011)有所描述。C85Venus 蛋白由 pWUR647 編碼,pWUR647 對應(yīng)于含有在BamHI和NotI位點之間克隆的合成GA1070943構(gòu)建體(表2) (Geneart) 的 pET52b (Novagen)。NI55Venus 蛋白由 pWUR648 編碼,pWUR648 對應(yīng)于含有在 NotI 和 XhoI位點之間克隆的合成GA1070941構(gòu)建體(表2) (Geneart)的pRSFlb (Novagen)。 Cas3-C85Venus融合蛋白由pWUR649編碼,pWUR649對應(yīng)于含有使用引物BG3186和 BG3213 (表3)在NcoI和BamHI位點之間擴增的Cas3擴增產(chǎn)物的pWUR647。CasA-N155Venus 融合蛋白由PWUR650編碼,pWUR650對應(yīng)于含有使用引物BG3303和BG3212(表3)在NcoI 和BamHI位點之間擴增的CasA擴增產(chǎn)物的pWUR648。CRISPR 7Tm由pWUR651編碼,pWUR651 對應(yīng)于含有在NcoI和KpnI位點之間克隆的合成GA1068859構(gòu)建體(表2) (Geneart)的 pACYCDuet-1 (Novagen)。編碼級聯(lián)的 pWUR400、編碼級聯(lián) A Csel 的 WUR401 和編碼 Cas3 的 PWUR397在之前已有描述(Jore等人,2011)。編碼Cas3H74A的pWUR652是使用引物BG3093、 BG3094 (表3)對pWUR397進行定點誘變而構(gòu)建的。
[0151] 表1--所用的質(zhì)粒
[0152]
【權(quán)利要求】
1. 一種用于抗病毒防御的成簇規(guī)律間隔短回文重復(fù)序列(CRISPR)相關(guān)復(fù)合物(級 聯(lián)),該級聯(lián)蛋白質(zhì)復(fù)合物或其部分至少包含CRISPR相關(guān)蛋白質(zhì)亞基: -Cas7,其具有SEQ ID N0:3的氨基酸序列或與之有至少18%同一性的序列, -Cas5,其具有SEQ ID N0:4的氨基酸序列或與之有至少17%同一性的序列,和 -Cas6,其具有SEQ ID NO: 5的氨基酸序列或與之有至少16%同一性的序列; 并且其中至少一個亞基包括提供核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活 性的額外的氨基酸序列。
2. 如權(quán)利要求1所述的蛋白質(zhì)復(fù)合物,其中所述Cas6亞基為Cas6e亞基,其具有SEQ ID NO: 17的氨基酸序列或與之有至少16%同一性的序列。
3. 如權(quán)利要求1或權(quán)利要求2所述的蛋白質(zhì)復(fù)合物,其進一步包含Cse2亞基,該Cse2 亞基具有SEQ ID N0:2的氨基酸序列或與之有至少20%同一性的序列;任選地,其中正是 該Cse2亞基包括所述額外的氨基酸序列。
4. 如權(quán)利要求1至3中的任一項所述的蛋白質(zhì)復(fù)合物,其進一步包含Csel亞基,該 Csel亞基具有SEQ ID N0:1的氨基酸序列或與之有至少9%同一性的序列;任選地,其中正 是該Csel亞基包括所述額外的氨基酸序列。
5. 如權(quán)利要求4所述的蛋白質(zhì)復(fù)合物,其為I型CRISPR-Cas系統(tǒng)蛋白質(zhì)復(fù)合物;優(yōu)選 為I-E亞型CRISPR-Cas蛋白質(zhì)復(fù)合物。
6. 如權(quán)利要求1至5中的任一項所述的蛋白質(zhì)復(fù)合物,其中所述額外的氨基酸序列被 翻譯地融合或共價連接到所述至少一個亞基上;優(yōu)選地,所述額外的氨基酸序列融合或連 接到Csel、Cse2、Cas7、Cas5、Cas6或Cas6e亞基中的至少一個的至少N末端和/或C末端。
7. 如權(quán)利要求6所述的蛋白質(zhì)復(fù)合物,其中所述額外的氨基酸序列融合或連接到 Csel、Cse2或Cas5亞基的N末端或C末端;優(yōu)選Csel亞基的N末端、Cse2亞基的N末端 或Cas7亞基的N末端。
8. 如權(quán)利要求7所述的蛋白質(zhì)復(fù)合物,其中所述額外的氨基酸序列為蛋白質(zhì);任選地 選自解旋酶、核酸酶、核酸酶-解旋酶(例如,Cas3)、DNA甲基轉(zhuǎn)移酶(例如,Dam)或DNA 脫甲基酶、組蛋白甲基轉(zhuǎn)移酶、組蛋白脫甲基酶、乙?;?、脫乙酰酶、磷酸酶、激酶、轉(zhuǎn)錄 (輔)激活物、RNA聚合酶亞基、轉(zhuǎn)錄阻抑物、DNA結(jié)合蛋白、DNA結(jié)構(gòu)化蛋白、標志物蛋白、 報道蛋白、熒光蛋白、配體結(jié)合蛋白(例如,mCherry或重金屬結(jié)合蛋白)、信號肽(例如, Tat-信號序列)、亞細胞定位序列(例如,核定位序列)或抗體表位。
9. 如權(quán)利要求8所述的蛋白質(zhì)復(fù)合物,其中所述核酸酶選自II型限制性內(nèi)切核酸酶; 優(yōu)選FokI ;更優(yōu)選經(jīng)修飾的FokI,例如,KKR Sharkey或ELD Sharkey。
10. 如任一前述權(quán)利要求所述的蛋白質(zhì)復(fù)合物,其進一步包含RNA分子,該RNA分子包 含與靶核酸序列有至少50%同一性的核糖核苷酸序列,并且其中所述蛋白質(zhì)復(fù)合物和所述 RNA分子形成核糖核蛋白復(fù)合物。
11. 如權(quán)利要求10所述的核糖核蛋白復(fù)合物,其中所述RNA分子的一部分與所述靶序 列具有至少50%的同一性。
12. 如權(quán)利要求11所述的核糖核蛋白復(fù)合物,其中所述RNA分子的所述部分沿其長度 與所述靶序列至少實質(zhì)互補。
13. 如權(quán)利要求10至12中的任一項所述的核糖核蛋白復(fù)合物,其中所述RNA分子的所 述長度在35-75個殘基的范圍內(nèi)。
14. 如權(quán)利要求10至13中的任一項所述的核糖核蛋白復(fù)合物,其中用于靶向期望的核 酸序列的所述RNA分子的所述部分為32或33個殘基長。
15. 如權(quán)利要求10至14中的任一項所述的核糖核蛋白復(fù)合物,其中所述RNA分子包含 位于與所述靶序列有至少實質(zhì)互補性的所述RNA序列的5'側(cè)的8個殘基。
16. 如權(quán)利要求10至15中的任一項所述的核糖核蛋白復(fù)合物,其中所述RNA分子具有 發(fā)夾和四核苷酸環(huán)形成序列,該序列位于與所述靶序列有至少實質(zhì)互補性的所述RNA序列 的3'偵U。
17. -種分離的核酸分子,其編碼至少一種成簇規(guī)律間隔短回文重復(fù)序列(CRISPR)相 關(guān)蛋白質(zhì)亞基,該蛋白質(zhì)亞基選自: a. Csel亞基,其具有SEQ ID NO: 1的氨基酸序列或與之有至少9%同一性的序列; b. Cse2亞基,其具有SEQ ID NO: 2的氨基酸序列或與之有至少20%同一性的序列; c. Cas7亞基,其具有SEQ ID NO: 3的氨基酸序列或與之有至少18%同一性的序列; d. Cas5亞基,其具有SEQ ID NO: 4的氨基酸序列或與之有至少17%同一性的序列; e. Cas6亞基,其具有SEQ ID NO: 5的氨基酸序列或與之有至少16%同一性的序列;并 且 其中至少a、b、c、d或e包括提供核酸或染色質(zhì)修飾、可視化、轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活 性的額外的氨基酸序列。
18. 如權(quán)利要求17所述的分離的核酸分子,其中所述提供核酸或染色質(zhì)修飾、可視化、 轉(zhuǎn)錄激活或轉(zhuǎn)錄抑制活性的額外的氨基酸序列與CRISPR相關(guān)蛋白質(zhì)亞基融合。
19. 如權(quán)利要求18所述的分離的核酸分子,其中所述額外的氨基酸序列選自解旋酶、 核酸酶、核酸酶-解旋酶(例如,Cas3)、DNA甲基轉(zhuǎn)移酶(例如,Dam)、DNA脫甲基酶、組蛋白 甲基轉(zhuǎn)移酶、組蛋白脫甲基酶、乙?;浮⒚撘阴C?、磷酸酶、激酶、轉(zhuǎn)錄(輔)激活物、RNA聚 合酶亞基、轉(zhuǎn)錄阻抑物、DNA結(jié)合蛋白、DNA結(jié)構(gòu)化蛋白、標志物蛋白、報道蛋白、熒光蛋白、 配體結(jié)合蛋白(例如,mCherry或重金屬結(jié)合蛋白)、信號肽(例如,Tat-信號序列)、亞細 胞定位序列(例如,核定位序列)或抗體表位。
20. -種表達載體,其包含如權(quán)利要求17至19中的任一項所述的核酸分子。
21. 如權(quán)利要求20所述的表達載體,其進一步包含編碼如權(quán)利要求10至16中的任一 項所限定的RNA分子的核苷酸序列。
22. -種修飾、可視化靶核酸、激活其轉(zhuǎn)錄或抑制其轉(zhuǎn)錄的方法,其包括使所述核酸接 觸: a. 如權(quán)利要求10至16中的任一項所述的核糖核蛋白復(fù)合物;或 b. 如權(quán)利要求1至9中的任一項所述的蛋白質(zhì)復(fù)合物,以及如權(quán)利要求10至16中的 任一項所限定的RNA分子。
23. -種修飾、可視化細胞中的靶核酸、激活其轉(zhuǎn)錄或抑制其轉(zhuǎn)錄的方法,其包括用如 權(quán)利要求22所述的表達載體以及額外的表達載體來轉(zhuǎn)染、轉(zhuǎn)化或轉(zhuǎn)導(dǎo)所述細胞,該額外的 表達載體包含編碼如權(quán)利要求10至18中的任一項所限定的RNA分子的核苷酸序列。
24. -種修飾、可視化細胞中的靶核酸、激活其轉(zhuǎn)錄或抑制其轉(zhuǎn)錄的方法,其包括用如 權(quán)利要求22所述的表達載體轉(zhuǎn)染、轉(zhuǎn)化或轉(zhuǎn)導(dǎo)所述細胞,然后將如權(quán)利要求10至18中的 任一項所限定的RNA分子施用至所述細胞或施用至所述細胞中。
25. -種修飾、可視化細胞中的靶核酸、激活其轉(zhuǎn)錄或抑制其轉(zhuǎn)錄的方法,其包括用如 權(quán)利要求21所述的表達載體轉(zhuǎn)染、轉(zhuǎn)化或轉(zhuǎn)導(dǎo)所述細胞。
26. 如權(quán)利要求22至25中的任一項所述的修飾或可視化靶核酸的方法,其中具有核酸 或染色質(zhì)修飾或可視化活性的所述額外的氨基酸序列是標志物,并且該標志物與所述靶核 酸或染色質(zhì)相關(guān)聯(lián);優(yōu)選地,其中所述標志物為蛋白質(zhì);任選為熒光蛋白,例如綠色熒光蛋 白(GFP)或黃色熒光蛋白(YFP)。
27. 如權(quán)利要求22至26中的任一項所述的方法,其中所述靶核酸為DNA ;優(yōu)選dsDNA。
28. 如權(quán)利要求22至26中的任一項所述的方法,其中所述靶核酸為RNA ;優(yōu)選mRNA。
29. 如權(quán)利要求22至26中的任一項所述的修飾靶核酸的方法,其中所述核酸為 dsDNA,所述具有核酸或染色質(zhì)修飾活性的額外的氨基酸序列為核酸酶或核酸酶-解旋酶, 并且所述修飾為期望的基因座處的單鏈或雙鏈斷裂。
30. -種使細胞中的dsDNA分子在期望的基因座處進行非同源末端連接,從而從所述 dsDNA分子中除去至少一部分核苷酸序列,任選地敲除一個基因或多個基因的功能的方法, 其中該方法包括采用如權(quán)利要求29所述的修飾靶核酸的方法來制造雙鏈斷裂。
31. -種將核酸同源重組到細胞中期望的基因座處的dsDNA分子內(nèi)以修飾存在的核苷 酸序列或插入期望的核苷酸序列的方法,其中該方法包括采用如權(quán)利要求29所述的修飾 靶核酸的方法在期望的基因座處制造單鏈或雙鏈斷裂。
32. -種修飾、激活或抑制生物體中的基因表達的方法,其包括修飾如權(quán)利要求22至 25中的任一項的方法中所述的靶核酸序列,其中所述核酸是dsDNA,并且所述具有核酸或 染色質(zhì)修飾、轉(zhuǎn)錄激活或抑制活性的額外的氨基酸序列選自DNA修飾酶(例如,脫甲基酶或 脫乙酰酶)、轉(zhuǎn)錄激活物或轉(zhuǎn)錄阻抑物。
33. -種修飾、激活或抑制生物體中的基因表達的方法,其包括修飾如權(quán)利要求22至 25中的任一項的方法中所述的靶核酸序列,其中所述核酸是mRNA,并且所述具有核酸或染 色質(zhì)修飾或轉(zhuǎn)錄激活或抑制活性的額外的氨基酸序列為核糖核酸酶;任選地選自內(nèi)切核酸 酶、3'外切核酸酶或5'外切核酸酶。
34. 如權(quán)利要求22至33中的任一項所述的方法,其中所述細胞是原核細胞。
35. 如權(quán)利要求22至33中的任一項所述的方法,其中所述細胞是真核細胞,例如,植物 細胞、酵母細胞、真菌細胞、昆蟲細胞、哺乳動物細胞或人細胞。
36. 如權(quán)利要求35所述的方法,其中所述哺乳動物或人的細胞是除人胚胎干細胞以外 的干細胞;優(yōu)選分離的干細胞。
37. 如權(quán)利要求33至35中的任一項所述的方法,其中所述細胞在體外轉(zhuǎn)染。
38. 如權(quán)利要求22至36中的任一項所述的方法,其中所述靶核酸具有三級結(jié)構(gòu),任選 為超螺旋的,優(yōu)選地,其中所述靶核酸為負超螺旋的。
39. -種藥物組合物,其包含如權(quán)利要求1至9中的任一項所述的級聯(lián)蛋白質(zhì)復(fù)合物。
40. -種藥物組合物,其包含如權(quán)利要求10至16中的任一項所述的核糖核蛋白復(fù)合 物。
41. 一種藥物組合物,其包含如權(quán)利要求17至19中的任一項所述的分離的核酸,或如 權(quán)利要求20或權(quán)利要求21所述的表達載體。
42. -種試劑盒,其包含如權(quán)利要求1至9中的任一項所述的級聯(lián)蛋白質(zhì)復(fù)合物,以及 如權(quán)利要求10至16中的任一項所限定的RNA分子。
43. 如權(quán)利要求1至9中的任一項所述的級聯(lián)蛋白質(zhì)復(fù)合物,其用作藥物。
44. 如權(quán)利要求10至16中的任一項所述的核糖核蛋白復(fù)合物,其用作藥物。
45. 如權(quán)利要求17至19中的任一項所述的分離核酸,其用作藥物。
46. 如權(quán)利要求20或權(quán)利要求21所述的表達載體,其用作藥物。
【文檔編號】C07K14/195GK104321429SQ201280071058
【公開日】2015年1月28日 申請日期:2012年12月21日 優(yōu)先權(quán)日:2011年12月30日
【發(fā)明者】斯坦·喬翰·約瑟夫·布朗茲, 約翰·萬德奧斯特 申請人:瓦赫寧根大學(xué)