專利名稱:一種新型蛋白質(zhì)分子定向進(jìn)化方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生命科學(xué)領(lǐng)域,具體涉及一種根據(jù)蛋白質(zhì)分子的空間三 維結(jié)構(gòu)或者如序列信息和二級(jí)結(jié)構(gòu)信息等等所有有用的信息,分析其分 子特性,理性選擇目的突變位點(diǎn),并進(jìn)行隨機(jī)重復(fù)遞推式基因序列突變, 之后通過(guò)篩選,獲得具有目的特性的新型蛋白質(zhì)分子的定向進(jìn)化方法。
背景技術(shù):
荷蘭科學(xué)家格里特于1838年首次發(fā)現(xiàn)蛋白質(zhì),蛋白質(zhì)是生物體內(nèi)一 種極為重要的高分子有機(jī)物,凡是有生命的物質(zhì)離開蛋白質(zhì)就無(wú)法生存。 蛋白質(zhì)的基本組成單位是氨基酸,氨基酸通過(guò)脫水縮合形成肽鏈。蛋白 質(zhì)是由一條或多條多肽鏈組成的,每一條多肽鏈有十幾個(gè)至數(shù)百個(gè)不等 的氨基酸殘基,各種氨基酸殘基按一定的順序排列。蛋白質(zhì)是生命的體 現(xiàn)者,現(xiàn)代生物工程技術(shù)的發(fā)展,使得人類可以獲得離體的、純化的、 并具有生物活性的蛋白質(zhì),可用于生物醫(yī)藥和生物催化等等領(lǐng)域??墒?, 生物體內(nèi)天然存在的蛋白質(zhì),其特性往往不盡人意,將其提取出來(lái),并 在體外使用時(shí)常常具有很多缺點(diǎn),比如活性低,對(duì)高溫、低溫、髙PH、 低pH、高壓、輻射等等極端環(huán)境的耐受性差。因此需要對(duì)其進(jìn)行人工的 分子改造,使合成的蛋白質(zhì)更符合人類的需要。由于每一種蛋白質(zhì)都有 自己獨(dú)特的氨基酸排列順序(一級(jí)結(jié)構(gòu)),所以只要改變其中關(guān)鍵的氨基 酸序列就能改變蛋白質(zhì)的性質(zhì)。而氨基酸又是由核酸序列上的三聯(lián)體密 碼子決定的,因此只要改變構(gòu)成遺傳密碼的堿基序列就能達(dá)到改造蛋白 質(zhì)的目的。這一技術(shù)始于20世紀(jì)90年代,稱為定向進(jìn)化技術(shù)(Directed evolution),其中運(yùn)用最為廣泛的實(shí)際操作方法為錯(cuò)誤傾向PCR (Error-prone PCR)和DNA改組(DNA shuffling )。其核心思想是隨機(jī) 地改變編碼蛋白質(zhì)的基因序列,獲得文庫(kù),然后通過(guò)大量的篩選,從文 庫(kù)中獲得正向進(jìn)化的目的基因。但是此類方法的隨機(jī)性很大,其成敗與 否和效果優(yōu)劣在于篩選量的大小和準(zhǔn)確性。數(shù)十年前,人類已知蛋白質(zhì)分子的理化特性和生物學(xué)活性直接取決于其空間三維結(jié)構(gòu),而根據(jù)蛋白 質(zhì)分子的空間三維結(jié)構(gòu),可以分析出蛋白質(zhì)的生物活性和某一理化特性
具體和哪些氨基酸殘基相關(guān)聯(lián)。隨著現(xiàn)代結(jié)構(gòu)生物學(xué)技術(shù)的發(fā)展,使用x
射線衍射法和NMR法等方法,人類已經(jīng)獲得了很多蛋白質(zhì)分子的空間三 維結(jié)構(gòu),但是由于自然界存在的蛋白質(zhì)分子種類眾多,而通過(guò)實(shí)驗(yàn)方法 解析蛋白質(zhì)分子的空間三維結(jié)構(gòu)費(fèi)用高,步驟繁雜,難度較大,因此, 通過(guò)實(shí)驗(yàn)方法得到空間結(jié)構(gòu)的蛋白質(zhì)分子的數(shù)量所占比例比較少。而近 幾年,通過(guò)使用生物信息學(xué)的方法,借助計(jì)算機(jī)技術(shù),人工模擬蛋白質(zhì) 分子空間三維結(jié)構(gòu)取得了很大的進(jìn)展?;谌斯つM的空間三維結(jié)構(gòu)或 者實(shí)驗(yàn)方法解析出的空間三維結(jié)構(gòu),分析出蛋白質(zhì)分子中可能與某一特 性相聯(lián)系的氨基酸殘基的位置,并理性選擇這些位置,對(duì)基因進(jìn)行突變, 可以提高正向進(jìn)化的效率,減小篩選壓力。
發(fā)明內(nèi)容
本發(fā)明的目的是通過(guò)使用X射線衍射法、NMR法等等實(shí)驗(yàn)方法解析蛋 白質(zhì)分子的空間結(jié)構(gòu)?;蛘呤褂糜?jì)算機(jī)技術(shù),根據(jù)蛋白質(zhì)分子的序列信 息,模擬其空間三維結(jié)構(gòu)。進(jìn)而根據(jù)得到的三維結(jié)構(gòu)信息或者其它信息, 分析其分子特性,理性選擇目的突變位點(diǎn),并進(jìn)行隨機(jī)重復(fù)遞推式基因 序列突變,之后通過(guò)篩選,獲得具有目的特性的新型蛋白質(zhì)分子。本發(fā) 明的定向進(jìn)化技術(shù)結(jié)合了理性過(guò)程和隨機(jī)過(guò)程的優(yōu)勢(shì),其具體步驟如下
1.獲得蛋白質(zhì)分子的核酸序列和氨基酸序列
通過(guò)使用基因工程學(xué)原理,用PCR法或者文庫(kù)法等等方法,得到目的 蛋白質(zhì)分子的基因片段,然后再使用"酶切"、"連接"、"轉(zhuǎn)化"等等實(shí) 驗(yàn)技術(shù),將目的基因片段連上載體,導(dǎo)入宿主菌并保存。之后對(duì)基因進(jìn) 行測(cè)序,獲得基因的堿基序列,根據(jù)三聯(lián)密碼子,可以由基因序列轉(zhuǎn)換 得到氨基酸序列?;蛘咄ㄟ^(guò)搜索Genbank、 EMBL、 DDBJ等等國(guó)際序列數(shù) 據(jù)庫(kù),獲得目的蛋白質(zhì)分子的核酸序列和氨基酸序列,使用全基因合成 法,合成目的基因(如果該序列信息受到專利保護(hù),應(yīng)事先獲得專利所
有者的授權(quán))。
2.獲得三維結(jié)構(gòu)信息
目的蛋白質(zhì)分子的三維結(jié)構(gòu)信息可以通過(guò)實(shí)驗(yàn)法和計(jì)算機(jī)輔助模擬 法得到。
實(shí)驗(yàn)法包括X射線晶體衍射法和NMR法。X射線衍射分析主要是根據(jù) 衍射線的方向和強(qiáng)度,即衍射圖案上斑點(diǎn)的位置和黑度,通過(guò)電子計(jì)算 機(jī),繪制出電子密度圖,從中構(gòu)建出三維分子圖像。NMR分析的原理是 處于一個(gè)靜磁場(chǎng)中的核子會(huì)由于磁場(chǎng)的作用而處于不同的能量狀態(tài),當(dāng) 一個(gè)外界的擺動(dòng)的磁場(chǎng)來(lái)擾動(dòng)處于"平衡"狀態(tài)的核子時(shí),吸收了能量 的核子就會(huì)在不同的能級(jí)之間躍遷,并在此過(guò)程中釋放出能量。而放出 的能量被檢測(cè)到之后,經(jīng)過(guò)分析和計(jì)算就可以得到蛋白質(zhì)分子內(nèi)部的結(jié) 構(gòu)信息。
計(jì)算機(jī)輔助構(gòu)建蛋白質(zhì)三維模擬結(jié)構(gòu)基于生物信息學(xué)中的蛋白質(zhì)結(jié) 構(gòu)預(yù)測(cè)技術(shù),其主要有兩大類方法。 一類是理論分析方法或從頭算法, 通過(guò)理論計(jì)算(如分子力學(xué)、分子動(dòng)力學(xué)計(jì)算)進(jìn)行結(jié)構(gòu)預(yù)測(cè)。另一類 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的方法是統(tǒng)計(jì)方法,該類方法對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行 統(tǒng)計(jì)分析,建立序列到結(jié)構(gòu)的映射模型,進(jìn)而根據(jù)映射模型對(duì)未知結(jié)構(gòu) 的蛋白質(zhì)直接從氨基酸序列預(yù)測(cè)結(jié)構(gòu)。這一類方法包括經(jīng)驗(yàn)性方法、結(jié) 構(gòu)規(guī)律提取方法、同源模型化方法等等。同源模型化方法最為常用,預(yù) 測(cè)效果也最為可靠,其原理基于具有相似序列的蛋白質(zhì)傾向于折疊成 相似的空間三維結(jié)構(gòu)。 一對(duì)蛋白質(zhì),如果它們的序列具有25%-30%的等同 部分或者更多,則可以假設(shè)這兩個(gè)蛋白質(zhì)折疊成相似的空間結(jié)構(gòu)。這樣, 如果一個(gè)未知結(jié)構(gòu)的蛋白質(zhì)與一個(gè)已知結(jié)構(gòu)的蛋白質(zhì)具有足夠的序列相 似性,那么可以根據(jù)相似性原理給未知結(jié)構(gòu)的蛋白質(zhì)構(gòu)造一個(gè)近似的三 維模型。
通過(guò)使用生物信息學(xué)的計(jì)算機(jī)軟件(如ACCELRYS DISCOVERY STUDIO, SYBYL等等)以及一些生物信息學(xué)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)(如pdb, Swiss-model等 等),可以模擬出目的蛋白質(zhì)分子的空間三維結(jié)構(gòu)。 3. 根據(jù)三維模型和序列信息或者其它信息選擇合適的突變位點(diǎn)
本發(fā)明中的"突變位點(diǎn)"定義為既可以是蛋白質(zhì)分子上的一個(gè)單氨 基酸殘基,也可以是包含有多個(gè)氨基酸殘基的序列區(qū)域以及它們所對(duì)應(yīng)的 DM和RNA上的單個(gè)堿基位點(diǎn)和多個(gè)堿基組成的序列區(qū)域(下同)。"突變
位點(diǎn)"的選擇既可以根據(jù)蛋白質(zhì)分子三維結(jié)構(gòu)信息,也可以根據(jù)諸如序列 信息、二級(jí)結(jié)構(gòu)信息等等所有有用的信息。
4. 對(duì)突變位點(diǎn)進(jìn)行定點(diǎn)突變
在確定了突變位點(diǎn)之后,可以對(duì)編碼蛋白質(zhì)的DM序列或RNA序列進(jìn) 行改造。對(duì)于待突變位點(diǎn),既可以將其代表某一氨基酸的三聯(lián)密碼子更 換為代表另一氨基酸的三聯(lián)密碼子,也可以使用隨機(jī)密碼子,即在之 后的轉(zhuǎn)錄并翻譯成蛋白質(zhì)分子的過(guò)程中,在使用隨機(jī)密碼子的位置處, 加入多肽鏈的氨基酸的種類是隨機(jī)的。這樣,就可以構(gòu)建成一個(gè)隨機(jī)序 列文庫(kù),其特點(diǎn)在于在理性選擇的突變位點(diǎn)處產(chǎn)生了隨機(jī)的序列信息。
對(duì)序列上的特定位點(diǎn)進(jìn)行改造的常用方法包括重疊延伸PCR法和大 引物PCR定點(diǎn)突變法、全基因合成法合成包含特定突變的全序列、限制 性內(nèi)切酶切除待突變區(qū)域后使用連接酶加入目的突變序列等等。
5. 篩選目的克隆
對(duì)于"將其代表某一氨基酸的三聯(lián)密碼子更換為代表另一氨基酸的三 聯(lián)密碼子"這一情況(該情況簡(jiǎn)稱"非隨機(jī)情況",下同),可以直接將 改造后的序列連上表達(dá)載體,轉(zhuǎn)化宿主菌,表達(dá)出目的蛋白,并直接對(duì) 目的蛋白的活性和理化特性進(jìn)行檢測(cè),得知目的蛋白是否按照意愿產(chǎn)生 正向進(jìn)化。若未產(chǎn)生正向進(jìn)化,則說(shuō)明第4步中在突變位點(diǎn)替換的氨基 酸種類不合適,此時(shí)返回第4步,在該位點(diǎn)替換其它種類的氨基酸。
對(duì)于構(gòu)建隨機(jī)文庫(kù)這種情況,可以將文庫(kù)中的基因連接于表達(dá)載體, 轉(zhuǎn)化入宿主菌,構(gòu)建待篩選克隆文庫(kù)??梢允褂门囵B(yǎng)皿平板法、多孔板 法、搖瓶法等方法培養(yǎng)宿主菌并誘導(dǎo)其表達(dá),之后逐一檢測(cè)表達(dá)產(chǎn)物的
活性或者理化特性,選擇能產(chǎn)生正向進(jìn)化蛋白質(zhì)分子的宿主菌,保存。
6. 重復(fù)遞推式定向進(jìn)化
對(duì)于"非隨機(jī)情況",可以直接提取產(chǎn)生正向進(jìn)化的宿主菌的基因組 或者表達(dá)質(zhì)粒,通過(guò)PCR或者酶切反應(yīng)獲得改造后的基因。
對(duì)于構(gòu)建隨機(jī)文庫(kù)這種情況,可以提取篩選到的產(chǎn)生正向進(jìn)化蛋白質(zhì) 分子的宿主菌的基因組或者表達(dá)質(zhì)粒,通過(guò)PCR或者酶切反應(yīng)獲得改造 后的基因。對(duì)該基因進(jìn)行測(cè)序,獲得序列信息,得知蛋白質(zhì)分子的氨基 酸序列中的哪些氨基酸被替換成了哪些氨基酸,從而得到具有正向進(jìn)化 特性的新蛋白質(zhì)分子。
對(duì)于上述的新蛋白質(zhì)分子以及已知的其序列信息,可以將該蛋白質(zhì)分 子和序列信息作為新的出發(fā)起點(diǎn),重新按照本發(fā)明2、 3、 4、 5的方法步 驟,重新進(jìn)行第二輪定向進(jìn)化,第二輪定向進(jìn)化的結(jié)果又可以作為第三 輪定向進(jìn)化的起點(diǎn),依次類推至第n輪定向進(jìn)化(n為正整數(shù))。即迭代 遞推重復(fù)式定向進(jìn)化。用該方法可以累積正向進(jìn)化。
7. 結(jié)合常規(guī)方法
對(duì)于每一輪產(chǎn)生的結(jié)果,可以結(jié)合已有的各種定向進(jìn)化技術(shù),比如錯(cuò) 誤傾向PCR ( Error-prone PCR)和DM改組(DM shuffling)等等技術(shù),
再次進(jìn)行改造后再進(jìn)行第六步的"重復(fù)遞推式定向進(jìn)化",并通過(guò)篩選, 獲得具有更加良好特性的目的蛋白質(zhì)分子。或者同時(shí)進(jìn)行幾組定向進(jìn)化,
每一組均對(duì)不同的突變位點(diǎn)進(jìn)行突變,突變后,不立即進(jìn)行篩選,而是
混合各組的突變基因,使用DNA改組(DM shuffling)等等技術(shù),進(jìn)行
"洗牌",此時(shí),各組經(jīng)過(guò)定向進(jìn)化產(chǎn)生的突變基因的遺傳信息在分子水
平上產(chǎn)生了類似于"雜交"的效應(yīng),各個(gè)突變基因的遺傳信息相互之間
交叉混合,能夠擴(kuò)大遺傳信息的多樣性,提高定向進(jìn)化的效率。然后通
過(guò)篩選,得到正向進(jìn)化的目的基因,再以此得到的基因?yàn)槠瘘c(diǎn),進(jìn)入下
一輪定向進(jìn)化。之后的每一輪定向進(jìn)化,都可以使用上述的"洗牌"方
法,進(jìn)行迭代遞推重復(fù)式定向進(jìn)化,并累積正向進(jìn)化。
圖1: SWISS MODEL WORKSPACE的同源建模報(bào)告單 圖2: PAL脂肪酶分子的三維模擬圖 圖3:重疊延伸PCR過(guò)程示意圖
具體實(shí)施例方式
為了對(duì)本發(fā)明有更加具體的理解,現(xiàn)結(jié)合一株假單胞菌脂肪酶(PAL) 基因的定向進(jìn)化過(guò)程作進(jìn)一步說(shuō)明。該定向進(jìn)化的目的為提高假單胞菌 脂肪酶(PAL)的熱穩(wěn)定性。應(yīng)注意,本例僅為描述本發(fā)明、便于理解本 發(fā)明用,而非限制本發(fā)明。
(1) 使用LB液體搖瓶培養(yǎng)基(蛋白胨10g/L,酵母提取液5g/L,NaCl 10g/L,PH7. O)培養(yǎng)假單胞菌,培養(yǎng)條件為37度,12個(gè)小時(shí),220rpm。 提取假單胞菌基因組的步驟如下1,取l. 5mL菌液至1. 5mLEp管, 12000rpm,室溫離心2min。 2.除去上清液,加入400inl STE,洗 滌2次。3. 12000rpm,室溫離心2min,用200ialTE重懸。4.加 入100)jl酴,旋渦混勻60s。 5. 12000rpm, 4度離心5min。 6.轉(zhuǎn) 移160jil上層液相至另一干凈Ep管。7.加入40jalTE, 100 jal 氯仿,顛倒混勻,12000rpm, 4度離心5min。 8.重復(fù)以上步驟,直 到白色界面不再出現(xiàn)。9.轉(zhuǎn)移160|al上層至干凈Ep管,加入40 ILil TE, lpl RMseA, 37度保溫10min。 10.加入100/al氯仿, 12000rpm, 4度離心5min。 11.取上層150 |a 1液相至干凈Ep管, -20度保存。(此即為提取的基因組DM)。將基因組DM于iy。瓊脂
糖凝膠電泳上檢測(cè)純度、濃度,之后使用引物(本例中的所有引物 序列均已列入說(shuō)明書后的"序列表"中,"序列表"中編號(hào)為3、 4、 5、 6、 7、 8的序列,分別對(duì)應(yīng)引物甲、乙、A、 B、 C、 D,下同) 上游引物(甲):GGCGCTGTCAGGCTGGGGTTCC 3',下游引物(乙): GTGATATCCAGGTGCCATTAGA 3、退火溫度為61度。通過(guò)PCR
過(guò)程獲得PAL基因,PCR體系為50pl體系(本例中的所有PCR過(guò) 程均采用本體系,下同),具體為滅菌高純水28jal,模板5|al, 上游引物2 |j 1,下游引物2 ju 1, dNTP ( 2. 5mM) 4 in 1, 1 OX PCR Buffer 5jal,Mg2+ 3jal, Taq酶ljal。 PCR程序?yàn)?本例中的所有PCR過(guò)程 均釆用本程序,下同)1. 95°C 2min,2. 94°C50s,3. X °C 45s (X為退火溫度,其數(shù)值由具體的引物決定),4. 72°C 1.5min(2-4 步驟循環(huán)30次),5. 72°C lOmin, 6. 4°C終止。將PCR產(chǎn)物于 1%瓊脂糖凝膠電泳上檢測(cè)純度、濃度,并與DNA marker比較得知 PCR產(chǎn)物長(zhǎng)度(約為950bp-1000bP)。確認(rèn)無(wú)誤后,使用北京天根 DM膠回收試劑盒(凡是使用試劑盒,均按照試劑盒說(shuō)明書操作, 下同)回收并純化目的PCR產(chǎn)物,回收后的產(chǎn)物使用TaKaRa pMD-18T 載體試劑盒,通過(guò)TA克隆,連接于T載體上,并轉(zhuǎn)化宿主菌大腸桿 菌TOP10F,,具體步驟為挑取TOP10F,單菌落置于5mL LB液體 培養(yǎng)基中過(guò)夜培養(yǎng),之后轉(zhuǎn)接于15mL LB液體培養(yǎng)基中培養(yǎng)至 OD600-0. 3—0. 4,再分裝于1. 5mL的Ep管中,4°C, 12000rpm離心 2min,倒凈上清液,每管加lmL冰預(yù)冷的CaCl2(0. lmol/L)溶液懸 浮細(xì)胞。再4。C, 12000rpm離心2min,倒凈上清液,每管加100jul 冰預(yù)冷的CaCl2 ( 0. lmol/L)溶液輕緩地懸浮細(xì)胞,即成感受態(tài)細(xì)胞 懸液。將欲轉(zhuǎn)化的DM溶液全量加入100ial的感受態(tài)細(xì)胞中,冰上 放置30min, 42。C水洛中熱休克90s,再在冰上放置2min。加入600 jal LB培養(yǎng)基,37。C震蕩培養(yǎng)60min。在含有X-gal、 IPTG、 Amp 的LB瓊脂平板上培養(yǎng),形成單菌落,計(jì)數(shù)白色和藍(lán)色菌落,白色菌 落為陽(yáng)性克隆。然后測(cè)序,獲得基因的DNA序列,再通過(guò)三聯(lián)密碼 子,翻譯DNA序列中的編碼ORF為蛋白質(zhì)序列。(所得的序列已列于 序列表中,序列表中編號(hào)為1和2的序列,分別對(duì)應(yīng)PAL基因的DNA 序列和蛋白質(zhì)序列。)
(2)向 SWISS MODEL WORKSPACE 網(wǎng)絡(luò)數(shù)據(jù)庫(kù) (http: 〃swissmode1. expasy. org/SWISS-MODEL. html )提交獲得的
蛋白質(zhì)序列,使用First Approach mode算法進(jìn)行蛋白質(zhì)分子空間 三維結(jié)構(gòu)的同源建模,獲得模擬的PAL蛋白質(zhì)空間三維結(jié)構(gòu)。將后 綴名為pdb的記錄有三維結(jié)構(gòu)信息的文件下載到本地計(jì)算機(jī)中。(報(bào) 告單和三維結(jié)構(gòu)模擬圖見(jiàn)附圖1和2 )
(3) B因子可以反映蛋白質(zhì)三維結(jié)構(gòu)的穩(wěn)定性,通過(guò)使用計(jì)算機(jī)計(jì)算, 可以得到一個(gè)蛋白質(zhì)分子三維結(jié)構(gòu)中各個(gè)氨基酸殘基的B因子,由 大到小對(duì)它們進(jìn)行排序,由于B因子越大的位點(diǎn),可能對(duì)穩(wěn)定性的 貢獻(xiàn)度越大,故優(yōu)先選取B因子數(shù)值高的位點(diǎn),進(jìn)行定向進(jìn)化。PAL 蛋白質(zhì)序列中,B因子數(shù)值由大到小排列在前十位的依次為(三字
母為氨基酸簡(jiǎn)寫,數(shù)字為氨基酸殘基在蛋白質(zhì)序列中的位點(diǎn)) GLY(144), PHE(145), SER(146), GLU(147), PHE(148), PHE(248), GLY (249) , GLU (250) , PHE (41) , PHE (165)。由于GLY (144) , PHE (145), SER(146), GLU (147), PHE (148)這5個(gè)氨基酸殘基在位置上相鄰, PHE (248), GLY (249), GLU(250)這3個(gè)氨基酸殘基在位置上相鄰, 故將這5個(gè)氨基酸殘基和3個(gè)氨基酸殘基分別看作一個(gè)整體(分別 命名為siteA和siteB,下同),對(duì)其進(jìn)行定向進(jìn)化。
(4) 首先對(duì)siteA進(jìn)行定向進(jìn)化,此為第一輪定向進(jìn)化。使用重疊延 伸PCR技術(shù)(見(jiàn)附圖3)。設(shè)計(jì)定點(diǎn)突變引物如下(其中N為隨機(jī)堿 基,可以是A、 T、 C、 G中的任何一種)右片斷上游引物(B): 5, GTGACCNNNNNNNNNNNNNNNCTCGGGCCGA 3,,下游引物(D ): 5, ACCAAAGACTAATGCCGGGTCGCCTAGGGCT 3,,退火溫度為70度;左片斷 上游引物(A): 5, CACCATGAACAAGAACAAGACGTTCCTCGCG 3,,下游 引物(C): 5, TCGGCCCGAGNNNNNNN麗NNNNNNGGTCAC 3,,退火溫度 為70度。以含有PAL基因的T載體質(zhì)粒為模板,通過(guò)PCR過(guò)程,使 用以上2套引物,分別獲得左和右2個(gè)片斷。再使用引物上游引 物(A ): 5, CACCATGAACAAGAACAAGACGTTCCTCGCG 3,和下游引物(D): 5, ACCAAAGACTAATGCCGGGTCGCCTAGGGCT 3,,退火溫度為70度,
等量混合之前得到的左右兩個(gè)片斷作為模板,通過(guò)PCR,組合之前 得到的左右兩個(gè)片斷的PCR產(chǎn)物為全長(zhǎng)PAL基因。
(5) PCR產(chǎn)物經(jīng)r/。瓊脂糖凝膠電泳檢測(cè)片斷長(zhǎng)度、純度和濃度無(wú)誤后,
使用Invitrogen Champion pET100/D-TOPO Expression Kit表達(dá)試 劑盒,克隆PCR產(chǎn)物到TOPO表達(dá)載體上,轉(zhuǎn)化相應(yīng)的大腸桿菌,誘 導(dǎo)表達(dá)PAL基因。
(6) 在含有5%三丁酸甘油酯的LB瓊脂培養(yǎng)基平板(蛋白胨10g/L, 酵母提取液5g/L, NaCl 10g/L,瓊脂20g/L, PH7. 0)上培養(yǎng)并誘 導(dǎo)表達(dá)這些大腸桿菌,成功表達(dá)并分泌PAL脂肪酶的大腸桿菌會(huì)降 解菌落周圍的三丁酸甘油酯,從而在菌落周閨形成透明圈,選取透 明圈直徑大的大腸桿菌,接種于LB液體搖瓶培養(yǎng)基培養(yǎng),并誘導(dǎo)表 達(dá)PAL脂肪酶。
(7) 搖瓶培養(yǎng)后,將每瓶搖瓶的發(fā)酵液分裝于多個(gè)試管中,分別置于 恒溫水浴中靜置一段時(shí)間。水洛溫度和靜置時(shí)間均由低到高設(shè)置一 個(gè)梯度(30度、40度、60度、80度、100度以及10min、 20min、 30min)。將水浴處理后的發(fā)酵液,滴加于三丁酸甘油酯水瓊脂鑒定 平板(2%瓊脂粉、5%三丁酸甘油酯、去離子水)上,能夠在越高溫 度,越長(zhǎng)時(shí)間處理后,發(fā)酵液仍具有較大透明圈的菌株,為篩選的 目的菌株。
(8) 將篩選到的目的菌株保存。
(9) 提取目的菌株的表達(dá)質(zhì)粒,使用PCR引物(上游引物A: CACCATGAACAAGAACAAGACGTTCCTCGCG ; 下游引物D : 5' ACCAAAGACTAATGCCGGGTCGCCTAGGGCT ,退火溫度為70度),克隆 獲得突變過(guò)的目的基因序列。并測(cè)序,獲得序列信息。
(10) 重復(fù)步驟(2)-(9),以篩選到的siteA位點(diǎn)突變(正向進(jìn)化) 的基因?yàn)槠瘘c(diǎn),對(duì)siteB位點(diǎn)進(jìn)行定向進(jìn)化。并通過(guò)篩選,獲得目 的基因。
(11) 以第(10)步獲得的目的基因?yàn)槠瘘c(diǎn),對(duì)其它位點(diǎn)進(jìn)行如上所述 的突變和篩選,并依次類推,進(jìn)行多輪遞推式定向進(jìn)化。
應(yīng)當(dāng)理解為,在閱讀了本發(fā)明的上述內(nèi)容之后,本領(lǐng)域或者相關(guān)領(lǐng) 域技術(shù)人員如果對(duì)本發(fā)明作出改動(dòng)或修改,任何等同或者等價(jià)形式的改 動(dòng)或修改,均屬于本發(fā)明申請(qǐng)的權(quán)利要求書所限定的范圍內(nèi)。
序列表
<110> 林峻
<120> —種新型蛋白質(zhì)分子定向進(jìn)化方法
<160> 8
<170> Patentln version 3. 3
<210> 1
<211> 1081
<212> DNA
<213> 假單胞菌種(Pseudomonas sp.)
<220>
<221> CDS
<222> (80).. (1009)
<400> 1
ggcgctgtca ggctggggtt ccggcccgct cagcacgtgc cttgccaact gcctgtccaa 60
tccgaacgga gtctcgacg atg aac aag aac aag acg ttc etc gcg gcg gcg 112
Met Asn Lys Asn Lys Thr Phe Leu Ala Ala Ala 1 5 10
ctg gta gcg ctg gcc gcc age ttt ccc gtg cac get gcg acc gac tac 160 Leu Val Ala Leu Ala Ala Ser Phe Pro Val His Ala Ala Thr Asp Tyr 15 20 25
acc cgc acg cgc tat ccc ate gtg ctg tec cac ggt ctg ttc ggc ttc 208 Thr Arg Thr Arg Tyr Pro lie Val Leu Ser His Gly Leu Phe Gly Phe 30 35 40
33g age Lys Ser 45
gtc Val
ggc Gly
ccg Pro
gtg gac Val Asp 50
tac tgg cac Tyr Trp His
get ate Ala lie 55
gtg ccg gcc ctg Val Pro Ala Leu
256
gag aag gac ggc gcg aag gtc ttc gcc acc teg cag teg ccg gtg aac 304 Glu Lys Asp Gly Ala Lys Val Phe Ala Thr Ser Gin Ser Pro Val Asn 60 65 70 75
age aac gag gtg cgc ggc gaa cag eta ctg gcg cag gtg gag gaa gtc 352
Ser Asn Glu Val Arg Gly Glu Gin Leu Leu Ala Gin Val Glu Glu Val
80 85 90
ctg gcc ctg acc ggc gcg gag aaa gtc aac ctg ate ggc cac age cag 400
Leu Ala Leu Thr Gly Ala Glu Lys Val Asn Leu lie Gly His Ser Gin
95 100 105
ggc ggc atg acc gtg cgc tac gtc gcc ggg gtg gcg ccg caa ctg gtg 448
Gly Gly Met Thr Val Arg Tyr Val Ala Gly Val Ala Pro Gin Leu Val
110 115 120
gcc teg gtc acc acc atg ggc acg ccg cac aag ggc acg ccg gta gcc 496
Ala Ser Val Thr Thr Met Gly Thr Pro His Lys Gly Thr Pro Val Ala
125 130 135
gac gcg gtg acc ggc ttc age gag ttc etc ggg ccg ate ggc acc gag 544
Asp Ala Val Thr Gly Phe Ser Glu Phe Leu Gly Pro lie Gly Thr Glu
140 145 150 155
gtg ate gcc teg gcg gtg gag gcg ctg Uc teg gtg gtc gac ate gtc 592
Val lie Ala Ser Ala Val Glu Ala Leu Phe Ser Val Val Asp lie Val
160 165 170
gac ggc ggc gag tgg gtc aag ggc gac gcg ctg get gcc ctg aac agt 640
Asp Gly Gly Glu Trp Val Lys Gly Asp Ala Leu Ala Ala Leu Asn Ser
175 180 185
etc aac act ccc ggc acc gcg egg ttc aac.cag cgc ttc ccg cag gcg 688
Uu Asti Thr Pro Gly Thr Ala Arg Phe Asn Gin Arg Phe Pro Gin Ala
190 195 200
ate ccg gcc age gcc tgt ggc cag ggc gcg gag acg gta gcc ggg gtg 736
lie Pro Ala Ser Ala Cys Gly Gin Gly Ala Glu Thr Val Ala Gly Val
205 210 215
cgc tac tac teg atg age ggc acc ggc tec ctg acc aat gcg etc gac 784
Arg Tyr Tyr Ser Met Ser Gly Thr Gly Ser Leu Thr Asn Ala Leu Asp
220 225 230 235
ccg age tec gcc ggc ctg gcg gtg acc ggg ctg ctg ttc ggc gag gcc 832
Pro Ser Ser Ala Gly Leu Ala Val Thr Gly Leu Leu Phe Gly Glu Ala
240 245 250
aac gac ggt ctg gtc ggc caa tgc tec age cac ctg ggc age gtg gtg 880
Asn Asp Gly Leu Val Gly Gin Cys Ser Ser His Leu Gly Ser Val Valaag gac Lys Asp
ggc ctg Gly Leu 285
cat gcc His Ala 300
aac Asn 270
gtc Val
aat Asn
255
tac Tyr
Ser
egg Arg
ctg Leu
cgc Arg
etc Leu
atg Met
ttc Phe
agg Arg 305
gac Asp
gag Glu 290
aac Asn
cat His 275
age Ser
gtc Val
260
ctg Leu
gac Asp
gac Asp
ccg Pro
gaa gtc Glu Val
acc cag Thr Gin 295
Asn 280
gtc Val
265
cag ttg etc 928 Gin Leu Leu
tat agg cag 976 Tyr Arg Glu
gga Gly
etc Leu
tga tccgctcgcc gggtcgccgc 1029
agccctaggc gacccggcat tagtctttgg tctaatggca cctggatatc ac
<210> 2 <211> 309 <212> PRT
<213> 假單胞菌種(Pseudoraonas sp.) <400> 2
Met Asn Lys Asn Lys Thr Phe Leu Ala Ala Ala Leu Val Ala Leu Ala
1 5
10
15
Ala Ser Phe Pro Val His Ala Ala Thr Asp Tyr Thr Arg Thr Arg Tyr 20 25 30
Pro lie Val Leu Ser His Gly Leu Phe Gly Phe Lys Ser Val Gly Pro 35 40 45
Val Asp Tyr Trp His Ala lie Val Pro Ala Leu Glu Lys Asp Gly Ala 50 55 60
Lys Val Phe Ala Thr Ser Gin Ser Pro Val Asn Ser Asn Glu Val Arg
65 70
75
80
Gly Glu Gin Leu Leu Ala Gin Val Glu Glu Val Leu Ala Leu Thr Gly 85 90 95
1081
Ala Glu Lys Val Asn Leu lie Gly His Ser Gin Gly Gly Met Thr Val 100 105 110
Arg Tyr Val Ala Gly Val Ala Pro Gin Leu Val Ala Ser Val Thr Thr 115 120 125
Met Gly Thr Pro His Lys Gly Thr Pro Val Ala Asp Ala Val Thr Gly 130 135 140
Phe Ser Glu Phe Leu Gly Pro lie Gly Thr Glu Val lie Ala Ser Ala 145 150 155 160
Val Glu Ala Leu Phe Ser Val Val Asp lie Val Asp Gly Gly Glu Trp 165 170 175
Val Lys Gly Asp Ala Leu Ala Ala Leu Asn Ser Leu Asn Thr Pro Gly 180 185 190
Thr Ala Arg Phe Asn Gin Arg Phe Pro Gin Ala lie Pro Ala Ser Ala 195 200 205
Cys Gly Gin Gly Ala Glu Thr Val Ala Gly Val Arg Tyr Tyr Ser Met 210 215 220
Ser Gly Thr Gly Ser Uu Thr Asn Ala Uu Asp Pro Ser Ser Ala Gly 225 230 235 240
Leu Ala Val Thr Gly Uu Leu Phe Gly Glu Ala Asn Asp Gly Leu Val 245 250 255
Gly Gin Cys Ser Ser His Leu Gly Ser Val Val Lys Asp Asn Tyr Arg 260 265 270
Met Asp His Leu Asp Glu Val Asn Gin Leu Leu Gly Leu Val Ser Leu
275
280 285
Phe Glu Ser Asp Pro Thr Gin Val Tyr Arg Gin His Ala Asn Arg Leu
290
Arg Asn Val Gly Leu 305
295 300
<210> <211> <212> <213>
3
22 DM
人工序列
<400> 3
ggcgctgtca ggctggggtt cc 22
<210> 4
<211> 22
<212> DNA <213>人工序列
<400> 4
gtgatatcca ggtgccatta ga 22
<210> 5
<211> 31
<212> 飄 <213>人工序列
<400> 5
caccatgaax aagaacaaga cgttcctcgc g 31
<210> 6
<211> 31
<212> DNA <213>人工序列
<220>
<221> misc—feature
<222> (7).. (21)
<223> n -a或g或c或t
<400> 6
gtgaccnimn immmnimmi nctcgggccg a 31
<210> 7
<211> 31
<212> DM <213>人工序列
<220>
<221> misc—feature
<222> (11). .(25)
<223> n =a或g或c或t
<400> 7
tcggcccgag mmnmmmm mmrmggtca c
<210> 8
<211> 31
<212> DNA <213>人工序列
<400> 8
accaaagact aatgccgggt cgcctagggc
權(quán)利要求
1.一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其主要流程是通過(guò)使用X射線衍射法、NMR法等等實(shí)驗(yàn)方法解析作為進(jìn)化起點(diǎn)的蛋白質(zhì)分子的空間結(jié)構(gòu)?;蛘呤褂糜?jì)算機(jī)技術(shù),根據(jù)蛋白質(zhì)分子的序列信息,模擬其空間三維結(jié)構(gòu)。進(jìn)而根據(jù)得到的三維結(jié)構(gòu)信息,或者根據(jù)該蛋白質(zhì)分子的其它信息(如序列信息、二級(jí)結(jié)構(gòu)信息等等所有有用的信息),分析其分子特性,理性選擇目的突變位點(diǎn),并進(jìn)行隨機(jī)重復(fù)遞推式基因序列突變,之后通過(guò)篩選,獲得具有目的特性的新型蛋白質(zhì)分子。其主要特征是結(jié)合了理性過(guò)程和隨機(jī)過(guò)程的優(yōu)勢(shì)。
2. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特 征是在獲取蛋白質(zhì)分子的空間三維結(jié)構(gòu)時(shí),既可以使用X射線衍射法、 NMR法等等實(shí)驗(yàn)方法,也可以使用計(jì)算機(jī)模擬方法。
3. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特 征是在獲取蛋白質(zhì)分子的基因和序列信息時(shí),既可以使用基因工程學(xué)原 理,用PCR法或者文庫(kù)法等等方法,得到目的蛋白質(zhì)分子的基因片段,然后再使用"酶切"、"連接"、"轉(zhuǎn)化"等等實(shí)驗(yàn)技術(shù),將目的基因片段 連上載體,導(dǎo)入宿主菌并保存。之后對(duì)基因進(jìn)行測(cè)序,獲得基因的堿基 序列,根據(jù)三聯(lián)密碼子,由基因序列轉(zhuǎn)換得到氨基酸序列;也可以通過(guò) 搜索Genbank、 EMBL、 DDBJ等等國(guó)際序列數(shù)據(jù)庫(kù),獲得目的蛋白質(zhì)分子 的核酸序列和氨基酸序列,使用全基因合成法,合成目的基因。
4. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特 征是其中的"突變位點(diǎn)"定義為既可以是蛋白質(zhì)分子上的一個(gè)單氨基 酸殘基及其對(duì)應(yīng)的DNA和RNA上的堿基位點(diǎn),也可以是包含有多個(gè)氨基 酸殘基的序列區(qū)域以及它們所對(duì)應(yīng)的DNA和RNA上的多個(gè)堿基組成的序 列區(qū)域。"突變位點(diǎn)"的選擇既可以根據(jù)蛋白質(zhì)分子三維結(jié)構(gòu)信息,也 可以根據(jù)如序列信息、二級(jí)結(jié)構(gòu)信息等等所有有用的信息。
5. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特征是其中的"隨機(jī)重復(fù)遞推式基因序列突變"中"隨機(jī)"的主要過(guò)程為 在確定了突變位點(diǎn)之后,對(duì)編碼蛋白質(zhì)的DNA序列或RM序列進(jìn)行改造。 對(duì)于待突變點(diǎn),既可以將DNA序列或RNA序列中代表某一氨基酸的三聯(lián) 密碼子更換為代表另一氨基酸的三聯(lián)密碼子,也可以更換為隨機(jī)密碼 子,即在之后的轉(zhuǎn)錄并翻譯成蛋白質(zhì)分子的過(guò)程中,在使用隨機(jī)密碼 子的位置處,加入多肽鏈的氨基酸的種類是隨機(jī)的。這樣,就可以構(gòu)建 成一個(gè)隨機(jī)序列文庫(kù),其特點(diǎn)在于在理性選擇的位點(diǎn)處產(chǎn)生了隨機(jī)的 序列信息。對(duì)序列上的特定位點(diǎn)進(jìn)行改造(如更換密碼子)的常用方法 包括重疊延伸PCR法和大引物PCR定點(diǎn)突變法、全基因合成法合成包含特定突變的全序列、限制性內(nèi)切酶切除待突變區(qū)域后使用連接酶加入 目的突變序列等等。對(duì)于"將其代表某一氨基酸的三聯(lián)密碼子更換為代 表另一氨基酸的三聯(lián)密碼子"這一情況,可以直接將改造后的序列連上 表達(dá)載體,轉(zhuǎn)化宿主菌,表達(dá)出目的蛋白,并直接對(duì)目的蛋白的活性和 理化特性進(jìn)行檢測(cè),得知目的蛋白是否按照意愿產(chǎn)生正向進(jìn)化。若未產(chǎn) 生正向進(jìn)化,則說(shuō)明在突變位點(diǎn)替換的氨基酸種類不合適,此時(shí)返回該 步驟,在該位點(diǎn)替換其它種類的氨基酸。對(duì)于構(gòu)建隨機(jī)文庫(kù)這種情況, 可以將文庫(kù)中的基因連接于表達(dá)載體,轉(zhuǎn)化入宿主菌,構(gòu)建待篩選克隆 文庫(kù)??梢允褂门囵B(yǎng)皿平板法、多孔板法、搖瓶法等等方法培養(yǎng)宿主菌 并誘導(dǎo)其表達(dá),之后逐一檢測(cè)表達(dá)產(chǎn)物的活性或者理化特性,選擇能產(chǎn) 生正向進(jìn)化蛋白質(zhì)分子的宿主菌,保存。此為第一輪定向進(jìn)化。
6. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特 征是其中的"隨機(jī)重復(fù)遞推式基因序列突變"中"重復(fù)遞推式"的主要 過(guò)程為在第一輪定向進(jìn)化完成后,以第一輪定向進(jìn)化篩選到的結(jié)果(目 的蛋白質(zhì))作為起點(diǎn),重復(fù)之前的定向進(jìn)化步驟,進(jìn)行第二輪定向進(jìn)化, 將第二輪定向進(jìn)化的結(jié)果(目的蛋白質(zhì))作為起點(diǎn),重復(fù)之前的定向進(jìn) 化步驟,進(jìn)行第三輪定向進(jìn)化,依次類推,至第n輪定向進(jìn)化(n為正整數(shù))。即迭代遞推重復(fù)式定向進(jìn)化。該方法可以累積正向進(jìn)化。
7. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特 征是在"重復(fù)遞推式"定向進(jìn)化的每一輪(包括最后一輪),均可以對(duì) 目的蛋白質(zhì)及其基因使用錯(cuò)誤傾向PCR (Error-prone PCR )或者DNA shuffling等等現(xiàn)有的定向進(jìn)化技術(shù),對(duì)其進(jìn)行改造,進(jìn)一步改善蛋白 質(zhì)分子特性?;蛘咄瑫r(shí)進(jìn)行幾組定向進(jìn)化,每一組均對(duì)不同的突變位點(diǎn) 進(jìn)行突變,突變后,不立即進(jìn)行篩選,而是混合各組的突變基因,使用 DNA改組(DNA shuffling)等等技術(shù),進(jìn)行"洗牌",此時(shí),各組經(jīng)過(guò)定向進(jìn)化產(chǎn)生的突變基因的遺傳信息在分子水平上產(chǎn)生了類似于"雜 交"的效應(yīng),各個(gè)突變基因的遺傳信息相互之間交叉混合,能夠擴(kuò)大遺 傳信息的多樣性,提高定向進(jìn)化的效率。然后通過(guò)篩選,得到正向進(jìn)化 的目的基因,再以此得到的基因?yàn)槠瘘c(diǎn),進(jìn)入下一輪定向進(jìn)化。之后的 每一輪定向進(jìn)化,都可以使用上述的"洗牌"方法,進(jìn)行迭代遞推重復(fù) 式定向進(jìn)化,并累積正向進(jìn)化。
8. 根據(jù)權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法,其特 征是其中的"蛋白質(zhì)"定義為各種氨基酸通過(guò)脫水縮合作用形成肽鏈 后產(chǎn)生的聚合物及其各種配基,或者各種氨基酸以其它方式形成的聚合 物。蛋白質(zhì)既可以是自然界動(dòng)物、植物、微生物、病毒來(lái)源的天然蛋白 質(zhì),也可以是實(shí)驗(yàn)室人工合成的或者修飾、改造過(guò)的蛋白質(zhì)。蛋白質(zhì)包 括肽類物質(zhì)。
9. 通過(guò)使用權(quán)利要求1所述的一種新型的蛋白質(zhì)分子定向進(jìn)化方法, 而獲得的所有蛋白質(zhì)分子及其氨基酸序列和堿基序列(包括DNA序列和 RNA序列)。
全文摘要
本發(fā)明屬于生命科學(xué)領(lǐng)域,具體涉及一種根據(jù)蛋白質(zhì)分子的空間三維結(jié)構(gòu)或者諸如序列信息、二級(jí)結(jié)構(gòu)信息等等其它有用信息,分析其分子特性,理性選擇目的突變位點(diǎn),并進(jìn)行隨機(jī)重復(fù)遞推式基因序列突變,之后通過(guò)篩選,獲得具有目的特性的新型蛋白質(zhì)分子的定向進(jìn)化方法。本發(fā)明的定向進(jìn)化技術(shù)結(jié)合了理性過(guò)程和隨機(jī)過(guò)程的優(yōu)勢(shì)。
文檔編號(hào)C40B10/00GK101353372SQ200810071520
公開日2009年1月28日 申請(qǐng)日期2008年8月4日 優(yōu)先權(quán)日2008年8月4日
發(fā)明者峻 林 申請(qǐng)人:峻 林