專利名稱:晚期胚胎豐富蛋白的同源蛋白及其編碼序列的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基因工程領(lǐng)域,具體地,本發(fā)明涉及一種新的人基因核苷酸序列。更具體地說,本發(fā)明涉及人px19的cDNA序列,該cDNA編碼的蛋白是LEA的同系物。本發(fā)明還涉及由該核苷酸序列編碼的多肽,這些多核苷酸和多肽的應(yīng)用,以及所述多核苷酸和所述多肽的生產(chǎn)方法。
晚期胚胎豐富蛋白(Late Embryogenesis Abundant protein,簡稱為“LEA蛋白”)是一類廣泛存在于高等植物種子中的蛋白(Biosci.Biotech.Biochem.1997,61(8)1286-1291),它們在植物發(fā)育過程中種子形成的晚期階段逐漸聚集,其mRNA是成熟種子中的主要mRNA(Plant J.1993,3(3)363-369)。LEA蛋白的主要作用是保護種子細胞免受由干化引起的傷害并幫助某些種類的種子抵抗寒冷壓力(Plant Mol.Biol.1995,29(1)11-23)。
1981年,Dure等最早從棉花種子中發(fā)現(xiàn)了LEA蛋白(J.Biochem.1981,204162-4168)。1988年,Baker等又從棉花種子里分離到6個LEA蛋白(PlantMol.Biol.1988,11277-291)。以后在各種植物中,如擬南芥菜、大豆、小麥、黑麥、水稻、云杉、玉米等,克隆了多種編碼LEA蛋白基因。1996年,Niu等人最早在Gallus gallus(一種原雞)中克隆了第一個動物L(fēng)EA蛋白(Gene 1996,175187-191),然而其具體生理功能尚不明了。1998年,Stacy等人在枯草桿菌中克隆到和植物L(fēng)EA蛋白高度同源的序列(Planta 1998,206476-478)。
在本發(fā)明之前,還沒有在人中發(fā)現(xiàn)或分離出含LEA基序的蛋白。
本發(fā)明的一個目的是提供一種新的多核苷酸,該多核苷酸編碼LEA同系物的一個新成員,本發(fā)明的LEA蛋白同系物成員被命名為人px19,它是第一個含LEA基序的人蛋白。
本發(fā)明的另一個目的是提供一種新的LEA蛋白同系物成員,該蛋白被命名為人px19蛋白。
本發(fā)明的再一個目的是提供一種利用重組技術(shù)生產(chǎn)所述的新的人的px19多肽的方法。
本發(fā)明還提供了這種人的px19核酸序列和多肽的應(yīng)用。
在本發(fā)明的一個方面,提供了一種分離出的DNA分子,它包括編碼具有人px19蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列雜交。較佳地,所述的序列編碼一多肽,該多肽具有SEQ ID NO.4所示的序列。更佳地,該序列具有SEQ ID NO.3中從核苷酸42-701位的核苷酸序列。
在本發(fā)明的另一方面,提供了一種分離的人px19蛋白多肽,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.4序列的多肽。
在本發(fā)明的另一方面,提供了一種載體,它含有上述分離出的DNA。
在本發(fā)明的另一方面,提供了一種所述載體轉(zhuǎn)化的宿主細胞。
在本發(fā)明的另一方面,提供了一種產(chǎn)生具有人px19蛋白活性的多肽的方法,該方法包括(a)將編碼具有人px19蛋白活性的多肽的核苷酸序列可操作地連于表達調(diào)控序列,形成人px19蛋白表達載體,所述的核苷酸序列與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉(zhuǎn)入宿主細胞,形成人px19蛋白的重組細胞;(c)在適合表達人px19蛋白多肽的條件下,培養(yǎng)步驟(b)中的重組細胞;(d)分離出具有人px19蛋白活性的多肽。
在本發(fā)明的一個具體實施方案中,本發(fā)明的分離的多核苷酸全長為755個核苷酸,其詳細序列見SEQ ID NO.3,其中開放讀框位于42-701位核苷酸。
在本發(fā)明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,術(shù)語“人px19蛋白(或多肽)編碼序列”指編碼具有人px19蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中42-701位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.3序列的編碼框42-701位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于密碼子的簡并性,所以與SEQ ID NO.3中42-701位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.4所述的序列。該術(shù)語還包括能在中度嚴緊條件下,更佳地在高度嚴緊條件下,與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列雜交的核苷酸序列。還術(shù)語還包括與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%的核苷酸序列。
該術(shù)語還包括能編碼具有與人px19相同功能的蛋白的、SEQ ID NO.4序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數(shù)個(通常為60個以內(nèi),較佳地為30個以內(nèi),更佳地為10個以內(nèi),最佳地為5個以內(nèi))核苷酸。
在本發(fā)明中,“基本純的”蛋白質(zhì)或多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度?;炯兊亩嚯幕旧喜缓烊粻顟B(tài)下的伴隨其的組分。
在本發(fā)明中,術(shù)語“人px19蛋白多肽”指具有人px19蛋白活性的SEQ ID NO.4序列的多肽。該術(shù)語還包括具有與人px19蛋白相同功能的、SEQ ID NO.4序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數(shù)個(通常為20個以內(nèi),較佳地為10個以內(nèi),更佳地為5個以內(nèi))氨基酸。例如,在本領(lǐng)域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質(zhì)的功能。又比如,在C末端和/或N末端添加一個或數(shù)個氨基酸通常也不會改變蛋白質(zhì)的功能。該術(shù)語還包括人px19蛋白的活性片段和活性衍生物。
該多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導(dǎo)突變體、在高或低的嚴緊度條件下能與人px19 DNA雜交的DNA所編碼的蛋白、以及利用抗人px19多肽的抗血清獲得的多肽或蛋白。本發(fā)明還提供了其他多肽,如包含人px19多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發(fā)明還包括了人px19多肽的可溶性片段。通常,該片段具有人px19多肽序列的至少約10個連續(xù)氨基酸,通常至少約30個連續(xù)氨基酸,較佳地至少約50個連續(xù)氨基酸,更佳地至少約80個連續(xù)氨基酸,最佳地至少約100個連續(xù)氨基酸。
發(fā)明還提供人px19蛋白或多肽的類似物。這些類似物與天然人px19多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導(dǎo)的遺傳變異體。誘導(dǎo)變異體可以通過各種技術(shù)得到,如通過輻射或暴露于誘變劑而產(chǎn)生隨機誘變,還可通過定點誘變法或其他已知分子生物學(xué)的技術(shù)。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應(yīng)理解,本發(fā)明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結(jié)構(gòu))形式包括體內(nèi)或體外的多肽的化學(xué)衍生形式如乙?;螋然?。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產(chǎn)生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優(yōu)化了溶解性能的多肽。
在本發(fā)明中,“人px19保守性變異多肽”指與SEQ ID No.4的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個,最佳地至多3個氨基酸被性質(zhì)相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據(jù)表1進行氨基酸替換而產(chǎn)生。
表1
本發(fā)明還包括人px19多肽編碼序列及其片段的反義序列。這種反義序列可用于抑制細胞內(nèi)人px19的表達。
本發(fā)明還包括一種可用作探針的核酸分子,該分子通常具有人px19多肽編碼序列的8-100個,較佳地15-50個連續(xù)核苷酸。該探針可用于檢測樣品中是否存在編碼人px19的核酸分子。
本發(fā)明還包括檢測人px19核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發(fā)生了結(jié)合。較佳地,該樣品是PCR擴增后的產(chǎn)物,其中PCR擴增引物對應(yīng)于人px19多肽的編碼序列,并可位于該編碼序列的兩側(cè)或中間。引物長度一般為15-50個核苷酸。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的載體。比如,選用市售的載體,然后將編碼本發(fā)明多肽的核苷酸序列可操作地連于表達調(diào)控序列,可以形成蛋白表達載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參與多肽的分泌,那么信號肽(分泌前導(dǎo)序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉(zhuǎn)錄,那么它是可操作地連于編碼序列;如果核糖體結(jié)合位點被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰近,而對于分泌前導(dǎo)序列則意味著在閱讀框中相鄰。
在本發(fā)明中,術(shù)語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞,昆蟲細胞、和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
另一方面,本發(fā)明還包括對人px19 DNA或是其片段編碼的多肽具有特異性的多克隆抗體和單克隆抗體,尤其是單克隆抗體。這里,“特異性”是指抗體能結(jié)合于人px19基因產(chǎn)物或片段。較佳地,指那些能與人px19基因產(chǎn)物或片段結(jié)合但不識別和結(jié)合于其它非相關(guān)抗原分子的抗體。本發(fā)明中抗體包括那些能夠結(jié)合并抑制人px19蛋白的分子,也包括那些并不影響人px19蛋白功能的抗體。本發(fā)明還包括那些能與修飾或未經(jīng)修飾形式的人px19基因產(chǎn)物結(jié)合的抗體。
本發(fā)明不僅包括完整的單克隆或多克隆抗體,而且還包括具有免疫活性的抗體片段,如Fab′或(Fab)2片段;抗體重鏈;抗體輕鏈;遺傳工程改造的單鏈Fv分子(Ladner等人,美國專利No.4,946,778);或嵌合抗體,如具有鼠抗體結(jié)合特異性但仍保留來自人的抗體部分的抗體。
本發(fā)明的抗體可以通過本領(lǐng)域內(nèi)技術(shù)人員已知的各種技術(shù)進行制備。例如,純化的人px19基因產(chǎn)物或者其具有抗原性的片段,可被施用于動物以誘導(dǎo)多克隆抗體的產(chǎn)生。與之相似的,表達人px19或其具有抗原性的片段的細胞可用來免疫動物來生產(chǎn)抗體。本發(fā)明的抗體也可以是單克隆抗體。此類單克隆抗體可以利用雜交瘤技術(shù)來制備(見Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本發(fā)明的抗體包括能阻斷人px19功能的抗體以及不影響人px19功能的抗體。本發(fā)明的各類抗體可以利用人px19基因產(chǎn)物的片段或功能區(qū),通過常規(guī)免疫技術(shù)獲得。這些片段或功能區(qū)可以利用重組方法制備或利用多肽合成儀合成。與人px19基因產(chǎn)物的未修飾形式結(jié)合的抗體可以用原核細胞(例如E.Coli)中生產(chǎn)的基因產(chǎn)物來免疫動物而產(chǎn)生;與翻譯后修飾形式結(jié)合的抗體(如糖基化或磷酸化的蛋白或多肽),可以用真核細胞(例如酵母或昆蟲細胞)中產(chǎn)生的基因產(chǎn)物來免疫動物而獲得。
本發(fā)明的人px19核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列,尤其是開放閱讀框序列來設(shè)計引物,并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關(guān)序列。當(dāng)序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關(guān)序列。
此外,還可用人工合成的方法來合成有關(guān)序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
在本發(fā)明的一個實施例中,人px19的cDNA核苷酸序列是如此獲得的,以人胎腦λgtllcDNA文庫(購自Clontech公司)為模板,用一對寡核苷酸為引物--A5’-CCTGATGCTGCGCGGGTGCTGAG-3′(SEQ ID NO1)為正向引物,寡核苷酸B5′-GGCAGAGGGGCTAAGCCTAGCTG-3’(SEQ ID NO2)為反向引物,進行PCR。對擴增產(chǎn)物進行測序后得到SEQ ID NO.3的全長cDNA序列。
晚期胚胎豐富蛋白(Late Embryogenesis Abundant protein,LEA蛋白)是一類廣泛存在于高等植物種子中的蛋白,在植物發(fā)育過程中種子形成的晚期階段逐漸聚集。它們的mRNA是成熟種子中的主要mRNA(Plant J.1993,3(3)363-369)。種子在成熟過程中發(fā)生自然的干化作用,LEA蛋白的主要作用就是保護種子細胞免受由干化引起的傷害,并且在部分種類耐受寒冷凍的生理作用中具有重要意義(Plant Mol.Biol.1995,29(1)11-23)。
LEA蛋白根據(jù)各成員的保守基序的不同,可分成若干個組(Biosci.Biotech.Biochem.1997,61(8)1286-1291),其共性是含有高比例的親水氨基酸殘基并具有熱穩(wěn)定性(Biosci.Biotech.Biochem.1997,61(8)1286-1291),同時可能形成一種離子載體為那些即將干化失水的組織細胞中的離子凝結(jié)/結(jié)晶作好了準(zhǔn)備(Plant J.1993,3(3)363-369)。
本發(fā)明所分離出的人px19,有助于人們對LEA蛋白功能的研究,尤其是對鳥和人等高等動物中LEA蛋白及其同源蛋白功能的研究。此外,由于本發(fā)明的px19具有源自人的天然氨基酸序列,因此與來源于其他物種的同族蛋白相比,預(yù)計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
在附圖中,
圖1為本發(fā)明的人px19與Gallus gallus(一種原雞)px19(chpx19)的氨基酸序列的同源比較圖。其中,相同的氨基酸在兩個序列之間用“|”標(biāo)出,相似的氨基酸用“.”標(biāo)出。相似的氨基酸是A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring HarborLaboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1人px19的cDNA序列的克隆和測定
1.引物擴增以人胎腦λgtllcDNA文庫(購自Clontech公司)為模板,用一對寡核苷酸為引物--A5’-CCTGATGCTGCGCGGGTGCTGAG-3’(SEQ ID NO1)為正向引物,寡核苷酸B5’-GGCAGAGGGGCTAAGCCTAGCTG-3’(SEQ ID NO2)為反向引物,進行PCR。A/B的PCR條件為93℃ 4分鐘,隨之以93℃ 1分鐘、60℃ 1分鐘和72℃ 1分鐘進行35個循環(huán),最后72℃延伸5分鐘。電泳檢測得到約750bp的目的片段A/B。
2.PCR產(chǎn)物的測序?qū)⑸鲜鯬CR擴增產(chǎn)物A/B與pGEM-T載體(Promega)連接,轉(zhuǎn)化大腸桿菌JM103,用QIAprep Plasmid試劑盒(QIAGEN)提取質(zhì)粒。用SequiThermEXCELTMDNA測序試劑盒(Epicentre Technologies)對質(zhì)粒插入片段進行測序,最后用電腦軟件拼接順序,獲得全長cDNA序列,共755bp,詳細序列見SEQ ID NO.3,其中開放讀框位于42-701位核苷酸。
根據(jù)得到的全長cDNA序列推導(dǎo)出人px19的氨基酸序列,共219個氨基酸殘基,其氨基酸序列詳見SEQ IDNO.4。
實施例2同源比較用本發(fā)明的人px19的全長cDNA序列及其編碼蛋白,在Non-redundantGenBank+EMBL+DDBJ+PDB數(shù)據(jù)庫及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR數(shù)據(jù)庫中,用BLAST程序進行核酸和蛋白同源檢索。結(jié)果發(fā)現(xiàn),它們與不同來源的含LEA基序的基因及其編碼蛋白具有廣泛的同源性,用PCGENE軟件比較發(fā)現(xiàn)它與Gallus gallus(一種原雞的學(xué)名)px19(U31977)在蛋白水平上的同一性達到85.6%,另有4.7%的氨基酸相似(圖1)。更為重要的是,在本發(fā)明的氨基酸序列176KTLVETAKEAKEKAKETA193和196ATEKAKD LASKAATKKQQ213符合LEA的一般保守序列(A/TAEKAK/RETKD)(Gene 1996,175187-191)。因此,本發(fā)明的人px19蛋白可歸入LEA蛋白同系物,并且可以推測它具有LEA蛋白同系物的一般功能。
晚期胚胎豐富蛋白(LEA蛋白)是一類廣泛存在于高等植物種子中的蛋白。它們在植物發(fā)育過程中種子形成的晚期階段逐漸聚集,并因此大量存在。它們的mRNA是成熟種子中的主要mRNA,所以它們的聚集主要受到轉(zhuǎn)錄水平的調(diào)控(Plant J.1993,3(3)363-369)。LEA蛋白的主要作用就是保護種子細胞免受由干化引起的傷害。在硬柑橘近種Poncirus trifoliata中發(fā)現(xiàn)LEA蛋白,其表達可受冷環(huán)境的誘導(dǎo),在抵抗寒冷壓力的生理作用中具有重要意義(Plant Mol.Biol.1995,29(1)11-23)。
LEA蛋白根據(jù)各成員的保守基序的不同,可分成若干個組(Biosci.Biotech.Biochem.1997,61(8)1286-1291),每種類型的LEA蛋白都是從含有2-4個成員的小型多基因家族產(chǎn)生而來的(Plant J.1993,3(3)363-369)。LEA蛋白的共性是含有高比例的親水氨基酸殘基并具有熱穩(wěn)定性。親水區(qū)域含有高度可塑結(jié)構(gòu),可以防止蛋白在熱變性時通常由疏水相互作用導(dǎo)致的聚集,從而使蛋白具有熱穩(wěn)定性(Biosci.Biotech.Biochem.1997,61(8)1286-1291)。在LEA蛋白的一種11體的保守基序研究中發(fā)現(xiàn),11體含有大量的帶電荷氨基酸殘基,它們可能形成一種離子載體,它們的存在即為那些即將干化失水至5%含水量的組織細胞中的離子凝結(jié)/結(jié)晶作好了準(zhǔn)備(Plant J.1993,3(3)363-369)。
1996年,Niu等人用差減雜交法首次在鳥類中發(fā)現(xiàn)了包含有LEA保守基序的動物蛋白——px19(Gene 1996,175187-191)。溴脫氧尿苷可以抑制一些與胚胎組織分化狀態(tài)相關(guān)的蛋白的表達而不影響細胞分裂或其它蛋白的聚集。Niu小組用溴脫氧尿苷刺激鳥胚胎細胞后,檢查表達量減少的轉(zhuǎn)錄物,發(fā)現(xiàn)了px19。px19含有第三組LEA保守基序的重復(fù)序列,和白樺、胡蘿卜中的序列高度保守。Northern blot實驗表明px19在肝臟、中腎、腎導(dǎo)管的表達量高于其它組織,原位雜交實驗進一步顯示px19轉(zhuǎn)錄物集中在肝臟的造血細胞中,而又有實驗表明溴脫氧尿苷可通過阻斷血紅蛋白的合成來抑制成紅細胞的分化,因此這提示px19可能在鳥的早期發(fā)育中和造血功能相關(guān)。然而px19的具體生理功能尚不明了。我們克隆的新基因人px19和鳥px19高度同源,是第一個在人中發(fā)現(xiàn)的含LEA基序的蛋白。LEA蛋白廣泛存在與各類生物中說明起具有重要的生化功能,我們的發(fā)現(xiàn)為進一步研究LEA蛋白提供了新的線索。
本發(fā)明的人px19除了可作為該家族一員用于進一步的功能研究,還可用于與其他蛋白一起產(chǎn)生融合蛋白,比如與免疫球蛋白一起產(chǎn)生融合蛋白。此外,本發(fā)明人px19還可以與該家族的其他成員進行融合或交換片段,以產(chǎn)生新的蛋白。例如將本發(fā)明人px19的N端與鳥的px19的N端進行交換,以產(chǎn)生新的活性更高或具有新特性的蛋白。
針對本發(fā)明人px19的抗體,用于篩選該家族的其他成員,或者用于親和純化相關(guān)蛋白(如該LEA家族的其他成員)。
此外,本發(fā)明人px19核酸(編碼序列或反義序列)可以被引入細胞,以提高人px19的表達水平或者抑制人px19的過度表達。本發(fā)明的人px19蛋白或其活性多肽片段可以施用于病人,以治療或減輕因人px19缺失、無功能或異常而導(dǎo)致的有關(guān)病癥。此外,還可以用基于本發(fā)明的核酸序列或抗體進行有關(guān)的診斷或預(yù)后判斷。
實施例3人px19在大腸桿菌中的表達在該實施例中,以實施例1中PCR擴增產(chǎn)物A/B為模板,將編碼人px19的cDNA序列用對應(yīng)于該DNA序列的5′和3′端的PCR寡核苷酸引物(SEQ ID NO.5和6)進行擴增,獲得人px19 cDNA作為插入片段。
PCR反應(yīng)中使用的5′寡核苷酸引物序列為5′-TCAGGTCGACATGGTGAAGTATTTCCTGG-3′(SEQ ID NO.5),該引物含有SalI限制性內(nèi)切酶的酶切位點,在該酶切位點之后是由起始密碼子開始的人px19編碼序列的19個核苷酸;3′端引物序列為5’-TTGGAAGCTTCTACACAAACTGTTGCTGC-3’(SEQ ID NO.6),該引物含有HindIII限制性內(nèi)切酶的酶切位點、翻譯終止子和人px19的部分編碼序列。
引物上的限制性內(nèi)切酶的酶切位點對應(yīng)于細菌表達載體pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性內(nèi)切酶酶切位點,該質(zhì)粒載體編碼抗生素抗性(Ampr)、一個細菌復(fù)制起點(ori)、一個IPTG-可調(diào)啟動子/操縱子(P/O)、一個核糖體結(jié)合位點(RBS)、一個6-組氨酸標(biāo)記物(6-His)以及限制性內(nèi)切酶克隆位點。
用SalI和HindIII消化pQE-9載體及插入片段,隨后將插入片段連接到pQE-9載體并保持開放讀框在細菌RBS起始。隨后用連接混合物轉(zhuǎn)化購自Qiagen,商品名為M15/rep4的E.coli菌株,M15/rep4含有多拷貝的質(zhì)粒pREP4,其表達lacI阻遏物并攜帶卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培養(yǎng)皿上篩選轉(zhuǎn)化子,抽提質(zhì)粒,測序驗證人px19的cDNA片段已正確插入了載體。
在補加Amp(100μg/ml)和Kan(25μg/ml)的LB液體培養(yǎng)基中過夜培養(yǎng)(O/N)含所需構(gòu)建物的陽性轉(zhuǎn)化子克隆。過夜(O/N)培養(yǎng)物以1∶100-1∶250的稀釋率稀釋,然后接種到大體積培養(yǎng)基中,培養(yǎng)細胞生長至600光密度(OD600)為0.4-0.6時,加入IPTG(“異丙基硫代-β-D-半乳糖苷”)至終濃度為1mM。通過使lacI阻遏物失活,IPTG誘導(dǎo)啟動P/O導(dǎo)致基因表達水平提高。繼續(xù)培養(yǎng)細胞3-4小時,隨后離心(6000×g,20分鐘)。超聲裂解包涵體,收集細胞并將細胞沉淀溶于6M的鹽酸胍中。澄清后,通過在能使含6-His標(biāo)記物蛋白緊密結(jié)合的條件下,用鎳-螯合柱層析從溶液中純化溶解的人px19。用6M鹽酸胍(pH5.0)從柱中洗脫人px19??捎脦追N方法從鹽酸胍中變性沉淀蛋白?;蛘撸褂猛肝霾襟E除去鹽酸胍,或者從鎳-螫合柱中分離出的純化蛋白。純化后的蛋白質(zhì)被結(jié)合到第二個柱中,該柱中具有遞減的線性鹽酸胍梯度。在結(jié)合到該柱時蛋白質(zhì)變性,隨后用鹽酸胍(pH5.0)洗脫。最后,將可溶的蛋白質(zhì)用PBS進行透析,然后將蛋白質(zhì)保存在終濃度為10%(w/v)甘油的貯存液中。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為約25KDa。
此外,用常規(guī)方法對達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發(fā)現(xiàn)與SEQ ID NO.4的序列一致。
實施例4人px19在真核細胞(CHO細胞株)中的表達在該實施例中,以實施例1中PCR擴增產(chǎn)物A/B為模板,將編碼人px19的cDNA序列用對應(yīng)于該DNA序列的5′和3′端的PCR寡核苷酸引物(SEQ ID NO.7和8)進行擴增,獲得人px19 cDNA作為插入片段。
PCR反應(yīng)中使用的5′寡核苷酸引物序列為5′-TCAGAAGCTTATGGTGAAGTATTTCCTGG-3′(SEQ ID NO.7)該引物含有HindIII限制性內(nèi)切酶的酶切位點,在該酶切位點之后是由起始密碼子開始的人px19編碼序列的19個核苷酸;3′端引物序列為5’-TTGGGAATTCCTACACAAACTGTTGCTGC-3’(SEQ ID NO.8)該引物含有EcoRI限制性內(nèi)切酶的酶切位點、一個翻譯終止子和人px19的部分編碼序列。
引物上的限制性內(nèi)切酶的酶切位點對應(yīng)于CHO細胞表達載體pcDNA3上的限制性內(nèi)切酶酶切位點,該質(zhì)粒載體編碼抗生素抗性(Ampr和Neor)、一個噬菌體復(fù)制起點(fl ori)、一個病毒復(fù)制起點(SV40 ori)、一個T7啟動子、一個病毒啟動子(P-CMV)、一個Sp6啟動子、一個SV40啟動子、一個SV40加尾信號和相應(yīng)的polyA順序、一個BGH加尾信號和相應(yīng)的polyA順序。
用HindIII和EcoRI消化pcDNA3載體及插入片段,隨后將插入片段連接到pcDNA3載體。隨后用連接混合物轉(zhuǎn)化E.coli DH5α菌株。在含有Amp的LB培養(yǎng)皿上篩選轉(zhuǎn)化子,在補加Amp(100μg/ml)的LB液體培養(yǎng)基中過夜培養(yǎng)(O/N)含所需構(gòu)建物的克隆。抽提質(zhì)粒,用XmaIII酶切及測序驗證人px19的cDNA片段已正確插入了載體。
質(zhì)粒轉(zhuǎn)染CHO細胞是采用脂轉(zhuǎn)染法,用Lipofectin(GiBco Life)進行的。轉(zhuǎn)染48小時后,經(jīng)2-3周的持續(xù)G418加壓篩選,收集細胞及細胞上清測定表達蛋白酶活力。去G418,連續(xù)傳代培養(yǎng);對混合克隆細胞極限稀釋,選擇具有較高蛋白活性的細胞亞克隆。按常規(guī)方法大量培養(yǎng)上述陽性亞克隆。48小時后,開始收集細胞及上清,用超聲裂解方法破碎細胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液為平衡液及洗脫液,用經(jīng)預(yù)平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mMTris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris·HCl(pH8.0)溶液為洗脫液進行梯度洗脫,收集上述蛋白的活性峰。然后以PBS(pH7.4)為透析液對表達蛋白溶液進行透析。最后凍干保存。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小約為25KDa。
此外,用常規(guī)方法對達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發(fā)現(xiàn)與SEQ ID NO.4的序列一致。
實施例5制備抗體將實施例3和4中獲得的重組蛋白用來免疫動物以產(chǎn)生抗體,具體方法如下。重組分子用層析法進行分離后備用。也可用SDS-PAGE凝膠電泳法進行分離,將電泳條帶從凝膠中切下,并用等體積的完全Freund’s佐劑乳化。用50-100μg/0.2ml乳化過的蛋白,對小鼠進行腹膜內(nèi)注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原,對小鼠以50-100μg/0.2ml的劑量進行腹膜內(nèi)注射以加強免疫。每隔14天進行一次加強免疫,至少進行三次。獲得的抗血清的特異反應(yīng)活性用它在體外沉淀人px19基因翻譯產(chǎn)物的能力加以評估。結(jié)果發(fā)現(xiàn),抗體可特異性地與本發(fā)明蛋白發(fā)生沉淀。
在本發(fā)明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權(quán)利要求書所限定的范圍。
序列表(1)一般信息(i)申請人復(fù)旦大學(xué)(ii)發(fā)明名稱晚期胚胎豐富蛋白的同源蛋白及其編碼序列(iii)序列數(shù)目8(2)SEQ ID NO.1的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.1CCTGATGCTG CGCGGGTGCT GAG 23(2)SEQ ID NO.2的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO2GGCAGAGGGG CTAAGCCTAG CTG 23(2)SEQ ID NO.3的信息(i)序列特征
(A)長度755bp(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(iii)序列描述SEQ ID NO.3CCTGATGCTG CGCGGGTGCT GAGCCCGCTT CGGCCGGGAC GATGGTGAAG TATTTCCTGG 60GCCAGAGCGT GCTCCGGAGT TCCTGGGACC AAGTGTTCGC CGCCTTCTGG CAGCGGTACC 120CGAATCCCTA TAGCAAACAT GTCTTGACGG AAGACATAGT ACACCGGGAG GTGACCCCTG 180ACCAGAAACT GCTGTCCCGG CGACTCCTGA CCAAGACCAA CAGGATGCCA CGCTGGGCCG 240AGCGACTATT TCCTGCCAAT GTTGCTCACT CGGTGTACGT CCTGGAGGAC TCTATTGTGG 300ACCCACAGAA TCAGACCATG ACTACCTTCA CCTGGAACAT CAACCACGCC CGGCTGATGG 360TGGTGGAGGA ACGATGTGTT TACTGTGTGA ACTCTGACAA CAGTGGCTGG ACTGAAATCC 420GCCGGGAAGC CTGGGTCTCC TCTAGCTTAT TTGGTGTCTC CAGAGCTGTC CAGGAATTTG 480GTCTTGCCCG GTTCAAAAGC AACGTGACCA AGACTATGAA GGGTTTTGAA TATATCTTGG 540CTAAGCTGCA AGGCGAGGCC CCTTCCAAAA CACTTGTTGA GACAGCCAAG GAAGCCAAGG 600AGAAGGCAAA GGAGACGGCA CTGGCAGCTA CAGAGAAGGC CAAGGACCTC GCCAGCAAGG 660CGGCCACCAA GAAGCAGCAG CAGCAGCAAC AGTTTGTGTA GCCAGTCTAC CACCACCACA 720GCACCCCGAG ACAGCTAGGC TTAGCCCCTC TGCCC755(2)SEQ ID NO.4的信息(i)序列特征(A)長度219個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型多肽(xi)序列描述SEQ ID NO.4Met Val Lys Tyr Phe Leu Gly Gln Ser Val Leu Arg Ser Ser Trp 15Asp Gln Val Phe Ala Ala Phe Trp Gln Arg Tyr Pro Asn Pro Tyr 30Ser Lys His Val Leu Thr Glu Asp Ile Val His Arg Glu Val Thr 45Pro Asp Gln Lys Leu Leu Ser Arg Arg Leu Leu Thr Lys Thr Asn 60Arg Met Pro Arg Trp Ala Glu Arg Leu Phe Pro Ala Asn Val Ala 75His Ser Val Tyr Val Leu Glu Asp Ser Ile Val Asp Pro Gln Asn 90Gln Thr Met Thr Thr Phe Thr Trp Asn Ile Asn His Ala Arg Leu 105Met Val Val Glu Glu Arg Cys Val Tyr Cys Val Asn Ser Asp Asn 120Ser Gly Trp Thr Glu Ile Arg Arg Glu Ala Trp Val Ser Ser Ser 135Leu Phe Gly Val Ser Arg Ala Val Gln Glu Phe Gly Leu Ala Arg 150Phe Lys Ser Asn Val Thr Lys Thr Met Lys Gly Phe Glu Tyr Ile 165Leu Ala Lys Leu Gln Gly Glu Ala Pro Ser Lys Thr Leu Val Glu 180Thr Ala Lys Glu Ala Lys Glu Lys Ala Lys Glu Thr Ala Leu Ala 195Ala Thr Glu Lys Ala Lys Asp Leu Ala Ser Lys Ala Ala Thr Lys 210Lys Gln Gln Gln Gln Gln Gln Phe Val 219(2)SEQ ID NO.5的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.5TCAGGTCGAC ATGGTGAAGT ATTTCCTGG 29(2)SEQ ID NO.6的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.6TTGGAAGCTT CTACACAAAC TGTTGCTGC 29(2)SEQ ID NO.7的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.7TCAGAAGCTT ATGGTGAAGT ATTTCCTGG 29(2)SEQ ID NO.8的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.8TTGGGAATTC CTACACAAAC TGTTGCTGC 29
權(quán)利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人px19蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列雜交。
2.如權(quán)利要求1所述的DNA分子,其特征在于,所述的序列編碼一多肽,該多肽具有SEQ ID NO.4所示的序列。
3.如權(quán)利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.3中從核苷酸42-701位的核苷酸序列。
4.一種分離的人px19蛋白多肽,其特征在于,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權(quán)利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.4序列的多肽。
6.一種載體,其特征在于,它含有權(quán)利要求1所述的DNA。
7.一種用權(quán)利要求6所述載體轉(zhuǎn)化的宿主細胞。
8.一種產(chǎn)生具有人px19蛋白活性的多肽的方法,其特征在于,該方法包括(a)將編碼具有人px19蛋白活性的多肽的核苷酸序列可操作地連于表達調(diào)控序列,形成人px19蛋白表達載體,所述的核苷酸序列與SEQ ID NO.3中從核苷酸42-701位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉(zhuǎn)入宿主細胞,形成人px19蛋白的重組細胞;(c)在適合表達人px19蛋白多肽的條件下,培養(yǎng)步驟(b)中的重組細胞;(d)分離出具有人px19蛋白活性的多肽。
9.一種能與權(quán)利要求4所述的人px19蛋白多肽特異性結(jié)合的抗體。
10.一種探針分子,其特征在于,它含有權(quán)利要求1所述的DNA分子中8-100個連續(xù)核苷酸。
全文摘要
本發(fā)明提供了一種新的、編碼人px19的cDNA序列,該cDNA編碼的蛋白是晚期胚胎豐富蛋白(LateEmbryogenesis Abundant protein,簡稱為“LEA蛋白”)同系物。本發(fā)明還涉及由該核苷酸序列編碼的多肽,這些多核苷酸和多肽的應(yīng)用,以及所述多核苷酸和所述多肽的生產(chǎn)方法。
文檔編號C12P21/02GK1277259SQ99108628
公開日2000年12月20日 申請日期1999年6月14日 優(yōu)先權(quán)日1999年6月14日
發(fā)明者余龍, 張宏來, 傅強, 趙勇, 趙壽元 申請人:復(fù)旦大學(xué)