專利名稱:具有促進(jìn)癌細(xì)胞生長功能的新的人蛋白及其編碼序列的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物技術(shù)領(lǐng)域,具體地說,本發(fā)明涉及新的編碼具有促進(jìn)癌細(xì)胞生長功能的人蛋白的多核苷酸,以及此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
人基因組學(xué)研究目前是國際上的熱點(diǎn),除人染色體DNA大規(guī)模測序,表達(dá)序列測序(EST)的方法外,還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預(yù)防腫瘤,目前人們已越來越關(guān)注腫瘤的基因治療。因此,本領(lǐng)域迫切需要開發(fā)研究與癌細(xì)胞生長相關(guān)的人蛋白及其激動(dòng)劑/抑制劑。
本發(fā)明的目的是提供一類新的具有促進(jìn)癌細(xì)胞生長功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產(chǎn)這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面,提供新穎的分離出的具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。
在本發(fā)明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼上述的具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補(bǔ)的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。更佳地,該多核苷酸的序列選自下組SEQ ID NO3、SEQ ID NO6、SEQID NO9、SEQ ID NO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30的編碼區(qū)序列或全長序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞。
在本發(fā)明的第四方面,提供了制備具有促進(jìn)癌細(xì)胞生長功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達(dá)具有促進(jìn)癌細(xì)胞生長功能的蛋白的條件下,培養(yǎng)上述被轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞;(b)從培養(yǎng)物中分離出具有促進(jìn)癌細(xì)胞生長功能的蛋白活性的多肽。
在本發(fā)明的第五方面,提供了與上述的具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽特異性結(jié)合的抗體。還提供了可用于檢測的核酸分子,它含有上述的多核苷酸中連續(xù)10個(gè)核苷酸至全長核苷酸,較佳地它含有連續(xù)的約10-800個(gè)核苷酸。
在本發(fā)明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發(fā)明的具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽以及藥學(xué)上可接受的載體。這些藥物組合物可用于促進(jìn)細(xì)胞的生長。本發(fā)明還提供了一種藥物組合物,它含有安全有效量的針對本發(fā)明的具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽的拮抗劑(如抗體)以及藥學(xué)上可接受的載體。該藥物組合物可治療癌癥以及細(xì)胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
本發(fā)明采用大規(guī)模cDNA克隆轉(zhuǎn)染癌細(xì)胞,在獲得具有促進(jìn)癌細(xì)胞生長作用的基礎(chǔ)上,經(jīng)測序證明為新的基因,進(jìn)一步得到全長cDNA克隆。DNA轉(zhuǎn)染試驗(yàn)證明,本發(fā)明的具有促進(jìn)癌細(xì)胞生長功能的蛋白對癌細(xì)胞(肝癌細(xì)胞)具有促進(jìn)克隆形成的作用,其促進(jìn)作用在50%或50%以上。
如本文所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細(xì)胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的具有促進(jìn)癌細(xì)胞生長功能的蛋白或多肽”是指具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽基本上不含天然與其相關(guān)的其它蛋白、脂類、糖類或其它物質(zhì)。本領(lǐng)域的技術(shù)人員能用標(biāo)準(zhǔn)的蛋白質(zhì)純化技術(shù)純化具有促進(jìn)癌細(xì)胞生長功能的蛋白。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽的純度能用氨基酸序列分析。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學(xué)合成的產(chǎn)物,或使用重組技術(shù)從原核或真核宿主(例如,細(xì)菌、酵母、高等植物、昆蟲和哺乳動(dòng)物細(xì)胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有促進(jìn)癌細(xì)胞生長功能的人蛋白的片段、衍生物和類似物。如本文所用,術(shù)語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有促進(jìn)癌細(xì)胞生長功能的人蛋白相同的生物學(xué)功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(i)有一個(gè)或多個(gè)保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ii)在一個(gè)或多個(gè)氨基酸殘基中具有取代基團(tuán)的多肽,或(iii)成熟多肽與另一個(gè)化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導(dǎo)序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據(jù)本文的教導(dǎo),這些片段、衍生物和類似物屬于本領(lǐng)域熟練技術(shù)人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以PP6414蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO3所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO2的蛋白質(zhì),但與SEQ ID NO3所示的編碼區(qū)序列有差別的核酸序列。以PP6968蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO6所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO5的蛋白質(zhì),但與SEQ ID NO6所示的編碼區(qū)序列有差別的核酸序列。對于其他具有促進(jìn)癌細(xì)胞生長功能的蛋白,編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術(shù)語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領(lǐng)域所知的,等位變異體是一個(gè)多核苷酸的替換形式,它可能是一個(gè)或多個(gè)核苷酸的取代、缺失或插入,但不會(huì)從實(shí)質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個(gè)序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發(fā)明特別涉及在嚴(yán)格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴(yán)格條件”是指(1)在較低離子強(qiáng)度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時(shí)加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時(shí)才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ IDNO2所示的成熟多肽(以PP6414蛋白為例)有相同的生物學(xué)功能和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長度至少含15個(gè)核苷酸,較好是至少30個(gè)核苷酸,更好是至少50個(gè)核苷酸,最好是至少100個(gè)核苷酸以上。核酸片段可用于核酸的擴(kuò)增技術(shù)(如PCR)以確定和/或分離編碼具有促進(jìn)癌細(xì)胞生長功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的DNA序列能用幾種方法獲得。例如,用本領(lǐng)域熟知的雜交技術(shù)分離DNA。這些技術(shù)包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列,和2)表達(dá)文庫的抗體篩選以檢出具有共同結(jié)構(gòu)特征的克隆的DNA片段。
編碼具有促進(jìn)癌細(xì)胞生長功能的蛋白的特異DNA片段序列產(chǎn)生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學(xué)合成DNA序列以獲得所需多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。當(dāng)需要的多肽產(chǎn)物的整個(gè)氨基酸序列已知時(shí),DNA序列的直接化學(xué)合成是經(jīng)常選用的方法。如果所需的氨基酸的整個(gè)序列不清楚時(shí),DNA序列的直接化學(xué)合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標(biāo)準(zhǔn)方法是從高表達(dá)該基因的供體細(xì)胞分離mRNA并進(jìn)行逆轉(zhuǎn)錄,形成質(zhì)粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術(shù),試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構(gòu)建cDNA文庫也是通常的方法(Sambrook,et al.,MolecularClóning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應(yīng)的cDNA文庫,如Clontech公司的不同cDNA文庫。當(dāng)結(jié)合使用聚合酶反應(yīng)技術(shù)時(shí),即使極少的表達(dá)產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標(biāo)志基因的功能出現(xiàn)或喪失;(3)測定具有促進(jìn)癌細(xì)胞生長功能的蛋白的轉(zhuǎn)錄本的水平;(4)通過免疫學(xué)技術(shù)或測定生物學(xué)活性,來檢測基因表達(dá)的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應(yīng)用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少15個(gè)核苷酸,較好是至少30個(gè)核苷酸,更好是至少50個(gè)核苷酸,最好是至少100個(gè)核苷酸。此外,探針的長度通常在2kb之內(nèi),較佳地為1kb之內(nèi)。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎(chǔ)上化學(xué)合成的DNA序列。本發(fā)明的基因本身或者片段當(dāng)然可以用作探針。DNA探針的標(biāo)記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測具有促進(jìn)癌細(xì)胞生長功能的蛋白基因表達(dá)的蛋白產(chǎn)物可用免疫學(xué)技術(shù)如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應(yīng)用PCR技術(shù)擴(kuò)增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時(shí),可優(yōu)選使用RACE法(RACE-cDNA末端快速擴(kuò)增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的序列信息適當(dāng)?shù)剡x擇,并可用常規(guī)方法合成。可用常規(guī)方法如通過凝膠電泳分離和純化擴(kuò)增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的核苷酸序列的測定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)。這類核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復(fù)進(jìn)行。有時(shí)需要測定多個(gè)克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或具有促進(jìn)癌細(xì)胞生長功能的蛋白編碼序列經(jīng)基因工程產(chǎn)生的宿主細(xì)胞,以及經(jīng)重組技術(shù)產(chǎn)生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(shù)(Science,1984;2241431),可利用本發(fā)明的多聚核苷酸序列可用來表達(dá)或生產(chǎn)重組的具有促進(jìn)癌細(xì)胞生長功能的蛋白多肽。一般來說有以下步驟(1).用本發(fā)明的編碼具有促進(jìn)癌細(xì)胞生長功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達(dá)載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)合適的宿主細(xì)胞;(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細(xì)胞;(3).從培養(yǎng)基或細(xì)胞中分離、純化蛋白質(zhì)。
本發(fā)明中,具有促進(jìn)癌細(xì)胞生長功能的人蛋白多核苷酸序列可插入到重組表達(dá)載體中。術(shù)語“重組表達(dá)載體”指本領(lǐng)域熟知的細(xì)菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細(xì)胞病毒、哺乳動(dòng)物細(xì)胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細(xì)菌中表達(dá)的基于T7的表達(dá)載體(Rosenberg,et al.Gene,1987,56125);在哺乳動(dòng)物細(xì)胞中表達(dá)的pMSXND表達(dá)載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細(xì)胞中表達(dá)的來源于桿狀病毒的載體??傊灰茉谒拗黧w內(nèi)復(fù)制和穩(wěn)定,任何質(zhì)粒和載體都可以用。表達(dá)載體的一個(gè)重要特征是通常含有復(fù)制起點(diǎn)、啟動(dòng)子、標(biāo)記基因和翻譯控制元件。
本領(lǐng)域的技術(shù)人員熟知的方法能用于構(gòu)建含具有促進(jìn)癌細(xì)胞生長功能的人蛋白編碼DNA序列和合適的轉(zhuǎn)錄/翻譯控制信號的表達(dá)載體。這些方法包括體外重組DNA技術(shù)、DNA合成技術(shù)、體內(nèi)重組技術(shù)等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達(dá)載體中的適當(dāng)啟動(dòng)子上,以指導(dǎo)mRNA合成。這些啟動(dòng)子的代表性例子有大腸桿菌的lac或trp啟動(dòng)子;λ噬菌體PL啟動(dòng)子;真核啟動(dòng)子包括CMV立即早期啟動(dòng)子、HSV胸苷激酶啟動(dòng)子、早期和晚期SV40啟動(dòng)子、反轉(zhuǎn)錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細(xì)胞或其病毒中表達(dá)的啟動(dòng)子。表達(dá)載體還包括翻譯起始用的核糖體結(jié)合位點(diǎn)和轉(zhuǎn)錄終止子。
此外,表達(dá)載體優(yōu)選地包含一個(gè)或多個(gè)選擇性標(biāo)記基因,以提供用于選擇轉(zhuǎn)化的宿主細(xì)胞的表型性狀,如真核細(xì)胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當(dāng)DNA序列以及適當(dāng)啟動(dòng)子或者控制序列的載體,可以用于轉(zhuǎn)化適當(dāng)?shù)乃拗骷?xì)胞,以使其能夠表達(dá)蛋白質(zhì)。
宿主細(xì)胞可以是原核細(xì)胞,如細(xì)菌細(xì)胞;或是低等真核細(xì)胞,如酵母細(xì)胞;或是高等真核細(xì)胞,如哺乳動(dòng)物細(xì)胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細(xì)菌細(xì)胞;真菌細(xì)胞如酵母;植物細(xì)胞;果蠅S2或Sf9的昆蟲細(xì)胞;CHO、COS或Bowes黑素瘤細(xì)胞的動(dòng)物細(xì)胞等。
本發(fā)明的多核苷酸在高等真核細(xì)胞中表達(dá)時(shí),如果在載體中插入增強(qiáng)子序列時(shí)將會(huì)使轉(zhuǎn)錄得到增強(qiáng)。增強(qiáng)子是DNA的順式作用因子,通常大約有10到300個(gè)堿基對,作用于啟動(dòng)子以增強(qiáng)基因的轉(zhuǎn)錄。可舉的例子包括在復(fù)制起始點(diǎn)晚期一側(cè)的100到270個(gè)堿基對的SV40增強(qiáng)子、在復(fù)制起始點(diǎn)晚期一側(cè)的多瘤增強(qiáng)子以及腺病毒增強(qiáng)子等。
本領(lǐng)域一般技術(shù)人員都清楚如何選擇適當(dāng)?shù)妮d體、啟動(dòng)子、增強(qiáng)子和宿主細(xì)胞。
用重組DNA轉(zhuǎn)化宿主細(xì)胞可用本領(lǐng)域技術(shù)人員熟知的常規(guī)技術(shù)進(jìn)行。當(dāng)宿主為原核生物如大腸桿菌時(shí),能吸收DNA的感受態(tài)細(xì)胞可在指數(shù)生長期后收獲,用CaCl2法處理,所用的步驟在本領(lǐng)域眾所周知。可供選擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進(jìn)行。當(dāng)宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,常規(guī)機(jī)械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng),表達(dá)本發(fā)明的基因所編碼的多肽。根據(jù)所用的宿主細(xì)胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細(xì)胞生長的條件下進(jìn)行培養(yǎng)。當(dāng)宿主細(xì)胞生長到適當(dāng)?shù)募?xì)胞密度后,用合適的方法(如溫度轉(zhuǎn)換或化學(xué)誘導(dǎo))誘導(dǎo)選擇的啟動(dòng)子,將細(xì)胞再培養(yǎng)一段時(shí)間。
在上面的方法中的重組多肽可包被于細(xì)胞內(nèi)、細(xì)胞外或在細(xì)胞膜上表達(dá)或分泌到細(xì)胞外。如果需要,可利用其物理的、化學(xué)的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領(lǐng)域技術(shù)人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復(fù)性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術(shù)及這些方法的結(jié)合。
重組的具有促進(jìn)癌細(xì)胞生長功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有促進(jìn)癌細(xì)胞生長功能的蛋白功能低下或喪失所致的疾病,和用于篩選促進(jìn)或?qū)咕哂写龠M(jìn)癌細(xì)胞生長功能的蛋白功能的抗體、多肽或其它配體。例如,該抗體可用于治療癌癥或細(xì)胞異常增殖。用表達(dá)的重組具有促進(jìn)癌細(xì)胞生長功能的人蛋白篩選多肽庫可用于尋找有治療價(jià)值的能抑制或刺激具有促進(jìn)癌細(xì)胞生長功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動(dòng)劑)或阻遏(拮抗劑)具有促進(jìn)癌細(xì)胞生長功能的人蛋白的藥劑的方法。激動(dòng)劑提高具有促進(jìn)癌細(xì)胞生長功能的人蛋白刺激細(xì)胞增殖等生物功能,而拮抗劑阻止和治療與細(xì)胞過度增殖有關(guān)的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動(dòng)物細(xì)胞或表達(dá)具有促進(jìn)癌細(xì)胞生長功能的人蛋白的膜制劑與標(biāo)記的具有促進(jìn)癌細(xì)胞生長功能的人蛋白一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
具有促進(jìn)癌細(xì)胞生長功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。具有促進(jìn)癌細(xì)胞生長功能的人蛋白的拮抗劑可以與具有促進(jìn)癌細(xì)胞生長功能的人蛋白結(jié)合并消除其功能,或是抑制具有促進(jìn)癌細(xì)胞生長功能的人蛋白的產(chǎn)生,或是與多肽的活性位點(diǎn)結(jié)合使多肽不能發(fā)揮生物學(xué)功能。具有促進(jìn)癌細(xì)胞生長功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時(shí),可以將具有促進(jìn)癌細(xì)胞生長功能的蛋白加入生物分析測定中,通過測定化合物影響具有促進(jìn)癌細(xì)胞生長功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療,例如,各種惡性腫瘤、和細(xì)胞異常增殖等。
本發(fā)明的多肽,及其片段、衍生物、類似物或它們的細(xì)胞可以用來作為抗原以生產(chǎn)抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動(dòng)物的方法得到。制備單克隆抗體的技術(shù)包括雜交瘤技術(shù),三瘤技術(shù),人B-細(xì)胞雜交瘤技術(shù),EBV-雜交瘤技術(shù)等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機(jī)構(gòu)所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機(jī)構(gòu)許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。具有促進(jìn)癌細(xì)胞生長功能的蛋白或其特異性抗體,可按有效地治療和/或預(yù)防具體的適應(yīng)癥的量來給藥。施用于患者的具有促進(jìn)癌細(xì)胞生長功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有促進(jìn)癌細(xì)胞生長功能的人蛋白的多聚核苷酸也可用于多種治療目的?;蛑委熂夹g(shù)可用于治療由于具有促進(jìn)癌細(xì)胞生長功能的蛋白的無表達(dá)或異常/無活性的具有促進(jìn)癌細(xì)胞生長功能的蛋白的表達(dá)所致的細(xì)胞發(fā)育或代謝異常。重組的基因治療載體(如病毒載體)可設(shè)計(jì)成表達(dá)變異的具有促進(jìn)癌細(xì)胞生長功能的蛋白,以抑制內(nèi)源性的具有促進(jìn)癌細(xì)胞生長功能的蛋白活性。例如,一種變異的具有促進(jìn)癌細(xì)胞生長功能的蛋白可以是縮短的、缺失了信號傳導(dǎo)功能域的具有促進(jìn)癌細(xì)胞生長功能的蛋白,雖可與下游的底物結(jié)合,但缺乏信號傳導(dǎo)活性。因此重組的基因治療載體可用于治療具有促進(jìn)癌細(xì)胞生長功能的蛋白表達(dá)或活性異常所致的疾病。來源于病毒的表達(dá)載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關(guān)病毒、單純皰疹病毒、細(xì)小病毒等可用于將具有促進(jìn)癌細(xì)胞生長功能的蛋白基因轉(zhuǎn)移至細(xì)胞內(nèi)。構(gòu)建攜帶具有促進(jìn)癌細(xì)胞生長功能的蛋白基因的重組病毒載體的方法可見于已有文獻(xiàn)(Sambrook,et al.)。另外重組具有促進(jìn)癌細(xì)胞生長功能的人蛋白基因可包裝到脂質(zhì)體中轉(zhuǎn)移至細(xì)胞內(nèi)。
抑制具有促進(jìn)癌細(xì)胞生長功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機(jī)制是核酶分子與互補(bǔ)的靶RNA特異性雜交后進(jìn)行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術(shù)獲得,如固相磷酸酰胺化學(xué)合成法合成寡核苷酸的技術(shù)已廣泛應(yīng)用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動(dòng)子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進(jìn)行修飾,如增加兩側(cè)的序列長度,核糖核苷之間的連接應(yīng)用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導(dǎo)入組織或細(xì)胞內(nèi)的方法包括將多聚核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多聚核苷酸導(dǎo)入細(xì)胞中,再將細(xì)胞移植到體內(nèi)等。由于本發(fā)明蛋白具有促進(jìn)癌細(xì)胞生長的功能,因此本發(fā)明蛋白編碼序列的反義序列,可被引入細(xì)胞以抑制細(xì)胞的異常增殖(如癌變)。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學(xué)或酶進(jìn)行特異性切割,并進(jìn)行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對具有促進(jìn)癌細(xì)胞生長功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達(dá)文庫產(chǎn)生的片段。
抗具有促進(jìn)癌細(xì)胞生長功能的人蛋白的抗體可用于免疫組織化學(xué)技術(shù)中,檢測活檢標(biāo)本中的具有促進(jìn)癌細(xì)胞生長功能的人蛋白。
與具有促進(jìn)癌細(xì)胞生長功能的人蛋白結(jié)合的單克隆抗體也可用放射性同位素標(biāo)記,注入體內(nèi)可跟蹤其位置和分布。這種放射性標(biāo)記的抗體可作為一種非創(chuàng)傷性診斷方法用于腫瘤細(xì)胞的定位和判斷是否有轉(zhuǎn)移。
本發(fā)明中的抗體可用于治療或預(yù)防與具有促進(jìn)癌細(xì)胞生長功能的人蛋白相關(guān)的疾病。給予適當(dāng)劑量的抗體可以刺激或阻斷具有促進(jìn)癌細(xì)胞生長功能的人蛋白的產(chǎn)生或活性,從而抑制癌細(xì)胞的生長和/或細(xì)胞的異常增殖。
抗體也可用于設(shè)計(jì)針對體內(nèi)某一特殊部位的免疫毒素。如具有促進(jìn)癌細(xì)胞生長功能的人蛋白高親和性的單克隆抗體可與細(xì)菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價(jià)結(jié)合。一種通常的方法是用巰基交聯(lián)劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結(jié)合于抗體上,這種雜交抗體可用于殺滅具有促進(jìn)癌細(xì)胞生長功能的人蛋白陽性的細(xì)胞。
多克隆抗體的生產(chǎn)可用具有促進(jìn)癌細(xì)胞生長功能的人蛋白或多肽免疫動(dòng)物,如家兔,小鼠,大鼠等。多種佐劑可用于增強(qiáng)免疫反應(yīng),包括但不限于弗氏佐劑等。
具有促進(jìn)癌細(xì)胞生長功能的人蛋白單克隆抗體可用雜交瘤技術(shù)生產(chǎn)(Kohler andMilstein.Nature,1975,256495-497)。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術(shù)生產(chǎn)(Morrison et al,PNAS,1985,816851)。而已有的生產(chǎn)單鏈抗體的技術(shù)(U.S.Pat No.4946778)也可用于生產(chǎn)抗具有促進(jìn)癌細(xì)胞生長功能的人蛋白的單鏈抗體。
能與具有促進(jìn)癌細(xì)胞生長功能的人蛋白結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機(jī)多肽庫而獲得。篩選時(shí),必須對具有促進(jìn)癌細(xì)胞生長功能的人蛋白分子進(jìn)行標(biāo)記。
本發(fā)明還涉及定量和定位檢測具有促進(jìn)癌細(xì)胞生長功能的人蛋白水平的診斷試驗(yàn)方法。這些試驗(yàn)是本領(lǐng)域所熟知的,且包括FISH測定和放射免疫測定。試驗(yàn)中所檢測的具有促進(jìn)癌細(xì)胞生長功能的人蛋白水平,可以用作解釋具有促進(jìn)癌細(xì)胞生長功能的人蛋白在各種疾病中的重要性和用于診斷具有促進(jìn)癌細(xì)胞生長功能的蛋白起作用的疾病。
具有促進(jìn)癌細(xì)胞生長功能的蛋白的多聚核苷酸可用于具有促進(jìn)癌細(xì)胞生長功能的蛋白相關(guān)疾病的診斷和治療。在診斷方面,具有促進(jìn)癌細(xì)胞生長功能的蛋白的多聚核苷酸可用于檢測具有促進(jìn)癌細(xì)胞生長功能的蛋白的表達(dá)與否或在疾病狀態(tài)下具有促進(jìn)癌細(xì)胞生長功能的蛋白的異常表達(dá)。如具有促進(jìn)癌細(xì)胞生長功能的蛋白DNA序列可用于對活檢標(biāo)本的雜交以判斷具有促進(jìn)癌細(xì)胞生長功能的蛋白的表達(dá)異常。雜交技術(shù)包括Southern印跡法,Northern印跡法、原位雜交等。這些技術(shù)方法都是公開的成熟技術(shù),相關(guān)的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達(dá)分析和基因診斷。用具有促進(jìn)癌細(xì)胞生長功能的蛋白特異的引物進(jìn)行RNA-聚合酶鏈反應(yīng)(RT-PCR)體外擴(kuò)增也可檢測具有促進(jìn)癌細(xì)胞生長功能的蛋白的轉(zhuǎn)錄產(chǎn)物。
檢測具有促進(jìn)癌細(xì)胞生長功能的蛋白基因的突變也可用于診斷具有促進(jìn)癌細(xì)胞生長功能的蛋白相關(guān)的疾病。具有促進(jìn)癌細(xì)胞生長功能的蛋白突變的形式包括與正常野生型具有促進(jìn)癌細(xì)胞生長功能的蛋白DNA序列相比的點(diǎn)突變、易位、缺失、重組和其它任何異常等。可用已有的技術(shù)如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達(dá),因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價(jià)值的。該序列會(huì)特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點(diǎn)?,F(xiàn)在,只有很少的基于實(shí)際序列數(shù)據(jù)(重復(fù)多態(tài)性)的染色體標(biāo)記物可用于標(biāo)記染色體位置。根據(jù)本發(fā)明,為了將這些序列與疾病相關(guān)基因相關(guān)聯(lián),其重要的第一步就是將這些DNA序列定位于染色體上。
簡而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細(xì)胞雜合細(xì)胞。只有那些含有相應(yīng)于引物的人基因的雜合細(xì)胞會(huì)產(chǎn)生擴(kuò)增的片段。
體細(xì)胞雜合細(xì)胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實(shí)現(xiàn)亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標(biāo)記的流式分選的染色體預(yù)篩選和雜交預(yù)選,從而構(gòu)建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進(jìn)行熒光原位雜交(FISH),可以在一個(gè)步驟中精確地進(jìn)行染色體定位。此技術(shù)的綜述,參見Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準(zhǔn)確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關(guān)聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機(jī)獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關(guān)系。
接著,需要測定患病和未患病個(gè)體間的cDNA或基因組序列差異。如果在一些或所有的患病個(gè)體中觀察到某突變,而該突變在任何正常個(gè)體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個(gè)體,通常涉及首先尋找染色體中結(jié)構(gòu)的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。根據(jù)目前的物理作圖和基因定位技術(shù)的分辨能力,被精確定位至與疾病有關(guān)的染色體區(qū)域的cDNA,可以是50至500個(gè)潛在致病基因間之一種(假定1兆堿基作圖分辨能力和每20kb對應(yīng)于一個(gè)基因)。
本發(fā)明的具有促進(jìn)癌細(xì)胞生長功能的蛋白核苷酸全長序列或其片段通常可以用PCR擴(kuò)增法、重組法或人工合成的方法獲得。對于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列,尤其是開放閱讀框序列來設(shè)計(jì)引物,并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴(kuò)增而得有關(guān)序列。當(dāng)序列較長時(shí),常常需要進(jìn)行兩次或多次PCR擴(kuò)增,然后再將各次擴(kuò)增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。
此外,還可用人工合成的方法來合成有關(guān)序列,尤其是片段長度較短時(shí)。通常,通過先合成多個(gè)小片段,然后再進(jìn)行連接可獲得序列很長的片段。
目前,已經(jīng)可以完全通過化學(xué)合成來編碼本發(fā)明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領(lǐng)域中的各種DNA分子(如載體)和細(xì)胞中。此外,還可通過化學(xué)合成將突變引入本發(fā)明蛋白序列中。
此外,由于本發(fā)明的具有促進(jìn)癌細(xì)胞生長功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預(yù)計(jì)在施用于人時(shí)將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1cDNA基因的獲得及對癌細(xì)胞克隆形成的促進(jìn)作用SP2114b來自于從GIBCO BRL公司購得的肝cDNA文庫(目錄號10422-012),PP6414、PP6968、PP7122、PP7157、PP7517、PP7683、PP7879、PP8376和PP10029是通過用常規(guī)方法構(gòu)建人胎盤cDNA文庫獲得的。取3、6、10月齡的胎盤組織,用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫構(gòu)建試劑盒(Stratagene公司)構(gòu)建上述mRNA的cDNA文庫。其中反轉(zhuǎn)錄酶改用MMLV-RT-Superscript II(GIBCO BRL),反轉(zhuǎn)錄反應(yīng)在42℃進(jìn)行。轉(zhuǎn)化XL 10-Gold感受細(xì)胞,獲得了1×106cfu/μg滴度的cDNA文庫。第一輪隨機(jī)挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑癌細(xì)胞生長功能的cDNA克隆為探針,雜交篩選cDNA文庫,挑取弱陽性及陰性克隆。用Qiagen 96孔板質(zhì)粒抽提試劑盒,按廠家說明書進(jìn)行質(zhì)粒DNA的提取。質(zhì)粒DNA和空載體同時(shí)轉(zhuǎn)染肝癌細(xì)胞系3T3。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待轉(zhuǎn)染。每份DNA樣品中加0.74μl脂質(zhì)體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長于96孔板的7721細(xì)胞中,37℃放置2小時(shí),每孔再加50μl無血清培液,37℃24小時(shí)。每孔換100μl全培液,37℃24小時(shí),換含G418的全培液100μl,37℃24-48小時(shí),邊觀察,邊換G418濃度不等的培液。約2-3次后,直到鏡檢細(xì)胞有克隆形成,計(jì)數(shù)。發(fā)現(xiàn)以上2個(gè)克隆有促進(jìn)細(xì)胞克隆形成作用,結(jié)果如下表所示。
cDNA克隆轉(zhuǎn)染細(xì)胞(3T3)克隆形成情況
對cDNA克隆采用雙脫氧終止法,在ABI377 DNA自動(dòng)測序儀上測定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進(jìn)行另一端測序,仍未獲得全長cDNA序列,設(shè)計(jì)引物,再次進(jìn)行測序,直到獲得全長序列(SEQ ID NO1、4、7、10、13、16、19、22、25、28)。
實(shí)施例2從胎盤cDNA中PCR獲得全長基因取3、6、10月齡的胎盤組織,用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反轉(zhuǎn)錄酶在42℃進(jìn)行反轉(zhuǎn)錄反應(yīng),獲得胎盤cDNA。利用各個(gè)基因的轉(zhuǎn)異引物(如下表所示),按97℃3分鐘、1個(gè)循環(huán);94℃30秒→60℃30秒→72℃1分鐘,共35個(gè)循環(huán);72℃10分鐘,1個(gè)循環(huán),進(jìn)行PCR擴(kuò)增,獲得含有完整開放閱讀框序列的各蛋白基因的擴(kuò)增產(chǎn)物。擴(kuò)增產(chǎn)物經(jīng)測序驗(yàn)證,與實(shí)施例1測得的序列相符。(注對于SP2114b,可使用從GIBCO BRL公司購得的肝cDNA文庫(目錄號10422-012)作為模板)。隨后用常規(guī)技術(shù)將擴(kuò)增產(chǎn)物轉(zhuǎn)入宿主細(xì)胞,從而獲得重組蛋白。
基因特異引物
實(shí)施例3cDNA克隆序列分析1.PP6414A核苷酸序列(SEQ ID NO1)長度1914bp1GCCGGGGACC ACACAGAGAA TAACTTGTCT GACTACCAGT ATTCTTGGAT GCAGAAGTGC61TGAAGATGAG CACACACACG TACGGAGAAT TTCTGGAGAA TTCAGCTGCT CAGAACAAGA121ACTGAGATCC AGAGAGATGA TGACTTTGCC CATAGACCAA ACAAAGAAAT ACATGTTTCA181GTCCTGTGTC CTCCTGCTAT GTGTGTCCGG AATTGGTGGG TTCTTGGTCT CACTGACTTC241AAGAATGAAG CTGCGGACCC TCGCGGTGAG TGTTACAGTT CTTAAAGGCA GTGTGTCCAG301AGTTTGTTCC TACTGATGTG TGGATGTGTT CGGAGTATCT TCCTTCTGGT GGGTTCGTGG361TCTCGCTGGC TCAGGAGTGA AGCTGCAGAC CTTCGTGGTG AGTGTTACAG CTCTTAAGGT421GGTGCGTCTG GAGTTGTTCA TTCCTCCCAG CGGGCTCGTG GTCTCACTGG CTTCAGGAGT481GAAGCTGCAG ACCTTCGCGG TGAGTGTTAC AGCTCATAAA GGCAGCGTGG ACCCAAAGAG541TGAGAAGTAG CAAGATTTAT TGCGAAGAGC GAAAGAACAA AGCTTCCACG ATGTGGAAGG601AGACCCCAGC AGATTGCCAC TGCTGGCTTG GGCAGCCTGC TTTTATTCTC TTATTTGGCC661CCCACCCACA TCCTGGTGAT TGGTAGAGCC CAGTGGTCTG TTTTGACAGG GCGCTGATTG721GTGCGTTTAC AATCACTGAG CCAGATACAA AGGTTCTCCA GGTCCCCACT AGATTAGCTA781GATACAGAGT GTCTATTGGT GCATTCACAA ACCCTGAGCT AGACACAGGG TGTTGATTGG841TGTGTTTACA AACCTTGAGC TAGAGACAGA GTGCCGATTG GTGTATTTAC AATCCCTGAG901CTAGACACAA AGGTTCTCCA CGTCCGCACC AGACTCAGGA GCCCAGCTGG CTTCACCCAG961TGGATCCCGC ACTGCCCCTG CAGGTGGAGC TGCCTGCCAG TCCCTCGCGG TGCGCCCGCA1021CTCCTCAGCC CTTGGGTGGT CGATGGGACT GGGCGCTGTG GAGCAGGAGG CGGCGCTTGC1081TGGGGAGGCT CCTGCGGCAC AGGTGCCCAC GGAGGGGGTG GGAGGCTCAG GCATGGCGGG1141CTGCAGGTCC CGAGCCCTGC CCCTTGGGAA GGCAGCTAGG GCCCCGGGAG AAATCGAGCG1201CAGCGCCGGT GGGTCAGCAC TGCTGGGGGA CCCAGTACAC CCTCCACAGC CACTGGCTCG1261GGTGCTAAGC CCCTCATTGC CTGGGGCCGG CAGGGCCTGC CGGCTGCTCC GAGTGCGGGC1321CGCCAAGCTC ACACCCACCC AGAACTCCAG CTGGCCTGCA AGCGTCGCGT GCAGCCCCGG1381TTCCTGCTCG CACCTCTCCC TCCACACCTC CCTGCAAGCT GAGGGAGCCG GCTCCGGCCT1441TGGCAAGCCC AGAAAGGGGC TCCCACAGTG CAGCGGTGGG CTGAAGGGCT CCTCAAGTGC1501CGCCAAAGTG GGAGCCCAGG CAGAGGAGGC ACCGAGAGCG AGTGAGGGCT CTGAGGACTG1561CCAGCACGCT GTCACCTCTC ACTAGTAGCT ATCCTACTTT TAAATAAAGA ATTAGGCTGG1621GCACGGTAGC TCACGCCTGT AATCCCAGCA CTTCGGGAGG CCAAGGGGGG TGGATCACCT1681GAGGTCAGGA ATTCGAGACC AGCCTGGCCA ACATGGCAAA ACCCCATCTC TACTAAGAAT1741ACAAAAATTT GCCAGGCATG GTGGCGGGTG CCTGTAATCC CAGCTGCTTG AGAGACTGAG1801GTGGGAGAAT CACTTGAACC CGGGAGGCGA AGGTTGCGGT AAGCCGAGAT TGCACCACGG1861TGCTTCGGCC TGGGCGGCAG AGTGAGACTC TGTTTCAAAA AAAAAAAAAA AAAAB氨基酸序列(SEQ ID NO2) 長度180個(gè)氨基酸1 MGLGAVEQEA ALAGEAPAAQ VPTEGVGGSG MAGCRSRALP LGKAARAPGE IERSAGGSAL61 LGDPVHPPQP LARVLSPSLP GAGRACRLLR VRAAKLTPTQ NSSWPASVAC SPGSCSHLSL121 HTSLQAEGAG SGLGKPRKGL PQCSGGLKGS SSAAKVGAQA EEAPRASEGS EDCQHAVTSHC.核苷酸及氨基酸組合序列(SEQ ID NO3)克隆號PP6414
起始編碼子1043 ATG終止編碼子1583 TAG蛋白質(zhì)分子量17679.871G CCG GGG ACC ACA CAG AGA ATA ACT TGT CTG ACT ACC AGT ATT CTT 4647 GGA TGC AGA AGT GCT GAA GAT GAG CAC ACA CAC GTA CGG AGA ATT TCT 9495 GGA GAA TTC AGC TGC TCA GAA CAA GAA CTG AGA TCC AGA GAG ATG ATG 142143 ACT TTG CCC ATA GAC CAA ACA AAG AAA TAC ATG TTT CAG TCC TGT GTC 190191 CTC CTG CTA TGT GTG TCC GGA ATT GGT GGG TTC TTG GTC TCA CTG ACT 238239 TCA AGA ATG AAG CTG CGG ACC CTC GCG GTG AGT GTT ACA GTT CTT AAA 286287 GGC AGT GTG TCC AGA GTT TGT TCC TAC TGA TGT GTG GAT GTG TTC GGA 334335 GTA TCT TCC TTC TGG TGG GTT CGT GGT CTC GCT GGC TCA GGA GTG AAG 382383 CTG CAG ACC TTC GTG GTG AGT GTT ACA GCT CTT AAG GTG GTG CGT CTG 430431 GAG TTG TTC ATT CCT CCC AGC GGG CTC GTG GTC TCA CTG GCT TCA GGA 478479 GTG AAG CTG CAG ACC TTC GCG GTG AGT GTT ACA GCT CAT AAA GGC AGC 526527 GTG GAC CCA AAG AGT GAG AAG TAG CAA GAT TTA TTG CGA AGA GCG AAA 574575 GAA CAA AGC TTC CAC GAT GTG GAA GGA GAC CCC AGC AGA TTG CCA CTG 622623 CTG GCT TGG GCA GCC TGC TTT TAT TCT CTT ATT TGG CCC CCA CCC ACA 670671 TCC TGG TGA TTG GTA GAG CCC AGT GGT CTG TTT TGA CAG GGC GCT GAT 718719 TGG TGC GTT TAC AAT CAC TGA GCC AGA TAC AAA GGT TCT CCA GGT CCC 766767 CAC TAG ATT AGC TAG ATA CAG AGT GTC TAT TGG TGC ATT CAC AAA CCC 814815 TGA GCT AGA CAC AGG GTG TTG ATT GGT GTG TTT ACA AAC CTT GAG CTA 862863 GAG ACA GAG TGC CGA TTG GTG TAT TTA CAA TCC CTG AGC TAG ACA CAA 910911 AGG TTC TCC ACG TCC GCA CCA GAC TCA GGA GCC CAG CTG GCT TCA CCC 958959 AGT GGA TCC CGC ACT GCC CCT GCA GGT GGA GCT GCC TGC CAG TCC CTC10061007 GCG GTG CGC CCG CAC TCC TCA GCC CTT GGG TGG TCG ATG GGA CTG GGC10541 Met Gly Leu Gly 41055 GCT GTG GAG CAG GAG GCG GCG CTT GCT GGG GAG GCT CCT GCG GCA CAG11025 Ala Val Glu Gln Glu Ala Ala Leu Ala Gly Glu Ala Pro Ala Ala Gln 201103 GTG CCC ACG GAG GGG GTG GGA GGC TCA GGC ATG GCG GGC TGC AGG TCC115021 Val Pro Thr Glu Gly Val Gly Gly Ser Gly Met Ala Gly Cys Arg Ser 361151 CGA GCC CTG CCC CTT GGG AAG GCA GCT AGG GCC CCG GGA GAA ATC GAG119837 Arg Ala Leu Pro Leu Gly Lys Ala Ala Arg Ala Pro Gly Glu Ile Glu 521199 CGC AGC GCC GGT GGG TCA GCA CTG CTG GGG GAC CCA GTA CAC CCT CCA124653 Arg Ser Ala Gly Gly Ser Ala Leu Leu Gly Asp Pro Val His Pro Pro 681247 CAG CCA CTG GCT CGG GTG CTA AGC CCC TCA TTG CCT GGG GCC GGC AGG129469 Gln Pro Leu Ala Arg Val Leu Ser Pro Ser Leu Pro Gly Ala Gly Arg 841295 GCC TGC CGG CTG CTC CGA GTG CGG GCC GCC AAG CTC ACA CCC ACC CAG134285 Ala Cys Arg Leu Leu Arg Val Arg Ala Ala Lys Leu Thr Pro Thr Gln 1001343 AAC TCC AGC TGG CCT GCA AGC GTC GCG TGC AGC CCC GGT TCC TGC TCG1390101 Asn Ser Ser Trp Pro Ala Ser Val Ala Cys Ser Pro Gly Ser Cys Ser 1161391 CAC CTC TCC CTC CAC ACC TCC CTG CAA GCT GAG GGA GCC GGC TCC GGC1438117 His Leu Ser Leu His Thr Ser Leu Gln Ala Glu Gly Ala Gly Ser Gly 1321439 CTT GGC AAG CCC AGA AAG GGG CTC CCA CAG TGC AGC GGT GGG CTG AAG1486133 Leu Gly Lys Pro Arg Lys Gly Leu Pro Gln Cys Ser Gly Gly Leu Lys 1481487 GGC TCC TCA AGT GCC GCC AAA GTG GGA GCC CAG GCA GAG GAG GCA CCG1534149 Gly Ser Ser Ser Ala Ala Lys Val Gly Ala Gln Ala Glu Glu Ala Pro 1641535 AGA GCG AGT GAG GGC TCT GAG GAC TGC CAG CAC GCT GTC ACC TCT CAC1582165 Arg Ala Ser Glu Gly Ser Glu Asp Cys Gln His Ala Val Thr Ser His 1801583 TAG TAG CTA TCC TAC TTT TAA ATA AAG AAT TAG GCT GGG CAC GGT AGC1630181 *** 1811631 TCA CGC CTG TAA TCC CAG CAC TTC GGG AGG CCA AGG GGG GTG GAT CAC16781679 CTG AGG TCA GGA ATT CGA GAC CAG CCT GGC CAA CAT GGC AAA ACC CCA17261727 TCT CTA CTA AGA ATA CAA AAA TTT GCC AGG CAT GGT GGC GGG TGC CTG17741775 TAA TCC CAG CTG CTT GAG AGA CTG AGG TGG GAG AAT CAC TTG AAC CCG18221823 GGA GGC GAA GGT TGC GGT AAG CCG AGA TTG CAC CAC GGT GCT TCG GCC18701871 TGG GCG GCA GAG TGA GAC TCT GTT TCA AAA AAA AAA AAA AAA AA 19142.PP6968A核苷酸序列(SEQ ID NO4)長度2361bp1GCGCTGACAG AGGCAAAAAT CTGCTAACTC AGGGGGCAGA CTCAACCAAG ACTGTGAGCA61GGCCTGGGGA ATGACCCCCC GATCTCCAAC CAGTGCCTTC CGCAGCTGCA CGGCTGTCTC121CAGCTGTCTC TGCCCCTCTT CCTGGCCCTG GCTCCATCTC TCTGTCACCT CACCCTTCCC181TGTGCCACAT GGGCCCTCTC TCTCCTGCCA GGACGCTGCG GCTCTGGGGA CCTCGGAGCC241TGGGGGTGGC TCTGGGAGTC TTCATGACCA TTGGCTTTGC ACTCCAGCTC TTGGGAGGGC301CCTTCCAGAG GAGGCTACCT GGGCTACAGC TCCGACAGCC CTCGGCCCCA TCCCTACGAC361CAGCCCTTCC GTCCTGCCCA CCCCGGCAGC GACTGGTGTT CCTGAAGACA CATAAATCCG421GGAGCAGCTC TGTGCTGAGC CTGCTTCACC GCTATGGGGA CCAGCACGGG CTGCGCTTCG481CCCTCCCTGC CCGCTACCAG TTTGGCTACC CAAAGCTCTT CCAGGCCTCT AGGGTAAAAG541GCTACCGCCC ACAGGGTGGA GGCACCCAGC TCCCCTTCCA CATCCTCTGT CACCACATGA601GGTTCAACCT GAAAGAGGTA CTTCAGGTCA TGCCTTCTGA CAGCTTCTTT TTTTCCATTG661TCCGAGACCC AGCGGCTCTG GCTCGCTCTG CCTTCTCCTA CTATAAATCC ACCTCATCAG721CCTTCCGCAA GTCACCATCT TTGGCTGCCT TCCTGGCCAA TCCTCGAGGC TTCTACAGGC781CTGGGGCCGT GGGGACCACT TACGCTCGCA ACTTACTATG GTTTGACTTT GGCCTGCCCT841TTCCCCCAGA GAAGAGGGCC AAGAGAGGGA ATATTCATCC CCCCAGAGAC CCCAACCCCC901CACAGCTGCA GGTCTTGCCT TCTGGTGCTG GCCCTCGAGC CCAAACCCTC AATCCCAATG961CCCTCATCCA TCCTGTTTCC ACTGTTACTG ATCATCGCAG CCAGATATCA AGCCCTGCCT1021CTTTCGATTT GGGGTCTTCA TCCTTCATCC AGTGGGGTCT GGCCTGGCTG GACTCTGTCT1081TTGACCTGGT CATGGTGGCT GAGTACTTCG ATGAGTCATT GGTTCTGCTG GCAGATGCCC1141TGTGCTGGGG TCTAGATGAC GTGGTGGGCT TCATGCACAA TGCCCAGGCT GGACATAAGC1201AGGGCCTCAG CACTGTCAGC AACAGTGGAC TGACTGCGGA GGACCGGCAG CTGACTGCAC1261GGGCCCGAGC CTGGAACAAC CTGGACTGGG CTCTCTATGT CCACTTCAAC CGCAGTCTCT1321GGGCACGGAT AGAGAAATAC GGCCAGGGCC GGCTGCAGAC AGCTGTGGCC GAGCTCCGGG1381CTCGCCGAGA GGCCCTAGCG AAACATTGTC TGGTAGGGGG TGAGGCTTCT GACCCCAAAT1441ACATCACTGA TCGCCGGTTC CGCCCCTTCC AGTTTGGGTC AGCTAAGGTT TTGGGCTATA1501TACTTCGGAG TGGATTGAGC CCCCAAGACC AAGAGGAATG TGAGCGCCTA GCTACCCCTG1561AGCTCCAGTA CAAGGACAAG CTGGATGTCA AGCAGTTCCC CCCTACCGTC TCACTGCCCC1621TCAAGACTTC AAGGCCACTC TCCCCATAAA CATCAGACTA CAGATTTAGG TGGAAGAGCA1681GCCATGTTTG AAGGGCACAT GTGATGAGTG GGGGGCAGCA AGATGCCATT TCTGCATCTC1741CCAGAAGGGA TGAGTCTTTG TCCCGATGCA AGCCCCCTCT TCGCTGGGCT CCCAGCAGTG1801CTTCCCTCCT CCACCCTCCA CTCATTTTGT TCTTTCCCCC CAACTTTTTT TTTTTTTGAA1861ACGGAGTCTT GCTCTGTCCC CCAGGCTGGA GTGCAGTGGC ATGATCTCGG CTCACTGCAA1921CCTCTGCCTC CCAGGTTCAA GCGATTCTCC TGCCTCAGCC TCCAGAGTAG CTAGGATTAC1981AGATACGTGC CACCATACCC GGCTAATTTT TATATTTTTA GAGACAGGGA TTCAACATGT2041TGGTTAGGCT GGCCTTGAAC TCCTCACCTC AGGTGATCCA CATGACTCTG CCTCCCAAAG2101TGCTGCCATT ACAGGCGTGA GCCACTAGGC CTGACCTCCC CTTCCCCTTT CCTGCCCCAA2161GGCAGATCCA CATCACCGAA GCTCCCTAGA GGGGCAAAAG ATGGAGTGAG CCACAGGAAG2221TTTGGGGCGT GGTGAGTTGG AATGATACGT CCATTTCTCT ATGAAATATT TGCTACTAGA2281CTGTTCATTT CTCTCTGACA TGTTTGTTGA ATGAATAAAT AATTTGAAAC TTCAAAAAAA2341AAAAAAAAAA AAAAAAAAAA AB氨基酸序列(SEQ ID NO5) 長度486個(gè)氨基酸1MGPLSPARTL RLWGPRSLGV ALGVFMTIGF ALQLLGGPFQ RRLPGLQLRQ PSAPSLRPAL61PSCPPRQRLV FLKTHKSGSS SVLSLLHRYG DQHGLRFALP ARYQFGYPKL FQASRVKGYR121PQGGGTQLPF HILCHHMRFN LKEVLQVMPS DSFFFSIVRD PAALARSAFS YYKSTSSAFR181KSPSLAAFLA NPRGFYRPGA VGTTYARNLL WFDFGLPFPP EKRAKRGNIH PPRDPNPPQL241QVLPSGAGPR AQTLNPNALI HPVSTVTDHR SQISSPASFD LGSSSFIQWG LAWLDSVFDL301AMVAEYFDES LVLLADALCW GLDDVVGFMH NAQAGHKQGL STVSNSGLTA EDRQLTARAR361AWNNLDWALY VHFNRSLWAR IEKYGQGRLQ TAVAELRARR EALAKHCLVG GEASDPKYIT421DRRFRPFQFG SAKVLGYILR SGLSPQDQEE CERLATPELQ YKDKLDVKQF PPTVSLPLKT481SRPLSPC.核苷酸及氨基酸組合序列(SEQ ID NO6)克隆號 PP6968起始編碼子189 ATG終止編碼子1647 TAA蛋白質(zhì)分子量54084.131 GC GCT GAC AGA GGC AAA AAT CTG CTA ACT CAG GGG GCA GAC TCA ACC 4748 AAG ACT GTG AGC AGG CCT GGG GAA TGA CCC CCC GAT CTC CAA CCA GTG 9596 CCT TCC GCA GCT GCA CGG CTG TCT CCA GCT GTC TCT GCC CCC CTT CCT 143144 GGC CCT GGC TCC ATC TCT CTG TCA CCT CAC CCT TCC CTG TGC CAC ATG 1911 Met 1192 GGC CCT CTC TCT CCT GCC AGG ACG CTG CGG CTC TGG GGA CCT CGG AGC 2392 Gly Pro Leu Ser Pro Ala Arg Thr Leu Arg Leu Trp Gly Pro Arg Ser 17240 CTG GGG GTG GCT CTG GGA GTC TTC ATG ACC ATT GGC TTT GCA CTC CAG 28718 Leu Gly Val Ala Leu Gly Val Phe Met Thr Ile Gly Phe Ala Leu Gln 33288 CTC TTG GGA GGG CCC TTC CAG AGG AGG CTA CCT GGG CTA CAG CTC CGA 33534 Leu Leu Gly Gly Pro Phe Gln Arg Arg Leu Pro Gly Leu Gln Leu Arg 49336 CAG CCC TCG GCC CCA TCC CTA CGA CCA GCC CTT CCG TCC TGC CCA CCC 38350 Gln Pro Ser Ala Pro Ser Leu Arg Pro Ala Leu Pro Ser Cys Pro Pro 65384 CGG CAG CGA CTG GTG TTC CTG AAG ACA CAT AAA TCC GGG AGC AGC TCT 43166 Arg Gln Arg Leu Val Phe Leu Lys Thr His Lys Ser Gly Ser Ser Ser 81432 GTG CTG AGC CTG CTT CAC CGC TAT GGG GAC CAG CAC GGG CTG CGC TTC 47982 Val Leu Ser Leu Leu His Arg Tyr Gly Asp Gln His Gly Leu Arg Phe 97480 GCC CTC CCT GCC CGC TAC CAG TTT GGC TAC CCA AAG CTC TTC CAG GCC 52798 Ala Leu Pro Ala Arg Tyr Gln Phe Gly Tyr Pro Lys Leu Phe Gln Ala 113528 TCT AGG GTA AAA GGC TAC CGC CCA CAG GGT GGA GGC ACC CAG CTC CCC 575114 Ser Arg Val Lys Gly Tyr Arg Pro Gln Gly Gly Gly Thr Gln Leu Pro 129576 TTC CAC ATC CTC TGT CAC CAC ATG AGG TTC AAC CTG AAA GAG GTA CTT 623130 Phe His Ile Leu Cys His His Met Arg Phe Asn Leu Lys Glu Val Leu 145624 CAG GTC ATG CCT TCT GAC AGC TTC TTT TTT TCC ATT GTC CGA GAC CCA 671146 Gln Val Met Pro Ser Asp Ser Phe Phe Phe Ser Ile Val Arg Asp Pro 161672 GCG GCT CTG GCT CGC TCT GCC TTC TCC TAC TAT AAA TCC ACC TCA TCA 719162 Ala Ala Leu Ala Arg Ser Ala Phe Ser Tyr Tyr Lys Ser Thr Ser Ser 177720 GCC TTC CGC AAG TCA CCA TCT TTG GCT GCC TTC CTG GCC AAT CCT CGA 767178 Ala Phe Arg Lys Ser Pro Ser Leu Ala Ala Phe Leu Ala Asn Pro Arg 193768 GGC TTC TAC AGG CCT GGG GCC GTG GGG ACC ACT TAC GCT CGC AAC TTA 815194 Gly Phe Tyr Arg Pro Gly Ala Val Gly Thr Thr Tyr Ala Arg Asn Leu 209816 CTA TGG TTT GAC TTT GGC CTG CCC TTT CCC CCA GAG AAG AGG GCC AAG 863210 Leu Trp Phe Asp Phe Gly Leu Pro Phe Pro Pro Glu Lys Arg Ala Lys 225864 AGA GGG AAT ATT CAT CCC CCC AGA GAC CCC AAC CCC CCA CAG CTG CAG 911226 Arg Gly Asn Ile His Pro Pro Arg Asp Pro Asn Pro Pro Gln Leu Gln 241912 GTC TTG CCT TCT GGT GCT GGC CCT CGA GCC CAA ACC CTC AAT CCC AAT 959242 Val Leu Pro Ser Gly Ala Gly Pro Arg Ala Gln Thr Leu Asn Pro Asn 257960 GCC CTC ATC CAT CCT GTT TCC ACT GTT ACT GAT CAT CGC AGC CAG ATA1007258 Ala Leu Ile His Pro Val Ser Thr Val Thr Asp His Arg Ser Gln Ile 2731008 TCA AGC CCT GCC TCT TTC GAT TTG GGG TCT TCA TCC TTC ATC CAG TGG1055274 Ser Ser Pro Ala Ser Phe Asp Leu Gly Ser Ser Ser Phe Ile Gln Trp 2891056 GGT CTG GCC TGG CTG GAC TCT GTC TTT GAC CTG GTC ATG GTG GCT GAG1103290 Gly Leu Ala Trp Leu Asp Ser Val Phe Asp Leu Val Met Val Ala Glu 3051104 TAC TTC GAT GAG TCA TTG GTT CTG CTG GCA GAT GCC CTG TGC TGG GGT1151306 Tyr Phe Asp Glu Ser Leu Val Leu Leu Ala Asp Ala Leu Cys Trp Gly 3211152 CTA GAT GAC GTG GTG GGC TTC ATG CAC AAT GCC CAG GCT GGA CAT AAG1199322 Leu Asp Asp Val Val Gly Phe Met His Asn Ala Gln Ala Gly His Lys 3371200 CAG GGC CTC AGC ACT GTC AGC AAC AGT GGA CTG ACT GCG GAG GAC CGG1247338 Gln Gly Leu Ser Thr Val Ser Asn Ser Gly Leu Thr Ala Glu Asp Arg 3531248 CAG CTG ACT GCA CGG GCC CGA GCC TGG AAC AAC CTG GAC TGG GCT CTC1295354 Gln Leu Thr Ala Arg Ala Arg Ala Trp Asn Asn Leu Asp Trp Ala Leu 3691296 TAT GTC CAC TTC AAC CGC AGT CTC TGG GCA CGG ATA GAG AAA TAC GGC1343370 Tyr Val His Phe Asn Arg Ser Leu Trp Ala Arg Ile Glu Lys Tyr Gly 3851344 CAG GGC CGG CTG CAG ACA GCT GTG GCC GAG CTC CGG GCT CGC CGA GAG1391386 Gln Gly Arg Leu Gln Thr Ala Val Ala Glu Leu Arg Ala Arg Arg Glu 4011392 GCC CTA GCG AAA CAT TGT CTG GTA GGG GGT GAG GCT TCT GAC CCC AAA1439402 Ala Leu Ala Lys His Cys Leu Val Gly Gly Glu Ala Ser Asp Pro Lys 4171440 TAC ATC ACT GAT CGC CGG TTC CGC CCC TTC CAG TTT GGG TCA GCT AAG 1487418 Tyr Ile Thr Asp Arg Arg Phe Arg Pro Phe Gln Phe Gly Ser Ala Lys 4331488 GTT TTG GGC TAT ATA CTT CGG AGT GGA TTG AGC CCC CAA GAC CAA GAG 1535434 Val Leu Gly Tyr Ile Leu Arg Ser Gly Leu Ser Pro Gln Asp Gln Glu 4491536 GAA TGT GAG CGC CTA GCT ACC CCT GAG CTC CAG TAC AAG GAC AAG CTG 1583450 Glu Cys Glu Arg Leu Ala Thr Pro Glu Leu Gln Tyr Lys Asp Lys Leu 4651584 GAT GTC AAG CAG TTC CCC CCT ACC GTC TCA CTG CCC CTC AAG ACT TCA 1631466 Asp Val Lys Gln Phe Pro Pro Thr Val Ser Leu Pro Leu Lys Thr Ser 4811632 AGG CCA CTC TCC CCA TAA ACA TCA GAC TAC AGA TTT AGG TGG AAG AGC 1679482 Arg Pro Leu Ser Pro *** 4871680 AGC CAT GTT TGA AGG GCA CAT GTG ATG AGT GGG GGG CAG CAA GAT GCC 17271728 ATT TCT GCA TCT CCC AGA AGG GAT GAG TCT TTG TCC CGA TGC ACG CCC 17751776 CCT CTT CGC TGG GCT CCC AGC AGT GCT TCC CTC CTC CAC CCT CCA CTC 18231824 ATT TTG TTC TTT CCC CCC AAC TTT TTT TTT TTT TGA AAC GGA GGTC TTG18711872 CTC TGT CCC CCA GGC TGG AGT GCA GTG GCA TGA TCT CGG CTC ACT GCA 19191920 ACC TCT GCC TCC CAG GTT CAA GCG ATT CTC CTG CCT CAG CCT CCA GAG 19671968 TAG CTA GGA TTA CAG ATA CGT GCC ACC ATA CCC GGC TAA TTT TTA TAT 20152016 TTT TAG AGA CAG GGA TTC AAC ATG TTG GTT AGG CTG GCC TTG AAC TCC 20632064 TCA CCT CAG GTG ATC CAC ATG ACT CTG CCT CCC AAA GTG CTG CCA TTA 21112112 CAG GCG TGA GCC ACT AGG CCT GAC CTC CCC TTC CCC TTT CCT GCC CCA 21592160 AGG CAG ATC CAC ATC ACC GAA GCT CCC TAG AGG GGC AAA AGA TGG AGT 22072208 GAG CCA CAG GAA GTT TGG GGC GTG GTG AGT TGG AAT GAT ACG TCC ATT 22552256 TCT CTA TGA AAT ATT TGC TAC TAG ACT GTT CAT TTC TCT CTG ACA TGT 23032304 TTG TTG AAT GAA TAA ATA ATT TGA AAC TTC AAA AAA AAA AAA AAA AAA 23512352 AAA AAA AAA A 23613.PP7122A核苷酸序列(SEQ ID NO7)長度1987bp1 GGTACATTTG CCCAGCTTCC CTGCCAGCCT TTAACCCCAG GAACCTCTCA GTCTACCTCC61 TCTTTTCTGC CTCTGAATCC CTACCTTTAA AGTCAGAACA GGCCAGGCCC GGTGGCTCAC121 GCCTGTAATC CCAGCACTTT GGGAGGCTGA GGTGGGTGGA TCACTTGACA TCAGTAGTTC181 AAGACCAGCC TGGCCAACAT GGTGAAACCC CATCCTTACT AAAAATACAA AAATTAGCCA241 GGTGTGGTGG CGGGCACCTG TAATCCCAGC TACTCAGGAG GCTGAGGCAG GAGAATCACT301 TGAACCCAGG AGGCAGAGTT TGCAGTCAGC CAAGATCACG CCACTGTACT CCAGCCTGGA361 TGACACAGCG AGACTCCGTC TCAAAATAAA TAAATAAAAA TAAAGTCAGA ACACCTGGCT421 TAATAGGCCT CACTGTGCAG ATGAGGAAAC TGAGGCCCAG GGAGGAAGAG CGATCTGTGG481 AGATATTTCT AGAACCCCTG CAAGCTGACC CCAGTGAAGG AGAGAAGGTC CAGTAGGAGC541 TTGCTAAGCT CAAAATCGAA GAAAGGTTCA GCAAGACTGT CAGGGTGACC TCAAAGCAAT601 GGCAGCCATC AGAGGAGCCC CATTGCTATT AGGAGGCTCC TATTGCCCTC CCCTTCAGCC661 TCTGACTTTC ACCTGTGCTA CCCAATTCTG GTTCCTTCAC TCCCATTCAA AAATGGACCC721 CAGAAAAGCC TTATTTTGTG GAGTACCTAG TTCCCTTTTG GGTTTGTCTC TTGACTGCTA781 CGGGCATTGC CCCAGGGCAA CCATGACAGT GAAGATGACT GGCCAAGCTT GTGGACTGGC841 CAGCAAGCTT GGGCTGCCTG AGACGCTTTG AAATGGCTGC CTTCTGAGTT GGTCTTGAGG901 GTGAAGACTG ACCACCCTTC TCACCTGCAC AGTCACAGTC CCTCTCCTGC TGGCCTGACT961 GCAGCTGTCC TCCCAGCTGG CCACCTGACC AGAGACCAGG AGAGAGGCCA CAGCCTCCAG1021 ACCCTCCAGA GTCCCACGGA GGAAGAAGGC TTACCAGAGA GACCCTCTGA TGCATGAGCC1081 AGGCCCCAGC CCTTCTCCCT GCATCCAGGT GTGTTTCCAC CGCAAAATGC CTCCACACAA1141TGAGCGACTT TGGCCCTGCG TGGGTCAGCA TGTGGTCTGA GGTAACCCTC AAATGCCTCC1201ACCACACATC TGTCCACCTG CACGGGTTCA AGGTGAGCAC TTGCCCCCTT CTCTCCTCCA1261GACCAGTCGC CTGAAATTCT GAGCAACATT CCTTCAAGAC TATCATGTAA CCCTTGGTGA1321TGCTGAGTCC AGACAGGAAA TGCAGACTTG GGACCCACCT GTATCAGCAG AAAGAGGCCT1381TGTGCCCCGT TTGTCCGAGT CCCAGAACGG AGCAAATGAG AAAACCGGCG AGCTGTCCCC1441CGAGGAGCTG TAGGGAGATT GGTTTTTAGT ATAAATTACA ATAAAATTTT GTGTATGTGT1501ACAGCTGTGT TCACATCCAC AGTGTAAGCT GTGATATGGT TTGGATGTTT GTCCCCTCCA1561AATCTCATGT TGAAATGTGA TCCCCAGCAT TGGAGGTGGG GCCTGATGGG AGGTGATTGG1621GTGATGGGGG AAGTTGCCTC ATGAATGACT TGGTGCCCTC CTGGAAGTGA TGAGTGAGTT1681CTCGCTGAGC TCACTCAAGA TGTGGTTGTT TAAAAGAGTG TGGCACGTCC CTCCCCCAAC1741TCTCCCTCTC ACTCCCGCTC TCACCATGTG ACACACCTGC TCCCCCTTCA CCTTCCACCA1801TGATTGGAAG CTTCCTGAAG CCCTTACCAG AAGCAGATGC CAGCCCCACA CTTCCTGTAC1861CACCTGCAGA ACCATAAACC AAAATAAAGC TCTTTTCTTT ATCAATTAAAA AAAAAAAAAA1921AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAAA AAAAAAAAAA1981AAAAAAAB氨基酸序列(SEQ ID NO8) 長度90個(gè)氨基酸1 MAAIRGAPLL LGGSYCPPLQ PLTFTCATQF WFLHSHSKCMD PRKALFCGVP SSLLGLSLDC61 YGHCPRATMT VKMTGQACGL ASKLGLPETLC.核苷酸及氨基酸組合序列(SEQ ID NO9)克隆號PP7122起始編碼子599 ATG終止編碼子869 TGA蛋白質(zhì)分子量9583.881G GTA CAT TTG CCC AGC TTC CCT GCC AGC CTT TAA CCC CAG GAA CCT 4647 CTC AGT CTA CCT CCT CTT TTC TGC CTC TGA ATC CCT ACC TTT AAA GTC 9495 AGA ACA GGC CAG GCC CGG TGG CTC ACG CCT GTA ATC CCA GCA CTT TGG 142143 GAG GCT GAG GTG GGT GGA TCA CTT GAC ATC AGT AGT TCA AGA CCA GCC 190191 TGG CCA ACA TGG TGA AAC CCC ATC CTT ACT AAA AAT ACA AAA ATT AGC 238239 CAG GTG TGG TGG CGG GCA CCT GTA ATC CCA GCT ACT CAG GAG GCT GAG 286287 GCA GGA GAA TCA CTT GAA CCC AGG AGG CAG AGT TTG CAG TCA GCC AAG 334335 ATC ACG CCA CTG TAC TCC AGC CTG GAT GAC ACA GCG AGA CTC CGT CTC 382383 AAA ATA AAT AAA TAA AAA TAA AGT CAG AAC ACC TGG CTT AAT AGG CCT 430431 CAC TGT GCA GAT GAG GAA ACT GAG GCC CAG GGA GGA AGA GCG ATC TGT 478479 GGA GAT ATT TCT AGA ACC CCT GCA AGC TGA CCC CAG TGA AGG AGA GAA 526527 GGT CCA GTA GGA GCT TGC TAA GCT CAA AAT CGA AGA AAG GTT CAG CAA 574575 GAC TGT CAG GGT GAC CTC AAA GCA ATG GCA GCC ATC AGA GGA GCC CCA 6221 Met Ala Ala Ile Arg Gly Ala Pro 8623 TTG CTA TTA GGA GGC TCC TAT TGC CCT CCC CTT CAG CCT CTG ACT TTC 6709 Leu Leu Leu Gly Gly Ser Tyr Cys Pro Pro Leu Gln Pro Leu Thr Phe 24671 ACC TGT GCT ACC CAA TTC TGG TTC CTT CAC TCC CAT TCA AAA ATG GAC 71825 Thr Cys Ala Thr Gln Phe Trp Phe Leu His Ser His Ser Lys Met Asp 40719 CCC AGA AAA GCC TTA TTT TGT GGA GTA CCT AGT TCC CTT TTG GGT TTG 76641 Pro Arg Lys Ala Leu Phe Cys Gly Val Pro Ser Ser Leu Leu Gly Leu 56767 TCT CTT GAC TGC TAC GGG CAT TGC CCC AGG GCA ACC ATG ACA GTG AAG 81457 Ser Leu Asp Cys Tyr Gly His Cys Pro Arg Ala Thr Met Thr Val Lys 72815 ATG ACT GGC CAA GCT TGT GGA CTG GCC AGC AAG CTT GGG CTG CCT GAG 86273 Met Thr Gly Gln Ala Cys Gly Leu Ala Ser Lys Leu Gly Leu Pro Glu 88863 ACG CTT TGA AAT GGC TGC CTT CTG AGT TGG TCT TGA GGG TGA AGA CTG 91089 Thr Leu *** 91911 ACC ACC CTT CTC ACC TGC ACA GTC ACA GTC CCT CTC CTG CTG GCC TGA 958959 CTG CAG CTG TCC TCC CAG CCG GCC ACC TGA CCA GAG ACC AGG AGA GAG10061007 GCC ACA GCC TCC AGA CCC TCC AGA GTC CCA CGG AGG AAG AAG GCT TAG10541055 CAG AGA GAC CCT CTG ATG CAT GAG CCA GGC CCC AGC CCT TCT CCC TGC11021103 ATC CAG GTG TGT TTC CAC CGC AAA ATG CCT CCA CAC AAT GAG CGA CTT11501151 TGG CCC TGC GTG GGT CAG CAT GTG GTC TGA GGT AAC CCT CAA ATG CCT11981199 CCA CCA CAC ATC TGT CCA CCT GCA CGG GTT CAA GGT GAG CAC TTG CCC12461247 CCT TCT CTC CTC CAG ACC AGT CGC CTG AAA TTC TGA GCA ACA TTC CTT12941295 CAA GAC TAT CAT GTA ACC CTT GGT GAT GCT GAG TCC AGA CAG GAA ATG13421343 CAG ACT TGG GAC CCA CCT GTA TCA GCA GAA AGA GGC CTT GTG CCC CGT13901391 TTG TCC GAG TCC CAG AAC GGA GCA AAT GAG AAA ACC GGC GAG CTG TCC14381439 CCC GAG GAG CTG TAG GGA GAT TGG TTT TTA GTA TAA ATT ACA ATA AAA14861487 TTT TGT GTA TGT GTA CAG CTG TGT TCA CAT CCA CAG TGT AAG CTG TGA15341535 TAT GGT TTG GAT GTT TGT CCC CTC CAA ATC TCA TGT TGA AAT GTG ATC15821583 CCC AGC ATT GGA GGT GGG GCC TGA TGG GAG GTG ATT GGG TGA TGG GGG16301631 AAG TTG CCT CAT GAA TGA CTT GGT GCC CTC CTG GAA GTG ATG AGT GAG16781679 TTC TCG CTG AGC TCA CTC AAG ATG TGG TTG TTT AAA AGA GTG TGG CAC17261727 GTC CCT CCC CCA ACT CTC CCT CTC ACT CCC GCT CTC ACC ATG TGA CAC17741775 ACC TGC TCC CCC TTC ACC TTC CAC CAT GAT TGG AAG CTT CCT GAA GCC18221823 CTT ACC AGA AGC AGA TGC CAG CCC CAC ACT TCC TGT ACC ACC TGC AGA18701871 ACC ATA AAC CAA AAT AAA GCT CTT TTC TTT ATC AAT TAA AAA AAA AAA19181919 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA19661967 AAA AAA AAA AAA AAA AAA AAA19874.PP7157A核苷酸序列(SEQ ID NO10)長度1017bp1 GCACGGACGC CGTCCCTCCT CGGCGCGGCC TGAGCGCCCG GCCCGACCCC GGCCATGGGG61 TGCTGCTACA GCAGCGAGAA CGAGGACTCG GACCAGGACC GAGAGGAGCG GAAGCTGCTG121 CTGGACCCTA GCAGCCCCCC TACCAAAGCT CTCAATGGAG CCGAGCCCAA CTACCACAGC181 CTGCCTTCCG CTCGCACTGA TGAGCAGGCC CTGCTCTCTT CCATCCTTGC CAGGACAGCC241 AGCAACATCA TTGATGTGTC TGCTGCAGAC TCACAGGGCA TGGAGCAGCA TGAGTACATG301 GACCGTGCCA GGCAGTACAG CACCCGCTTG GCTGTGCTGA GCAGCAGCCT GACCCATTGG361 AAGAAGCTGC CACCGCTGCC GTCTCTTACC AGCCAGCCCC ACCAAGTGCT GGCCAGTGAG421 CCCATCCCGT TCTCTGATTT GCAGCAGGTC TCCAGGATAG CTGCTTATGC CTACAGTGCA481 CTTTCTCAGA TCCGTGTGGA CGCAAAAGAG GAGCTGGTTG TACAGTTTGG GATCCCATGA541 AGAGAGGGGT CCTTGGACAG CTCTTCTCCT CTCTTCATCC CATCTCTACC CCACCCCCTT601 GGCCCCCAGC CTCACTGCGG CTTATACAGT ACCCTAACCT GCTACTAATC ACAGAGAAAA661 ATGTGAAGAA GGAGGAGAAG AGGAAGGCTA GAAGCCTGAG CAAGTGAGGG TAGAACCTTT721 TGGGACTGGC CTTTGAAGCT CTGGCCAGGG ATGGGGTTGG GGCCAAAAGG ACAGAGCCTG781 GTATGTCTTC ATAGTCATTG AGAATGTGGA GATACCAGTT TGGGTGGGGG GTGATCACCA841 GGGGACCTAG GGAGATCCCC TTCCCACCCT CTCTGTTGGC CTCAGAGTCA CTCCTGCCCC901 CCCTCCCTGA CTTGGTGCTC ACATGCACCC CACTAGGGTT TGTGACCAGG GTCTGGATGA961 GCTTGAATTT GAATGAATTG AGTTTGTATT TCTAGAAAAA AAAAAAAAAA AAAAAAAB氨基酸序列(SEQ ID NO11) 長度161個(gè)氨基酸1MGCCYSSENE DSDQDREERK LLLDPSSPPT KALNGAEPNY HSLPSARTDE QALLSSILAR61TASNIIDVSA ADSQGMEQHE YMDRARQYST RLAVLSSSLT HWKKLPPLPS LTSQPHQVLA121SEPIPFSDLQ QVSRIAAYAY SALSQIRVDA KEELVVQFGI PC.核苷酸及氨基酸組合序列(SEQ ID NO12)克隆號PP7157起始編碼子55 ATG終止編碼子538 TGA蛋白質(zhì)分子量17771.811 GCA CGG ACG CCG TCC CTC CTC GGC GCG GCC TGA GCG CCC GGC CCG ACC 4849 CCG GCC ATG GGG TGC TGC TAC AGC AGC GAG AAC GAG GAC TCG GAC CAG 961 Met Gly Cys Cys Tyr Ser Ser Glu Asn Glu Asp Ser Asp Gln 1497 GAC CGA GAG GAG CGG AAG CTG CTG CTG GAC CCT AGC AGC CCC CCT ACC 14415 Asp Arg Glu Glu Arg Lys Leu Leu Leu Asp Pro Ser Ser Pro Pro Thr 30145 AAA GCT CTC AAT GGA GCC GAG CCC AAC TAC CAC AGC CTG CCT TCC GCT 19231 Lys Ala Leu Asn Gly Ala Glu Pro Asn Tyr His Ser Leu Pro Ser Ala 46193 CGC ACT GAT GAG CAG GCC CTG CTC TCT TCC ATC CTT GCC AGG ACA GCC 24047 Arg Thr Asp Glu Gln Ala Leu Leu Ser Ser Ile Leu Ala Arg Thr Ala 62241 AGC AAC ATC ATT GAT GTG TCT GCT GCA GAC TCA CAG GGC ATG GAG CAG 28863 Ser Asn Ile Ile Asp Val Ser Ala Ala Asp Ser Gln Gly Met Glu Gln 78289 CAT GAG TAC ATG GAC CGT GCC AGG CAG TAC AGC ACC CGC TTG GCT GTG 33679 His Glu Tyr Met Asp Arg Ala Arg Gln Tyr Ser Thr Arg Leu Ala Val 94337 CTG AGC AGC AGC CTG ACC CAT TGG AAG AAG CTG CCA CCG CTG CCG TCT 38495 Leu Ser Ser Ser Leu Thr His Trp Lys Lys Leu Pro Pro Leu Pro Ser 110385 CTT ACC AGC CAG CCC CAC CAA GTG CTG GCC AGT GAG CCC ATC CCG TTC 432111 Leu Thr Ser Gln Pro His Gln Val Leu Ala Ser Glu Pro Ile Pro Phe 126433 TCT GAT TTG CAG CAG GTC TCC AGG ATA GCT GCT TAT GCC TAC AGT GCA 480127 Ser Asp Leu Gln Gln Val Ser Arg Ile Ala Ala Tyr Ala Tyr Ser Ala 142481 CTT TCT CAG ATC CGT GTG GAC GCA AAA GAG GAG CTG GTT GTA CAG TTT 528143 Leu Ser Gln Ile Arg Val Asp Ala Lys Glu Glu Leu Val Val Gln Phe 158529 GGG ATC CCA TGA AGA GAG GGG TCC TTG GAC AGC TCT TCT CCT CTC TTC 576159 Gly Ile Pro *** 162577 ATC CCA TCT CTA CCC CAC CCC CTT GGC CCC CAG CCT CAC TGC GGC TTA 624625 TAC AGT ACC CTA ACC TGC TAC TAA TCA CAG AGA AAA ATG TGA AGA AGG 672673 AGG AGA AGA GGA AGG CTA GAA GCC TGA GCA AGT GAG GGT AGA ACC TTT 720721 TGG GAC TGG CCT TTG AAG CTC TGG CCA GGG ATG GGG TGG GGG CCA AAA 768769 GGA CAG AGC CTG GTA TGT CTT CAT AGT CAT TGA GAA TGT GGA GAT ACC 816817 AGT TTG GGT GGG GGG TGA TCA CCA GGG GAC CTA GGG AGA TCC CCT TCC 864865 CAC CCT CTC TGT TGG CCT CAG AGT CAC TCC TGC CCC CTC TCC CTG ACT 912913 TGG TGC TCA CAT GCA CCT CAC TAG GGT TTG TGA CCA GGG TCT GGA TGA 960961 GCT TGA ATT TGA ATG AAT TGA GTT TGT ATT TCT AGA AAA AAA AAA AAA10081009 AAA AAA AAA10175.PP7517A核苷酸序列(SEQ ID NO13)長度2712bp1 GTTCACGGCA ACAGCATCCA GCGCCTGGGG GAGGTGAATA AGCTGGCTGT CCTTCCTCGG61 CTCCGTAGCC TGACACTCCA TGGGAACCCC ATGGAGGAAG AGAAAGGGTA TAGCAGGCCC121 TGGACTCCCC GACCTGTCCT GTGCTCTGGT CCTCCAGCCC AGCCTCCGAG ACTGCCTGTC181 AGGGCTGCGG ATCGAGGAGC GGGCCTTCAG CTACGTGCTC ACCCATGCCC TGCCCGGTGA241 CCCTGGTCAC ATCCTCACCA CCCTGGACCA CTGGAGCAGC CGCTGCGAGT ACTTGAGCCA301 CATGGGGCCT GTCAAAGGTC AGATCCTGAT GCGGCTGGTG GAGGAGAAGC CCCTGCTTGT361 GTGCTGGAAT TGGGAACCTA CTGTGGATAC TCTACCCTGC TTATTGCCCG AGCCCTGCCC421 CCTGGGGGTC GCCTTCTTAC TGTGGAGCGG GACCCACGCA CGGCAGCAGT GGCTGAAAAA481 CTCATCCGCC TGGCCGGCTT TGATGAGCAC ATGGTGGAGC TCATCGTGGG CAGCTCAGAG541 GACGTGATCC CGTGCCTACG CACCCAGTAT CAGCTGAGTC GGGCAGACCT GGTGCTCCTG601 GCACACCGGC CACGATGTTA CCTGAGGGAC CTGCAGCTGC TGGAGGCCCA TGCCCTACTG661 CCAGCAGGTG CCACCGTGCT GGCTGACCAT GTGCTCTTCC CTGGTGCACC CCGCTTCTTG721 CAGTATGCTA AGAGCTGTGG CCGCTACCGC TGCCGCCTCC ACCACACTGG CCTTCCAGAC781 TTCCCTGCCA TCAAGGATGG AATAGCTCAG CTCACCTATG CTGGACCAGG CTGAGGTCCA841 GGCCCAGGGG TACTTACTGA TGCCCACCCC CACCCCCACC CAAGCAGGGA CCTCAAAATC901 CCCTCCCTTT CCTGTTTGGG GCCTTGACAC ACGCTGGGCT CAGGGCTAGG GAGTCTCTCT961 TCCCACCTCT GACCTCTTTC AGCCTCTACA CTGACCTCAA GTGTCAAGTT CTATCAGGCT1021 GCTTGGTCTC ACTAGGCCCC CTCTTTCCAG AGAGAACCAT GGACTGACAG CAAGAAGCCT1081 GAGCTCCCGA CCCAGCTCTG TCACTGATTT GCTGAGTGAC TCCAAGGGAA TCCCCACCTT1141 GCTCTGAGAT TTAATCTTCT CTCTTAACAC GAAGGAAGCT GGATGGGAGA GCTCCAGGGG1201 CCTCCCAGTT CTCGGCCTCA GAAAGCCTCC CATCCTCAGC CCATGCCATT CTGGGTGGGA1261 TCAGAGGAAG TGGCAATGAG TTAGACGCCC TGCAGGAATA GCTGGATGCA AGCTGGGCCA1321 GAGAAAATGG CACAGAACCC TGGACCCAGG GCCAGGGATG CCCTGGCCTT CCCTAACTCT1381 GGCCCACCTA GCCAATTAGG TGTGGCTGAT GTCCCTTGAG TGCCCTCTTC CTAAAGCCCA1441 AAAGAAGATG CTGGACTCCT CTGGGCCCCA CCAACAAATA GGGAATAGAC ATGGGTGGAA1501 AATCACTCCT TTGTCTTTAT TAAAGAAACT TAGACCAGAC CTGGCAATCA AGGGGTGAGG1561 TACTGGCCAG GAAGGTGGAG TAGGTTTCAG GCCCTGGGGA TTTCAAGTGC AGACTGATGG1621 CCTGGGAGGG GCCAAAGAGA CCAGATCCTG GCAGCAGCTG AGGAGGTGCC CAAGGGCACT1681 TTCAGGCACT GGGGCCATCA GCTGGTTCTG TGGGCAGGGG TTGGGGGTTG GGATGCAGGG1741 TAGTTTGGGC TGGCCTGGAA TCTCCCTGAG GCCACCCTGC CTTGTCTACC TAGATCATCC1801 ACTGGTCCTG ATCCTGTTCG TTGCCTTCCA TGTCCACCTG GAGAGGAGGC TGGGTGTGGG1861 TGGGGAGGGG CCTCAGCCAG CCTCAGCCCC AGATCCTGCC CCTGGCTGGA TCCAGGGTTT1921 CTGTACCCCT TGCCATCAAC TGGGTCAGGA GCAAGGGTCC AGGAACAGAG GCCCTCCCCC1981 ATACCCCTTG CCTACCTCAT TGACCTCTCC ATCATCCGGT GACTCATTGT AGTCATTCAT2041 CTCGTCCATG TCCTGCATAT CCTCATCATC CTCTGAGTCC TCTTTCACTA TCCTCATCGT2101 CTTCATCATC TTCTTCTTCC TCGTCATCAT AGTGCTGGTG GGCAGGACAG AGCCTGTAAG2161 CCCTACAGGC CTGCATGGAC CAGTTCAAGA ACTGACCCAC TTGAGCCTCT CTCTAGGGCC2221 AATGAATGAC CCCCTACCCC GACACTCCCT CCTTGAGTCT AGCAGGCTGG TGCATGTTCT2281 GCAGGACCTT AATGCTAGGC CCAATGCCCA CCCCTTCTAT CTCCCCTTTT AGGCTTTTAC2341 CCAGATCTGA GAACCACAAC TGCTCTGGGT CAGAGACAGG ACATTCAGAA TTAGAGCAGA2401 GCCTCGGTCC ACTGCGGCCC CCACACAGGC CCCACCTGCT AGAGCCACTC ACCTCTGAGG2461 CTGGCTTGCC AATAGGAACC AGGTTGTTGT CTTTCTCCGC GATGCTTTGG AGCTGTGGGC2521 AAAGGCACAG AGGAACAAGG CCAGAGCCCA AGTAGGGCAG GTCAGGGGCA TGGGACTGGC2581 CCATTCTGCC CAGAAGACAA CCCACACGTG TTGGGGAGAA GCTTCCTCCC AGTTCTCAGG2641 GAGATACAAT CCCTTTCTTG TCATCTGCCA TTTATGAACT TGATCCAAAT AAAAAAAAAA2701 AAAAAAAAAA AAB氨基酸序列(SEQ ID NO14)長度155個(gè)氨基酸1 MGTPWRKRKG IAGPGLPDLS CALVLQPSLR DCLSGLRIEE RAFSYVLTHA LPGDPGHILT61 TLDHWSSRCE YLSHMGPVKG QILMRLVEEK PLLVCWNWEP TVDTLPCLLP EPCPLGVAFL121 LWSGTHARQQ WLKNSSAWPA LMSTWWSSSW AAQRTC.核苷酸及氨基酸組合序列(SEQ ID NO15)克隆號 PP7517起始編碼子80 ATG終止編碼子545 TGA蛋白質(zhì)分子量17413.271G TTC ACG GCA ACA GCA TCC AGC GCC TGG GGG AGG TGA ATA AGC TGG 4647 CTG TCC TTC CTC GGC TCC GTA GCC TGA CAC TCC ATG GGA ACC CCA TGG 941 Met Gly Thr Pro Trp 595 AGG AAG AGA AAG GGT ATA GCA GGC CCT GGA CTC CCC GAC CTG TCC TGT 1426 Arg Lys Arg Lys Gly Ile Ala Gly Pro Gly Leu Pro Asp Leu Ser Cys 21143 GCT CTG GTC CTC CAG CCC AGC CTC CGA GAC TGC CTG TCA GGG CTG CGG 19022 Ala Leu Val Leu Gln Pro Ser Leu Arg Asp Cys Leu Ser Gly Leu Arg 37191 ATC GAG GAG CGG GCC TTC AGC TAC GTG CTC ACC CAT GCC CTG CCC GGT 23838 Ile Glu Glu Arg Ala Phe Ser Tyr Val Leu Thr His Ala Leu Pro Gly 53239 GAC CCT GGT CAC ATC CTC ACC ACC CTG GAC CAC TGG AGC AGC CGC TGC 28654 Asp Pro Gly His Ile Leu Thr Thr Leu Asp His Trp Ser Ser Arg Cys 69287 GAG TAC TTG AGC CAC ATG GGG CCT GTC AAA GGT CAG ATC CTG ATG CGG 33470 Glu Tyr Leu Ser His Met Gly Pro Val Lys Gly Gln Ile Leu Met Arg 85335 CTG GTG GAG GAG AAG CCC CTG CTT GTG TGC TGG AAT TGG GAA CCT ACT 38286 Leu Val Glu Glu Lys Pro Leu Leu Val Cys Trp Asn Trp Glu Pro Thr 101383 GTG GAT ACT CTA CCC TGC TTA TTG CCC GAG CCC TGC CCC CTG GGG GTC 430102 Val Asp Thr Leu Pro Cys Leu Leu Pro Glu Pro Cys Pro Leu Gly Val 117431 GCC TTC TTA CTG TGG AGC GGG ACC CAC GCA CGG CAG CAG TGG CTG AAA 478118 Ala Phe Leu Leu Trp Ser Gly Thr His Ala Arg Gln Gln Trp Leu Lys 133479 AAC TCA TCC GCC TGG CCG GCT TTG ATG AGC ACA TGG TGG AGC TCA TCG 526134 Asn Ser Ser Ala Trp Pro Ala Leu Met Ser Thr Trp Trp Ser Ser Ser 149527 TGG GCA GCT CAG AGG ACG TGA TCC CGT GCC TAC GCA CCC AGT ATC AGC 574150 Trp Ala Ala Gln Arg Thr *** 156575 TGA GTC GGG CAG ACC TGG TGC TCC TGG CAC ACC GGC CAC GAT GTT ACC 622623 TGA GGG ACC TGC AGC TGC TGG AGG CCC ATG CCC TAC TGC CAG CAG GTG 670671 CCA CCG TGC TGG CTG ACC ATG TGC TCT TCC CTG GTG CAC CCC GCT TCT 718719 TGC AGT ATG CTA AGA GCT GTG GCC GCT ACC GCT GCC GCC TCC ACC ACA 766767 CTG GCC TTC CAG ACT TCC CTG CCA TCA AGG ATG GAA TAG CTC AGC TCA 814815 CCT ATG CTG GAC CAG GCT GAG GTC CAG GCC CAG GGG TAC TTA CTG ATG 862863 CCC ACC CCC ACC CCC ACC CAA GCA GGG ACC TCA AAA TCC CCT CCC TTT 910911 CCT GTT TGG GGC CTT GAC ACA CGC TGG GCT CAG GGC TAG GGA GTC TCT 958959 CTT CCC ACC TCT GAC CTC TTT CAG CCT CTA CAC TGA CCT CAA GTG TCA10061007 AGT TCT ATC AGG CTG CTT GGT CTC ACT AGG CCC CCT CTT TCC AGA GAG10541055 AAC CAT GGA CTG ACA GCA AGA AGC CTG AGC TCC CGA CCC AGC TCT GTC11021103 ACT GAT TTG CTG AGT GAC TCC AAG GGA ATC CCC ACC TTG CTC TGA GAT11501151 TTA ATC TTC TCT CTT AAC ACG AAG GAA GCT GGA TGG GAG AGC TCC AGG11981199 GGC CTC CCA GTT CTC GGC CTC AGA AAG CCT CCC ATC CTC AGC CCA TGC12461247 CAT TCT GGG TGG GAT CAG AGG AAG TGG CAA TGA GTT AGA CGC CCT GCA12941295 GGA ATA GCT GGA TGC AAG CTG GGC CAG AGA AAA TGG CAC AGA ACC CTG13421343 GAC CCA GGG CCA GGG ATG CCC TGG CCT TCC CTA ACT CTG GCC CAC CTA13901391GCC AAT TAG GTG TGG CTG ATG TCC CTT GAG TGC CCT CTT CCT AAA GCC14381439CAA AAG AAG ATG CTG GAC TCC TCT GGG CCC CAC CAA CAA ATA GGG AAT14861487AGA CAT GGG TGG AAA ATC ACT CCT TTG TCT TTA TTA AAG AAA CTT AGA15341535CCA GAC CTG GCA ATC AAG GGG TGA GGT ACT GGC CAG GAA GGT GGA GTA15821583GGT TTC AGG CCC TGG GGA TTT CAA GTG CAG ACT GAT GGC CTG GGA GGG16301631GCC AAA GAG ACC AGA TCC TGG CAG CAG CTG AGG AGG TGC CCA AGG GCA16781679CTT TCA GGC ACT GGG GCC ATC AGC TGG TTC TGT GGG CAG GGG TTG GGG17261727GTT GGG ATG CAG GGT AGT TTG GGC TGG CCT GGA ATC TCC CTG AGG CCA17741775CCC TGC CTT GTC TAC CTA GAT CAT CCA CTG GTC CTG ATC CTG TTC GTT18221823GCC TTC CAT GTC CAC CTG GAG AGG AGG CTG GGT GTG GGT GGG GAG GGG18701871CCT CAG CCA GCC TCA GCC CCA GAT CCT GCC CCT GGC TGG ATC CAG GGT19181919TTC TGT ACC CCT TGC CAT CAA CTG GGT CAG GAG CAA GGG TCC AGG AAC19661967AGA GGC CCT CCC CCA TAC CCC TTG CCT ACC TCA TTG ACC TCT CCA TCA20142015TCC GGT GAC TCA TTG TAG TCA TTC ATC TCG TCC ATG TCC TGC ATA TCC20622063TCA TCA TCC TCT GAG TCC TCT TTC ACT ATC CTC ATC GTC TTC ATC ATC21102111TTC TTC TTC CTC GTC ATC ATA GTG CTG GTG GGC AGG ACA GAG CCT GTA21582159AGC CCT ACA GGC CTG CAT GGA CCA GTT CAA GAA CTG ACC CAC TTG AGC22062207CTC TCT CTA GGG CCA ATG AAT GAC CCC CTA CCC CGA CAC TCC CTC CTT22542255GAG TCT AGC AGG CTG GTG CAT GTT CTG CAG GAC CTT AAT GCT AGG CCC23022303AAT GCC CAC CCC TTC TAT CTC CCC TTT TAG GCT TTT ACC CAG ATC TGA23502351GAA CCA CAA CTG CTC TGG GTC AGA GAC AGG ACA TTC AGA ATT AGA GCA23982399GAG CCT CGG TCC ACT GCG GCC CCC ACA CAG GCC CCA CCT GCT AGA GCC24462447ACT CAC CTC TGA GGC TGG CTT GCC AAT AGG AAC CAG GTT GTT GTC TTT24942495CTC CGC GAT GCT TTG GAG CTG TGG GCA AAG GCA CAG AGG AAC AAG GCC25422543AGA GCC CAA GTA GGG CAG GTC AGG GGC ATG GGA CTG GCC CAT TCT GCC25902591CAG AAG ACA ACC CAC ACG TGT TGG GGA GAA GCT TCC TCC CAG TTC TCA26382639GGG AGA TAC AAT CCC TTT CTT GTC ATC TGC CAT TTA TGA ACT TGA TCC26862687AAA TAA AAA AAA AAA AAA AAA AAA AA27126.PP7283A核苷酸序列(SEQ ID NO16)長度1937bp1 GGGAGTGGAG AACTGGAGTC ATATTTCTGG GTTTTATGGC AGGGTTTGGG GAAGCCTCTC61 AGAGGAGGAG GAGCTGGAGA CAGGAGGGTG GGAGCAGGAC AGAGAAACTT TTGTTTCTGA121 GGCTTCCACG TTGGGGTGTT GTTTTTTGAG CCCCGGCACT TACCAAACCC AAATCACCCA181 CAGGGCTTAG ACGGCACAAA GGCTCCTGGG ACTCTGGGCA GAGTCAGGGA CAGTCACACC241 CCTCCCCGTC TCTATAGCGG AGGTACTCAG AGGGTCTGTG CTTGGGAGGC TGAGCGAGTC301 CTGGAGAGCA TGGAGGTAGG GGCCTGTGTT CACATCCTGC CCCGGTCAAA GTAGGCCCAC361 ACTCAAAGGC CTCTCTCTCA GCAGAGATCT TCCAGAGTGT CAGCCTCCAG CAAGTTCCCT421 AACCTCTCCC AACACAGCCT TCACCAGCAC ATGGGCCGAG ACTCTCCCCA CGGGGCTGTG481 GCTCAACATA GAAAAACCTT GGTGCACGAT GGCAGCAGCA GGTCTCACAA GAGCCGGCTT541 TCTCAGAACA CACTGCCTCT GCCCAGGTGT CCTGCAGTGG AGGCTCAGAC TGGCCCCACT601 GGTGACCCCT TGGGGAGCAG GGACAGGTCC ATTCTGCTCA CTCCTGAGCT GGGCAGTTCC661 CTCTTGGGAT AAGGTCGCAC AGCACAGGCC ACCATCATAC CACCCCAGCC AGAGAAGTGG721 GAGAGACAAG GAGGCTCCCT ACCCCAGAGG CAGTGCTCCT CAGGAAGGGC ATTCACTGCG781 TTATATAGAT ATATACACAC ACACACACAC ACACACATAT ATATACACAT ATATACACAT841 ATATGTATAC ACACATATAT ACACACACAC ATATATACAC ACACACATAT GTATATACAC901 ACACATATAT ATATAGATAT ACACACACAT ATATTTTTTG TTTGTTTGTT TGTTTGTTTG961 CGATGGAGTC TCACTCCAGC CTGGCCGACA GAGCAAGACT CCGTCTCAAA AAAAAAAAAG1021 ATTGCAGTGA GCCACGATAG CACCACTGCA TTCCAGACTG GGTGACAGGG CAAGGCCGTC1081 TCTCAAAGAA AAAAAGAAAC AAAGATTTCC ATTCTGGCAG TCCACCCCTT TTGTTTCCCC1141 CATTATTAAC TTTACTTCTC CCTCATTATT AGTTTTTACT TTATTTAAAT GTGTGTATCT1201 GCTCCCATCT AACCTAACAC GACTCTCTCT CTAGCAAAAA TATTTGCAAT CTGCAGTCCC1261 TTCCCCAAAG AGGGATCCAC CCAAGCCTCG TATTGTTGTG TCCACCTCCA AGTTCAGGAT1321 CTTTTGGTGA TAGATCTTCT CTAGTGAAAA TGTCTTCAAA CATAGCAAGA GGCTTTAAAT1381 ACTGGGTATC CAAAAAATGA TAGGGGTCCT AAAACCAGAT CCAGTTACCT ACCTATCATC1441 CAAGACCTCG CTTGAGTCCT TTTGGGTGCT CCCAACATTA GTGTCGTAAA ACTAAATACA1501 GGTGATGTGA GCAGTTGTTC ACTGATGATT CTAATGCTCT CTTGGAATTC ATTGTTTCTC1561 TGTTAGGGTG TTTCATAGTC TTTGTGGCAA AAATAGCATT GCATCATTAA AAGTATGTTA1621 CTGTCTGGGC GTGGTGGCTG AAGCCTGTAA TCCCAGCACT TTGGGAGGCC GAGGTGGGTG1681 GATCACGAGC TCAGGAGATC GAGACCATCC TGGCTAACAC GGTGAAACCC TGTCTCTACT1741 AAAAATACAA AAAATTAGCC GGGCGTGGTG GTGGGCACCT GTAGTCCCAG CTACTCAGGA1801 GGTTGAGGCA GGAGAATGGC GTGAACCTGG GAGGCGGAGC TGGCAGTGAG CCAAGATCGC1861 ACCATTGCAC TCCAGCCTGG GCAACACAGT GAGACTCCGT CTCAAAAAAA AAAAAAAAAA1921 AAAAAAAAAA AAAAAAAB氨基酸序列(SEQ ID NO17) 長度135個(gè)氨基酸1 MAAAGLTRAG FLRTHCLCPG VLQWRLRLAP LVTPWGAGTG PFCSLLSWAV PSWDKVAQHR61 PPSYHPSQRS GRDKEAPYPR GSAPQEGHSL RYIDIYTHTH THTYIYTYIH IYVYTHIYTH121 TYIHTHICIY THIYIC.核苷酸及氨基酸組合序列(SEQ ID NO18)克隆號 PP7683起始編碼子509 ATG終止編碼子914 TAG蛋白質(zhì)分子量15559.001G GGA GTG GAG AAC TGG AGT CAT ATT TCT GGG TTT TAT GGC AGG GTT 4647 TGG GGA AGC CTC TCA GAG GAG GAG GAG CTG GAG ACA GGA GGG TGG GAG 9495 CAG GAC AGA GAA ACT TTT GTT TCT GAG GCT TCC ACG TTG GGG TGT TGT 142143 TTT TTG AGC CCC GGC ACT TAC CAA ACC CAA ATC ACC CAC AGG GCT TAG 190191 ACG GCA CAA AGG CTC CTG GGA CTC TGG GCA GAG TCA GGG ACA GTC ACA 238239 CCC CTC CCC GTC TCT ATA GCG GAG GTA CTC AGA GGG TCT GTG CTT GGG 286287 AGG CTG AGC GAG TCC TGG AGA GCA TGG AGG TAG GGG CCT GTG TTC ACA 334335 TCC TGC CCC GGT CAA AGT AGG CCC ACA CTC AAA GGC CTC TCT CTC AGC 382383 AGA GAT CTT CCA GAG TGT CAG CCT CCA GCA AGT TCC CTA ACC TCT CCC 430431 AAC ACA GCC TTC ACC AGC ACA TGG GCC GAG ACT CTC CCC ACG GGG CTG 478479 TGG CTC AAC ATA GAA AAA CCT TGG TGC ACG ATG GCA GCA GCA GGT CTC 5261 Met Ala Ala Ala Gly Leu 6527 ACA AGA GCC GGC TTT CTC AGA ACA CAC TGC CTC TGC CCA GGT GTC CTG 5747 Thr Arg Ala Gly Phe Leu Arg Thr His Cys Leu Cys Pro Gly Val Leu 22575 CAG TGG AGG CTC AGA CTG GCC CCA CTG GTG ACC CCT TGG GGA GCA GGG 62223 Gln Trp Arg Leu Arg Leu Ala Pro Leu Val Thr Pro Trp Gly Ala Gly 38623 ACA GGT CCA TTC TGC TCA CTC CTG AGC TGG GCA GTT CCC TCT TGG GAT 67039 Thr Gly Pro Phe Cys Ser Leu Leu Ser Trp Ala Val Pro Ser Trp Asp 54671 AAG GTC GCA CAG CAC AGG CCA CCA TCA TAC CAC CCC AGC CAG AGA AGT 71855 Lys Val Ala Gln His Arg Pro Pro Ser Tyr His Pro Ser Gln Arg Ser 70719 GGG AGA GAC AAG GAG GCT CCC TAC CCC AGA GGC AGT GCT CCT CAG GAA 76671 Gly Arg Asp Lys Glu Ala Pro Tyr Pro Arg Gly Ser Ala Pro Gln Glu 86767 GGG CAT TCA CTG CGT TAT ATA GAT ATA TAC ACA CAC ACA CAC ACA CAC 81487 Gly His Ser Leu Arg Tyr Ile Asp Ile Tyr Thr His Thr His Thr His 102815 ACA TAT ATA TAC ACA TAT ATA CAC ATA TAT GTA TAC ACA CAT ATA TAC 862103 Thr Tyr Ile Tyr Thr Tyr Ile His Ile Tyr Val Tyr Thr His Ile Tyr 118863 ACA CAC ACA TAT ATA CAC ACA CAC ATA TGT ATA TAC ACA CAC ATA TAT 910119 Thr His Thr Tyr Ile His Thr His Ile Cys Ile Tyr Thr His Ile Tyr 134911 ATA TAG ATA TAC ACA CAC ATA TAT TTT TTG TTT GTT TGT TTG TTT GTT 958135 Ile *** 136959 TGC GAT GGA GTC TCA CTC CAG CCT GGC CGA CAG AGC AAG ACT CCG TCT10061007 CAA AAA AAA AAA AGA TTG CAG TGA GCC ACG ATA GCA CCA CTG CAT TCC10541055 AGA CTG GGT GAC AGG GCA AGG CCG TCT CTC AAA GAA AAA AAG AAA CAA11021103 AGA TTT CCA TTC TGG CAG TCC ACC CCT TTT GTT TCC CCC ATT ATT AAC11501151 TTT ACT TCT CCC TCA TTA TTA GTT TTT ACT TTA TTT AAA TGT GTG TAT11981199 CTG CTC CCA TCT AAC CTA ACA CGA CTC TCT CTC TAG CAA AAA TAT TTG12461247 CAA TCT GCA GTC CCT TCC CCA AAG AGG GAT CCA CCC AAG CCT CGT ATT12941295 GTT GTG TCC ACC TCC AAG TTC AGG ATC TTT TGG TGA TAG ATC TTC TCT13421343 AGT GAA AAT GTC TTC AAA CAT AGC AAG AGG CTT TAA ATA CTG GGT ATC13901391 CAA AAA ATG ATA GGG GTC CTA AAA CCA GAT CCA GTT ACC TAC CTA TCA14381439 TCC AAG ACC TCG CTT GAG TCC TTT TGG GTG CTC CCA ACA TTA GTG TCG14861487 TAA AAC TAA ATA CAG GTG ATG TGA GCA GTT GTT CAC TGA TGA TTC TAA15341535 TGC TCT CTT GGA ATT CAT TGT TTC TCT GTT AGG GTG TTT CAT AGT CTT15821583 TGT GGC AAA AAT AGC ATT GCA TCA TTA AAA GTA TGT TAC TGT CTG GGC16301631 GTG GTG GCT GAA GCC TGT AAT CCC AGC ACT TTG GGA GGC CGA GGT GGG16781679 TGG ATC ACG AGC TCA GGA GAT CGA GAC CAT CCT GGC TAA CAC GGT GAA17261727 ACC CTG TCT CTA CTA AAA ATA CAA AAA ATT AGC CGG GCG TGG TGG TGG17741775 GCA CCT GTA GTC CCA GCT ACT CAG GAG GTT GAG GCA GGA GAA TGG CGT18221823 GAA CCT GGG AGG CGG AGC TGG CAG TGA GCC AAG ATC GCA CCA TTG CAC18701871 TCC AGC CTG GGC AAC ACA GTG AGA CTC CGT CTC AAA AAA AAA AAA AAA19181919 AAA AAA AAA AAA AAA AAA A 19377.PP7879A核苷酸序列(SEQ ID NO19)長度1545bp1 GGTGGAAGAG AGTATGTGTA TGTGTGTTCC TGTACATAGC ATGGGTGCAG CTGTGGATGT61 GTGCAAAAGA GTGTGAGTGT GTGTGTGTGT GTGTGTGTGT AAAGGGGTCT GTCCTAGAGC121 CCACATCAGT TTGTTGTGAA TCTGGAAAAA GGGTCGGTGA GGGCCGGGAG ATGTTGACCC181 TGGTGGGAGC AGGCTGAGGC TGCCCCGTTC TCCACATCCT CTGGTTTGCC CAGTCTCTGA241 TTCCATTAGG GGGAGTGTGC TGAAGCCATT CTCGGATGCT TCCCAGACCA GGCTCCCTCT301 GCCAGAGTCA CATGCATCCG AGCTGCTGGT CTCCATTGTC CAGCAGGAAG GCGGAAAGGC361 AGGCAAGATG GTGTGAAGCT TAAAGCTTGT ATTTGATGGA AAAGGTCTCC CCTGTTCATC421 TGAGAGGCCA AGCCTGGCCA CCCCAGGCTC AGAACCTGGG CTTCAAGAAA TGTGCTGGGA481 GCTCCTAACT TACACATCCC TCCAGCCTTC CTTGAATCCT CCCACCACCC CCTATTTTCC541 TTTAATTTCT CAGGTCTGCT CCCTCCTCCC CCAACCCCAC AGCTGGGCAA GAAGTCTGCA601 AAAGCTGCAT CTGCAGCTGT CTCTAACTCT TCCCAGCCAT CTCCCGTATT TTTTGGTACC661 TTGATTCCTT GACTCTTAAT AAGCCAAGCC ACCTTATCTC TGTAGTTCTT ATTTTTTTGT721 TGACTAAATT TGGGGGGTTC TTTTTTATGG TCATGTCACT GACCTATTAA ATTGGGGCTT781 GGTGCTTTTC CACCTTCCCC CTCTGAATGA AAGCCAAGGA ATGGGGGAAG AGCGGGAACT841 CTGCCACGGA GGTGGAGCAA GAACGGTGAA GGGCCCTGGT CCCAGAGAGG CTGGTGGGTC901 CCTCTCCCAA AGGAAGGCAG ACAGTCTCTG CTTTGCCTTG GACCTTGGTG CTTGGGGGTG961 GGGAGGCCCT GGGGGGGACA CTCCCCACTC CCATTCCCCT TCCTTTGTCC TAATCCTGGA1021 ATTAAGTACA GGGGTTTATA GGTTCTATTT CTTCCCAAGA GCCCTGCAAA GAACCCCAGT1081 TTCCTATTTG GATGCCCCTA CACTGTTGTG TTTCAGTGGA ATGTATTTTC ATTTAAAAAC1141 AACTTTGAAT GGGGCACTTT TTCTTTCCTG TTTTAAAAAT TGAAAAATTC TTACAGTACA1201AACAGGACTG TCAGGGTGGG GGTGTTGGTG CTGTAAGAGG TCACTCTTGA GTGCATTTTG1261GCACTGGGAT GGGATGGCTG GGGTGGGAAG ACCCCCATCC CCACCCCCAA CTTCTTTTCT1321AATATTTAAG GAGTGTTTTG TAGGATTCAA CAACCACCAC AACTTGAATT TGTATCATGG1381GAGGTGGGAG GGAGTGGCTT AGAGGTGTCT GCCTATGCTT AAAGCCAACT GTGGAAGTTT1441TGTTTTCCCT TTTTTGTATA ATAAAGTGAA AAACAAAGGT TTAAAAAAAA AAAAAAAAAA1501AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAB氨基酸序列(SEQ ID NO20) 長度120個(gè)氨基酸1 MGEERELCHG GGARTVKGPG PRFAGGSLSQ RKADSLCFAL DLGAWGWGGP GGDTPHSHSP61 SFVLILELST GVYRFYFFPR ALQRTPVSYL DAPTLLCFSG MYFHLKTTLN GALFLSCFKNC.核苷酸及氨基酸組合序列(SEQ ID NO21)克隆號 PP7879起始編碼子821 ATG終止編碼子1181 TGA蛋白質(zhì)分子量13001.161 G GTG GAA GAG AGT ATG TGT ATG TGT GTT CCT GTA CAT AGC ATG GGT 4647 GCA GCT GTG GAT GTG TGC AAA AGA GTG TGA GTG TGT GTG TGT GTG TGT 9495 GTG TGT AAA GGG GTC TGT CCT AGA GCC CAC ATC AGT TTG TTG TGA ATC 142143 TGG AAA AAG GGT CGG TGA GGG CCG GGA GAT GTT GAC CCT GGT GGG AGC 190191 AGG CTG AGG CTG CCC CGT TCT CCA CAT CCT CTG GTT TGC CCA GTC TCT 238239 GAT TCC ATT AGG GGG AGT GTG CTG AAG CCA TTC TCG GAT GCT TCC CAG 286287 ACC AGG CTC CCT CTG CCA GAG TCA CAT GCA TCC GAG CTG CTG GTC TCC 334335 ATT GTC CAG CAG GAA GGC GGA AAG GCA GGC AAG ATG GTG TGA AGC TTA 382383 AAG CTT GTA TTT GAT GGA AAA GGT CTC CCC TGT TCA TCT GAG AGG CCA 430431 AGC CTG GCC ACC CCA GGC TCA GAA CCT GGG CTT CAA GAA ATG TGC TGG 478479 GAG CTC CTA ACT TAC ACA TCC CTC CAG CCT TCC TTG AAT CCT CCC ACC 526527 ACC CCC TAT TTT CCT TTA ATT TCT CAG GTC TGC TCC CTC CTC CCC CAA 574575 CCC CAC AGC TGG GCA AGA AGT CTG CAA AAG CTG CAT CTG CAG CTG TCT 622623 CTA ACT CTT CCC AGC CAT CTC CCG TAT TTT TTG GTA CCT TGA TTC CTT 670671 GAC TCT TAA TAA GCC AAG CCA CCT TAT CTC TGT AGT TCT TAT TTT TTT 718719 GTT GAC TAA ATT TGG GGG GTT CTT TTT TAT GGT CAT GTC ACT GAC CTA 766767 TTA AAT TGG GGC TTG GTG CTT TTC CAC CTT CCC CCT CTG AAT GAA AGC 814815 CAA GGA ATG GGG GAA GAG CGG GAA CTC TGC CAC GGA GGT GGA GCA AGA 8621 Met Gly Glu Glu Arg Glu Leu Cys His Gly Gly Gly Ala Arg 14863 ACG GTG AAG GGC CCT GGT CCC AGA GAG GCT GGT GGG TCC CTC TCC CAA 91015 Thr Val Lys Gly Pro Gly Pro Arg Glu Ala Gly Gly Ser Leu Ser Gln 30911 AGG AAG GCA GAC AGT CTC TGC TTT GCC TTG GAC CTT GGT GCT TGG GGG 95831 Arg Lys Ala Asp Ser Leu Cys Phe Ala Leu Asp Leu Gly Ala Trp Gly 46959 TGG GGA GGC CCT GGG GGG GAC ACT CCC CAC TCC CAT TCC CCT TCC TTT100647 Trp Gly Gly Pro Gly Gly Asp Thr Pro His Ser His Ser Pro Ser Phe 621007 GTC CTA ATC CTG GAA TTA AGT ACA GGG GTT TAT AGG TTC TAT TTC TTC105463 Val Leu Ile Leu Glu Leu Ser Thr Gly Val Tyr Arg Phe Tyr Phe Phe 781055 CCA AGA GCC CTG CAA AGA ACC CCA GTT TCC TAT TTG GAT GCC CCT ACA110279 Pro Arg Ala Leu Gln Arg Thr Pro Val Ser Tyr Leu Asp Ala Pro Thr 941103 CTG TTG TGT TTC AGT GGA ATG TAT TTT CAT TTA AAA ACA ACT TTG AAT115095 Leu Leu Cys Phe Ser Gly Met Tyr Phe His Leu Lys Thr Thr Leu Asn 1101151 GGG GCA CTT TTT CTT TCC TGT TTT AAA AAT TGA AAA ATT CTT ACA GTA1198111 Gly Ala Leu Phe Leu Ser Cys Phe Lys Asn *** 1211199 CAA ACA GGA CTG TCA GGG TGG GGG TGT TGG TGC TGT AAG AGG TCA CTC12461247 TTG AGT GCA TTT TGG CAC TGG GAT GGG ATG GCT GGG GTG GGA AGA CCC12941295 CCA TCC CCA CCC CCA ACT TCT TTT CTA ATA TTT AAG GAG TGT TTT GTA13421343 GGA TTC AAC AAC CAC CAC AAC TTG AAT TTG TAT CAT GGG AGG TGG GAG13901391 GGA GTG GCT TAG AGG TGT CTG CCT ATG CTT AAA GCC AAC TGT GGA AGT14381439 TTT GTT TTC CCT TTT TTG TAT AAT AAA GTG AAA AAC AAA GGT TTA AAA14861487 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA15341535 AAA AAA AAA AA 15458.PP8376A核苷酸序列(SEQ ID NO22)長度1841bp1GTCTGATTGG GTGGTGTGGC GCAATGCGCG CGACCCTCAA GATACCAAAC TGTACGCATC61TCTGACCCTT TCCTCTCCTT GCTCCTGCTG GTAAACCGAA GCCCAGGAGA CTTCCAGGTT121TGGGCATCTG CAGAGGGCGA GGAACTGGTC ACGGCGCCGG GTGGGCTTGC AGCTGTGACG181CTTATGTGGA CACCTCAGTG TCGCTGGTGG TTCACCTCGG CTTCCCAGTT TATTTATTGA241CGTCAACAAA TAAATGTTGA ATAAGGAAGA AGAGTTAGAA TTGCTTGAAG CCCTCTGGAG301TTTTAGCACT AGTCCCGCCC ACTCCCTTCT ACTTCCAGGT CGGGGGGGGG CGGGTCCAAT361AGAAAGGCGG AAGCCAGTGT CCCAGGCGTT CTCACGCCCG CAACAATTCC TGAGTAGGGC421CTTGCTTGAG TTCTTCGGAA AGTCTCATCC ACCCCCACAT CGCCTCTTTA GGAAGTCACT481TAATGTTGGG CTTCATTATT CCCACATCCC TTTCCTTACT ACTTGCCTGC ACTTCTTGAG541AAAAAGACTG CAGAAAGGAG AGGTGGGGCT TTCAGTAGAA ACAAGCAAAC CGCAGGTCCC601TGTGGGGGGA CTCTCCAGGA AGAAGGTTCC GCAAGAACCG TGGGCGACAG TTATGGAGAA661GCGTCTGCAG GAGGCTCAGC TGTACAAGGA GGAAGGGAAC CAGCGCTACC GGGAAGGGAA721GTACCGAGAT GCTGTGAGTA GGTACCATCG AGCTCTGCTT CAGCTGCGGG GTCTGGATCC781GAGTCTGCCC TCTCCGTTAC CTAATCTCGG ACCTCAGGGC CCGGCCCTCA CGCCTGAACA841AGAAAACATA TTGCATACCA CCCAGACAGA CTGCTATAAC AATCTAGCTG TTGTGAAATA901GGGAGTGTTT CCCTTCTTAA TCATAAAAAG GCAGAACATT GACCTGAATT GCCTGAATTG961ACTCCTCTGC AGCTTGTCTC CTTCAGATGG AGCCCGTGAA CTACGAACGA GTGAGAGAAT1021ATAGTCAGAA AGTCCTGGAA CGACAGCCTG ATAATGCCAA GGCCTTGTAT CGGGCCGGAG1081TGGCCTTTTT CCATCTGCAG GACTATGACC AGGCCCGCCA CTACCTCCTG GCTGCCGTGA1141ATAGGCAGCC TAAAGGTAAG CAAGAAGGGC TTTGAAATGG TAAAGACAAA ATTGTCTTGC1201TGGGGTGGAT CTGTGGAAAG GGGGTTTTAT TTTACTTTGC CAATGTATTA TTTTCAATAA1261GTAATACATT CACATGGTTG AGAATTCGAA CTGAAAAAGT ATACGATGAA CAGACCTTTT1321TCCACTCTTG TGTTCTTGTC TCCACAGAAA AGCAGTATTA TTAGTTTCAT GTGTAGGGGG1381TTGATGCTTA ATCAGACATA CACAATATAT ATGTTGGTAT GTCTGTTTCA TATATGTATG1441TATGCCTATT CTAATATATA AATATATGTA TATCAACGTG CTTTTATTTA TAAATATACA1501GTGTATATAT TTATACATAT ACATGAATAT ATATATAAAA TAGGCAGGCC AGGTGGGGTG1561GCTCACATCT GTTATCTCAG CACTTTGGGA GACCAAAGTG GGTGGATCAC CTGAGGTCAG1621GAGTTTGAGA CCAGCCTGAC CAACATGGAG AAACCCCATC TCTACTAAAA ATACAAAATT1681AGCCAGGCAT GGTGGCGCAT GCCTGTAAAC CCAGCTACTC GGGAGGCTGA GGCAGGAGAA1741TTGCTTGAAC CCAGGAGGCG GAGGTTGCGG TGAGCCGAGA TCCTGGGCAA CAAGAACGAG1801ATTCTGTCTC CAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AB氨基酸序列(SEQ ID NO23) 長度215個(gè)氨基酸1MLNKEEELEL LEALWSFSTS PAHSLLLPGR GGAGPIERRK PVSQAFSRPQ QFLSRALLEF61FGKSHPPPHR LFRKSLNVGL HYSHIPFLTT CLHFLRKRLQ KGEVGLSVET SKPQVPVGGL121SRKKVPQEPW ATVMEKRLQE AQLYKEEGNQ RYREGKYRDA VSRYHRALLQ LRGLDPSLPS181PLPNLGPQGP ALTPEQENIL HTTQTDCYNN LAVVKC.核苷酸及氨基酸組合序列(SEQ ID NO24)克隆號PP8376起始編碼子254 ATG終止編碼子899 TAG蛋白質(zhì)分子量24371.771G TCT GAT TGG GTG GTG TGG CGC AAT GCG CGC GAC CCT CAA GAT ACC 4647 AAA CTG TAC GCA TCT CTG ACC CTT TCC TCT CCT TGC TCC TGC TGG TAA 9495 ACC GAA GCC CAG GAG ACT TCC AGG TTT GGG CAT CTG CAG AGG GCG AGG 142143 AAC TGG TCA CGG CGC CGG GTG GGC TTG CAG CTG TGA CGC TTA TGT GGA 190191 CAC CTC AGT GTC GCT GGT GGT TCA CCT CGG CTT CCC AGT TTA TTT ATT 238239 GAC GTC AAC AAA TAA ATG TTG AAT AAG GAA GAA GAG TTA GAA TTG CTT 2861 Met Leu Asn Lys Glu Glu Glu Leu Glu Leu Leu 11287 GAA GCC CTC TGG AGT TTT AGC ACT AGT CCC GCC CAC TCC CTT CTA CTT 33412 Glu Ala Leu Trp Ser Phe Ser Thr Ser Pro Ala His Ser Leu Leu Leu 27335 CCA GGT CGG GGG GGG GCG GGT CCA ATA GAA AGG CGG AAG CCA GTG TCC 38228 Pro Gly Arg Gly Gly Ala Gly Pro Ile Glu Arg Arg Lys Pro Val Ser 43383 CAG GCG TTC TCA CGC CCG CAA CAA TTC CTG AGT AGG GCC TTG CTT GAG 43044 Gln Ala Phe Ser Arg Pro Gln Gln Phe Leu Ser Arg Ala Leu Leu Glu 59431 TTC TTC GGA AAG TCT CAT CCA CCC CCA CAT CGC CTC TTT AGG AAG TCA 47860 Phe Phe Gly Lys Ser His Pro Pro Pro His Arg Leu Phe Arg Lys Ser 75479 CTT AAT GTT GGG CTT CAT TAT TCC CAC ATC CCT TTC CTT ACT ACT TGC 52676 Leu Asn Val Gly Leu His Tyr Ser His Ile Pro Phe Leu Thr Thr Cys 91527 CTG CAC TTC TTG AGA AAA AGA CTG CAG AAA GGA GAG GTG GGG CTT TCA 57492 Leu His Phe Leu Arg Lys Arg Leu Gln Lys Gly Glu Val Gly Leu Ser 107575 GTA GAA ACA AGC AAA CCG CAG GTC CCT GTG GGG GGA CTC TCC AGG AAG 622108 Val Glu Thr Ser Lys Pro Gln Val Pro Val Gly Gly Leu Ser Arg Lys 123623 AAG GTT CCG CAA GAA CCG TGG GCG ACA GTT ATG GAG AAG CGT CTG CAG 670124 Lys Val Pro Gln Glu Pro Trp Ala Thr Val Met Glu Lys Arg Leu Gln 139671 GAG GCT CAG CTG TAC AAG GAG GAA GGG AAC CAG CGC TAC CGG GAA GGG 718140 Glu Ala Gln Leu Tyr Lys Glu Glu Gly Asn Gln Arg Tyr Arg Glu Gly 155719 AAG TAC CGA GAT GCT GTG AGT AGG TAC CAT CGA GCT CTG CTT CAG CTG 766156 Lys Tyr Arg Asp Ala Val Ser Arg Tyr His Arg Ala Leu Leu Gln Leu 171767 CGG GGT CTG GAT CCG AGT CTG CCC TCT CCG TTA CCT AAT CTC GGA CCT 814172 Arg Gly Leu Asp Pro Ser Leu Pro Ser Pro Leu Pro Asn Leu Gly Pro 187815 CAG GGC CCG GCC CTC ACG CCT GAA CAA GAA AAC ATA TTG CAT ACC ACC 862188 Gln Gly Pro Ala Leu Thr Pro Glu Gln Glu Asn Ile Leu His Thr Thr 203863 CAG ACA GAC TGC TAT AAC AAT CTA GCT GTT GTG AAA TAG GGA GTG TTT 910204 Gln Thr Asp Cys Tyr Asn Asn Leu Ala Val Val Lys *** 216911 CCC TTC TTA ATC ATA AAA AGG CAG AAC ATT GAC CTG AAT TGC CTG AAT 958959 TGA CTC CTC TGC AGC TTG TCT CCT TCA GAT GGA GCC CGT GAA CTA CGA10061007ACG AGT GAG AGA ATA TAG TCA GAA AGT CCT GGA ACG ACA GCC TGA TAA10541055TGC CAA GGC CTT GTA TCG GGC CGG AGT GGC CTT TTT CCA TCT GCA GGA11021103CTA TGA CCA GGC CCG CCA CTA CCT CCT GGC TGC CGT GAA TAG GCA GCC11501151TAA AGG TAA GCA AGA AGG GCT TTG AAA TGG TAA AGA CAA AAT TGT CTT11981199GCT GGG GTG GAT CTG TGG AAA GGG GGT TTT ATT TTA CTT TGC CAA TGT12461247ATT ATT TTC AAT AAG TAA TAC ATT CAC ATG GTT GAG AAT TCG AAC TGA12941295AAA AGT ATA CGA TGA ACA GAC CTT TTT CCA CTC TTG TGT TCT TGT CTC13421343CAC AGA AAA GCA GTA TTA TTA GTT TCA TGT GTA GGG GGT TGA TGC TTA13901391ATC AGA CAT ACA CAA TAT ATA TGT TGG TAT GTC TGT TTC ATA TAT GTA14381439TGT ATG CCT ATT CTA ATA TAT AAA TAT ATG TAT ATC AAC GTG CTT TTA14861487TTT ATA AAT ATA CAG TGT ATA TAT TTA TAC ATA TAC ATG AAT ATA TAT15341535ATA AAA TAG GCA GGC CAG GTG GGG TGG CTC ACA TCT GTT ATC TCA GCA15821583CTT TGG GAG ACC AAA GTG GGT GGA TCA CCT GAG GTC AGG AGT TTG AGA16301631CCA GCC TGA CCA ACA TGG AGA AAC CCC ATC TCT ACT AAA AAT ACA AAA16781679TTA GCC AGG CAT GGT GGC GCA TGC CTG TAA ACC CAG CTA CTC GGG AGG17261727CTG AGG CAG GAG AAT TGC TTG AAC CCA GGA GGC GGA GGT TGC GGT GAG17741775CCG AGA TCC TGG GCA ACA AGA ACG AGA TTC TGT CTC CAA AAA AAA AAA18221823AAA AAA AAA AAA AAA AAA A 18419.PP10029A核苷酸序列(SEQ ID NO25)長度1738bp1GGGTGGGTGC CTGATGAGCG GTGCTTCCCT CATATGATAT GTGGGCACCC TGAAGCTCTC61ACGTAATGGT TCTGCTGTGC CGGGTTGTGA CCCAGCTGTC CTTGGTAGGC TCTCCTGTTT121AATGAGCAAC TGCTATATGC CAGGCCCTGT TCTAGAAACA GATGAGGCCC CTGTTCCCAT181GGAACTTAGA TCTGAGTATG TGGACAGAGT GAGTAGGTTG CCAGATAATG TCAGAGGTAA241GAAAAAAGCC AGGCAGAGGA CAGCAGTGCT GGTTTAGACA AGGGTTGGCA AGGCCTCCCT301GATAAGGGGA CGTATTTGCG CAGACACGGA AGCAGTCTGA TGGAAGGCTT GCCCTGTAGG361GACCTGGGGT GCAGACTGAG CTGGGAGGGC TCTTGGCTTG CTCCAATGAG GTAGGGGCGA421AGAGAGGGCA GAATGGCCCC CGTGCTGGTC CAGATGTGGC CAGCGCCAGA TCGTATAGAG481CCGTGGAGGC ACGGTAAGGA CTTGGGGTTT GAGGGAGATG AGGGCCCTGA GCAGGGGTGC541CATGATCTAG CCTCTGCTCC AGAAGGATCT GTCTGGCTGC CATGTGGGGG ACACGGAGTG601GAGCAAAGAC GGGAGCCCAG TGAGAGTCGA GGGAGAGGTG ACCTCAGCTT GGGCTGCGGT661GCAGGCCATG GGACTGGCAG GAGGTGGCTG GGGTTACGCT GTCTTTTCTA ACATTCAGCA721TTGGCTCAGG GGCCAGGTCA GGGCTCACAG ACTGTTGCTA TAAAGGGCTG GGTGGCTTTC781TTCCCCACAG CTACTCAGCC TAATGCCATT GCAGAGCACA TGTAGCCATG GACAACACAA841GGGGCGTATC CGTGTTCCAG GACAGCCATA TTGACAGGAA TAGGCAGGAG GCCAGATTTG901GTCCTCAGGC TGTAATTTCT TGGCCCCTTG TCTAGGGAGA GGTAAACGAG GGGAGGAGAG961ATCAGTCAAG GATGACGTGA GGGTTTGCTG GGAGCACCAG GAATCCTGGA GAAGGTAGTG1021GCAAGAGGGT GCAGCAAGCT CAGCTGGGCG GGGATCAAGT CTGAGGACTT AATGTCTCCT1081CTGATCTCCA GACCCATAAG GGAGATGCTG AGTAGACAAC TGGGGCTTAT GGGTCTGGAG1141TTCAGAGGAG AGATCGGGAA GGTGTCCATT TGGAGTCATC CACGCAGAGA TGTGTGAAGG1201CTGCTCAATG ATTTTGAGGT TTAAAGAAAA AAAGAGATGT GAAACCAGGG GCCCTGATGA1261GGCTGCCCAG GTGGTAAGGA AGACAGAAGA GAAGCCATGG GACAGCTGAG CCCGGGCACC1321CTCAAGCCTT GGAGGCATGA AGTTTGGTGG GGATCTGGCA AAGAACACCT GGGAGCAGCC1381AGCGGGCAGC AGACCCCAGA GTAGCAGGGA AGACAAGCAC TTCAAAGAGG CAGCGTCAGC1441CAGGGGCAGT GGCTCAGCTG TAATCCTAGC ACTTTGGGAG GCCAAGGATG GCAGATCACC1501TGAGGTTAGG GGTTCGAGAC TAGCCTGGCC AACATGGTGA AACCCTGTCT CTACTAAAAA1561TAAAAAATTA GCCAGGCATT GGTGGTATGT GCCTGTAATC CCAGCTACTC GAGAGGCTGA1621GGCAGGAGAA TCTCTTGAAC CCGGGAGGCA GAGGTTGCAG TGAGCCGAGA TCATGCCATT1681GCACTCCAGC CTGGGCAACA AGAGCGAAAC TCCGTCTCAA AAAAAAAAAA AAAAAAAAB氨基酸序列(SEQ ID NO26) 長度92個(gè)氨基酸1 MAPVLVQMWP APDRIEPWRH GKDLGFEGDE GPEQGCHDLA SAPEGSVWLP CGGHGVEQRR61 EPSESRGRGD LSLGCGAGHG TGRRWLGLRC LFC.核苷酸及氨基酸組合序列(SEQ ID NO27)克隆號PP10029起始編碼子433 ATG終止編碼子709 TAA蛋白質(zhì)分子量9973.671 GGG TGG GTG CCT GAT GAG CGG TGC TTC CCT CAT ATG ATA TGT GGG CAC 4849 CCT GAA GCT CTC ACG TAA TGG TTC TGC TGT GCC GGG TTG TGA CCC AGC 9697 TGT CCT TGG TAG GCT CTC CTG TTT AAT GAG CAA CTG CTA TAT GCC AGG 144145 CCC TGT TCT AGA AAC AGA TGA GGC CCC TGT TCC CAT GGA ACT TAG ATC 192193 TGA GTA TGT GGA CAG AGT GAG TAG GTT GCC AGA TAA TGT CAG AGG TAA 240241 GAA AAA AGC CAG GCA GAG GAC AGC AGT GCT GGT TTA GAC AAG GGT TGG 288289 CAA GGC CTC CCT GAT AAG GGG ACG TAT TTG CGC AGA CAC GGA AGC AGT 336337 CTG ATG GAA GGC TTG CCC TGT AGG GAC CTG GGG TGC AGA CTG AGC TGG 384385 GAG GGC TCT TGG CTT GCT CCA ATG AGG TAG GGG CGA AGA GAG GGC AGA 432433 ATG GCC CCC GTG CTG GTC CAG ATG TGG CCA GCG CCA GAT CGT ATA GAG 4801 Met Ala Pro Val Leu Val Gln Met Trp Pro Ala Pro Asp Arg Ile Glu 16481 CCG TGG AGG CAC GGT AAG GAC TTG GGG TTT GAG GGA GAT GAG GGC CCT 52817 Pro Trp Arg His Gly Lys Asp Leu Gly Phe Glu Gly Asp Glu Gly Pro 32529 GAG CAG GGG TGC CAT GAT CTA GCC TCT GCT CCA GAA GGA TCT GTC TGG 57633 Glu Gln Gly Cys His Asp Leu Ala Ser Ala Pro Glu Gly Ser Val Trp 48577 CTG CCA TGT GGG GGA CAC GGA GTG GAG CAA AGA CGG GAG CCC AGT GAG 62449 Leu Pro Cys Gly Gly His Gly Val Glu Gln Arg Arg Glu Pro Ser Glu 64625 AGT CGA GGG AGA GGT GAC CTC AGC TTG GGC TGC GGT GCA GGC CAT GGG 67265 Ser Arg Gly Arg Gly Asp Leu Ser Leu Gly Cys Gly Ala Gly His Gly 80673 ACT GGC AGG AGG TGG CTG GGG TTA CGC TGT CTT TTC TAA CAT TCA GCA 72081 Thr Gly Arg Arg Trp Leu Gly Leu Arg Cys Leu Phe *** 93721 TTG GCT CAG GGG CCA GGT CAG GGC TCA CAG ACT GTT GCT ATA AAG GGC 768769 TGG GTG GCT TTC TTC CCC ACA GCT ACT CAG CCT AAT GCC ATT GCA GAG 816817 CAC ATG TAG CCA TGG ACA ACA CAA GGG GCG TAT CCG TGT TCC AGG ACA 864865 GCC ATA TTG ACA GGA ATA GGC AGG AGG CCA GAT TTG GTC CTC AGG CTG 912913 TAA TTT CTT GGC CCC TTG TCT AGG GAG AGG TAA ACG AGG GGA GGA GAG 960961 ATC AGT CAA GGA TGA CGT GAG GGT TTG CTG GGA GCA CCA GGA ATC CTG10081009 GAG AAG GTA GTG GCA AGA GGG TGC AGC AAG CTC AGC TGG GCG GGG ATC10561057 AAG TCT GAG GAC TTA ATG TCT CCT CTG ATC TCC AGA CCC ATA AGG GAG11041105 ATG CTG AGT AGA CAA CTG GGG CTT ATG GGT CTG GAG TTC AGA GGA GAG11521153 ATC GGG AAG GTG TCC ATT TGG AGT CAT CCA CGC AGA GAT GTG TGA AGG12001201 CTG CTC AAT GAT TTT GAG GTT TAA AGA AAA AAA GAG ATG TGA AAC CAG12481249 GGG CCC TGA TGA GGC TGC CCA GGT GGT AAG GAA GAC AGA AGA GAA GCC12961297 ATG GGA CAG CTG AGC CCG GGC ACC CTC AAG CCT TGG AGG CAT GAA GTT13441345 TGG TGG GGA TCT GGC AAA GAA CAC CTG GGA GCA GCC AGC GGG CAG CAG13921393 ACC CCA GAG TAG CAG GGA AGA CAA GCA CTT CAA AGA GGC AGC GTC AGC14401441 CAG GGG CAG TGG CTC AGC TGT AAT CCT AGC ACT TTG GGA GGC CAA GGA14881489 TGG CAG ATC ACC TGA GGT TAG GGG TTC GAG ACT AGC CTG GCC AAC ATG15361537 GTG AAA CCC TGT CTC TAC TAA AAA TAA AAA ATT AGC CAG GCA TTG GTG15841585 GTA TGT GCC TGT AAT CCC AGC TAC TCG AGA GGC TGA GGC AGG AGA ATC16321633 TCT TGA ACC CGG GAG GCA GAG GTT GCA GTG AGC CGA GAT CAT GCC ATT16801681 GCA CTC CAG CCT GGG CAA CAA GAG CGA AAC TCC GTC TCA AAA AAA AAA 17281729 AAA AAA AAA A 173810.SP2114bA核苷酸序列(SEQ ID NO28)長度1980bp1CTCTTCTTCC CAAAGTCCTG GTCAGTTCCC CAGAAAGGAC CAGTCATGGC TGTGCAGGGT61GACTGCCCTC CCCCAGGTCA GCCCTGTCGA CAAAGGCAGG GGCTTGGTTG TCATTTCCAC121CAAGTGGGAA GACAGTATTA ATAGATGGAG AACCCTCTGC AGTGGGAAGA TTTCAGCAAT181GGGCAAGCTG GATAGAGCCG TGGTTAGGAT GGAGTTGTTT GCTTGTTGCA CTTGGAGCTC241TTTATGAAGC AAGGGCTCTG CCTCCCAGCC TGAGACCCAG ACCCTGGTTT GGACCCAGTA301GAACTCTTGT GGGCCCTGGG TTGGTGTCTC TGAGCAAATC CCCAAAGCAG GAGAGTCCCT361AGCACCGTGA GCTCTGTCAG AACCTCCCAG CTGGCCTTCC TTCTGCCCTC ATTGACAACC421CTCTGACCCT CTTGCTGAGC ATAGACACAT ATGTGATGTT ACAGGAGCCA GTGACCTTCC481AGGATGTGGC TGTGGACTTC AGCCGGGAGG AGTGGGGGCT GCTGGGCCCG ACACAGAGGA541CCGAGTACCG CGATGTGATG CTGGAGACCT TTGGGCACCT GGTCTCTGTG GGGTGGGAGA601CTACACTGGA AAATAAAGAG TTAGCTCCAA ATTCTGACAT TCCTGAGGAA GAACCAGCCC661CCAGCCTGAA AGTACAAGAA TCCTCAAGGG ATTGTGCCTT GTCCTCTACA TTAGAAGATA721CCTTGCAGGG TGGGGTCCAG GAAGTCCAAG ACACAGTGTT GAAGCAGATG GAGTCTGCTC781AGGAAAAAGA CCTTCCTCAG AAGAAGCACT TTGACAACCG TGAGTCCCAG GCAAACAGTG841GTGCTCTTGA CACAAACCAA GTTTCGCTCC AGAAAATTGA CAACCCTGAG TCCCAGGCAA901ACAGTGGCGC TCTTGACACA AACCAAGTTT TGCTCCACAA AATTCCTCCT AGAAAACGAT961TGCGCAAACG TGACTCACAA GTTAAAAGTA TGAAACATAA TTCACGTGTA AAAATTCATC1021AGAAGAGCTG TGAAAGGCAA AAGGCCAAGG AAGGCAATGG TTGTAGGAAA ACCTTCAGTC1081GGAGTACTAA ACAGATTACG TTTATAAGAA TTCACAAGGG GAGCCAAGTT TGCCGATGCA1141GTGAATGTGG TAAAATATTC CGGAACCCAA GATACTTTTC TGTGCATAAG AAAATCCATA1201CCGGAGAGAG GCCCTATGTG TGTCAAGACT GTGGGAAAGG ATTTGTTCAG AGCTCTTCCC1261TCACACAGCA TCAGAGAGTT CATTCTGGAG AGAGACCATT TGAATGTCAG GAGTGTGGGA1321GGACCTTCAA TGATCGCTCA GCCATCTCCC AGCACCTGAG GACTCACACT GGCGCTAAGC1381CCTACAAGTG TCAGGACTGT GGAAAAGCCT TCCGCCAGAG TTCCCACCTC ATCAGACATC1441AGAGGACTCA CACCGGGGAG CGCCCATATG CATGCAACAA ATGTGGAAAG GCCTTCACCC1501AGAGCTCACA CCTTATTGGG CACCAGAGAA CCCACAATAG GACAAAGCGA AAGAAGAAAC1561AGCCTACCTC ATAGCTCTCA AGCCAGTTGA AGAAACCTTG CCTTTTCAGC TTGACCCTGC1621AATATAACAT GCACAGGCCT GCTTGTGAAT CAGGACTGAA TGTGAAAGGG AAGTATTGAG1681TGAGGACATT CCCAAAACCA AAGGACAACT GAGGAGACTG CCCAGCACAT AATGAATAAA1741TAAGAAAATG AGTGAGGAGT TATTAACATC ATTTGGAAAA AAGATTTCCC ATTCACTTGA1801TATTGTTTGT TCACTCATTT AGTCATTAAA AGTGAGATTA ATAAAATCTG AAAATGTTAT1861ATAATAACTT TAAAAAGCCA GGTAATTAAT AATCTGCACT GATATTACAT CCACAGTACC1921ACAGTATTTA TGTGTATGAA TTAAGGATTA AAAGATAATG TGGATAAAAA AAAAAAAAAAB氨基酸序列(SEQ ID NO29)長度372個(gè)氨基酸1MLQEPVTFQD VAVDFSREEW GLLGPTQRTE YRDVMLETFG HLVSVGWETT LENKELAPNS61DIPEEEPAPS LKVQESSRDC ALSSTLEDTL QGGVQEVQDT VLKQMESAQE KDLPQKKHFD121NRESQANSGA LDTNQVSLQK IDNPESQANS GALDTNQVLL HKIPPRKRLR KRDSQVKSMK181HNSRVKIHQK SCERQKAKEG NGCRKTFSRS TKQITFIRIH KGSQVCRCSE CGKIFRNPRY241FSVHKKIHTG ERPYVCQDCG KGFVQSSSLT QHQRVHSGER PFECQECGRT FNDRSAISQH301LRTHTGAKPY KCQDCGKAFR QSSHLIRHQR THTGERPYAC NKCGKAFTQS SHLIGHQRTH361NRTKRKKKQP TSC.核苷酸及氨基酸組合序列(SEQ ID NO30)克隆號 SP2114b起始編碼子456 ATG終止編碼子1572 TAG蛋白質(zhì)分子量42445.771 CT CTT CTT CCC AAA GTC CTG GTC AGT TCC CCA GAA AGG ACC AGT CAT 4748 GGC TGT GCA GGG TGA CTG CCC TCC CCC AGG TCA GCC CTG TCG ACA AAG 9596 GCA GGG GCT TGG TTG TCA TTT CCA CCA AGT GGG AAG ACA GTA TTA ATA 143144 GAT GGA GAA CCC TCT GCA GTG GGA AGA TTT CAG CAA TGG GCA AGC TGG 191192 ATA GAG CCG TGG TTA GGA TGG AGT TGT TTG CTT GTT GCA CTT GGA GCT 239240 CTT TAT GAA GCA AGG GCT CTG CCT CCC AGC CTG AGA CCC AGA CCC TGG 287288 TTT GGA CCC AGT AGA ACT CTT GTG GGC CCT GGG TTG GTG TCT CTG AGC 335336 AAA TCC CCA AAG CAG GAG AGT CCC TAG CAC CGT GAG CTC TGT CAG AAC 383384 CTC CCA GCT GGC CTT CCT TCT GCC CTC ATT GAC AAC CCT CTG ACC CTC 431432 TTG CTG AGC ATA GAC ACA TAT GTG ATG TTA CAG GAG CCA GTG ACC TTC 4791 Met Leu Gln Glu Pro Val Thr Phe 8480 CAG GAT GTG GCT GTG GAC TTC AGC CGG GAG GAG TGG GGG CTG CTG GGC 5279 Gln Asp Val Ala Val Asp Phe Ser Arg Glu Glu Trp Gly Leu Leu Gly 24528 CCG ACA CAG AGG ACC GAG TAC CGC GAT GTG ATG CTG GAG ACC TTT GGG 57525 Pro Thr Gln Arg Thr Glu Tyr Arg Asp Val Met Leu Glu Thr Phe Gly 40576 CAC CTG GTC TCT GTG GGG TGG GAG ACT ACA CTG GAA AAT AAA GAG TTA 62341 His Leu Val Ser Val Gly Trp Glu Thr Thr Leu Glu Asn Lys Glu Leu 56624 GCT CCA AAT TCT GAC ATT CCT GAG GAA GAA CCA GCC CCC AGC CTG AAA 67157 Ala Pro Asn Ser Asp Ile Pro Glu Glu Glu Pro Ala Pro Ser Leu Lys 72672 GTA CAA GAA TCC TCA AGG GAT TGT GCC TTG TCC TCT ACA TTA GAA GAT 71973 Val Gln Glu Ser Ser Arg Asp Cys Ala Leu Ser Ser Thr Leu Glu Asp 88720 ACC TTG CAG GGT GGG GTC CAG GAA GTC CAA GAC ACA GTG TTG AAG CAG 76789 Thr Leu Gln Gly Gly Val Gln Glu Val Gln Asp Thr Val Leu Lys Gln 104768 ATG GAG TCT GCT CAG GAA AAA GAC CTT CCT CAG AAG AAG CAC TTT GAC 815105 Met Glu Ser Ala Gln Glu Lys Asp Leu Pro Gln Lys Lys His Phe Asp 120816 AAC CGT GAG TCC CAG GCA AAC AGT GGT GCT CTT GAC ACA AAC CAA GTT 863121 Asn Arg Glu Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr Asn Gln Val 136864 TCG CTC CAG AAA ATT GAC AAC CCT GAG TCC CAG GCA AAC AGT GGC GCT 911137 Ser Leu Gln Lys Ile Asp Asn Pro Glu Ser Gln Ala Asn Ser Gly Ala 152912 CTT GAC ACA AAC CAA GTT TTG CTC CAC AAA ATT CCT CCT AGA AAA CGA 959153 Leu Asp Thr Asn Gln Val Leu Leu His Lys Ile Pro Pro Arg Lys Arg 168960 TTG CGC AAA CGT GAC TCA CAA GTT AAA AGT ATG AAA CAT AAT TCA CGT1007169 Leu Arg Lys Arg Asp Ser Gln Val Lys Ser Met Lys His Asn Ser Arg 1841008 GTA AAA ATT CAT CAG AAG AGC TGT GAA AGG CAA AAG GCC AAG GAA GGC1055185 Val Lys Ile His Gln Lys Ser Cys Glu Arg Gln Lys Ala Lys Glu Gly 2001056 AAT GGT TGT AGG AAA ACC TTC AGT CGG AGT ACT AAA CAG ATT ACG TTT1103201 Asn Gly Cys Arg Lys Thr Phe Ser Arg Ser Thr Lys Gln Ile Thr Phe 2161104 ATA AGA ATT CAC AAG GGG AGC CAA GTT TGC CGA TGC AGT GAA TGT GGT1151217 Ile Arg Ile His Lys Gly Ser Gln Val Cys Arg Cys Ser Glu Cys Gly 2321152 AAA ATA TTC CGG AAC CCA AGA TAC TTT TCT GTG CAT AAG AAA ATC CAT1199233 Lys Ile Phe Arg Asn Pro Arg Tyr Phe Ser Val His Lys Lys Ile His 2481200 ACC GGA GAG AGG CCC TAT GTG TGT CAA GAC TGT GGG AAA GGA TTT GTT1247249 Thr Gly Glu Arg Pro Tyr Val Cys Gln Asp Cys Gly Lys Gly Phe Val 2641248 CAG AGC TCT TCC CTC ACA CAG CAT CAG AGA GTT CAT TCT GGA GAG AGA1295265 Gln Ser Ser Ser Leu Thr Gln His Gln Arg Val His Ser Gly Glu Arg 2801296 CCA TTT GAA TGT CAG GAG TGT GGG AGG ACC TTC AAT GAT CGC TCA GCC1343281 Pro Phe Glu Cys Gln Glu Cys Gly Arg Thr Phe Asn Asp Arg Ser Ala 2961344 ATC TCC CAG CAC CTG AGG ACT CAC ACT GGC GCT AAG CCC TAC AAG TGT1391297 Ile Ser Gln His Leu Arg Thr His Thr Gly Ala Lys Pro Tyr Lys Cys 3121392 CAG GAC TGT GGA AAA GCC TTC CGC CAG AGT TCC CAC CTC ATC AGA CAT1439313 Gln Asp Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Ile Arg His 3281440 CAG AGG ACT CAC ACC GGG GAG CGC CCA TAT GCA TGC AAC AAA TGT GGA1487329 Gln Arg Thr His Thr Gly Glu Arg Pro Tyr Ala Cys Asn Lys Cys Gly 3441488 AAG GCC TTC ACC CAG AGC TCA CAC CTT ATT GGG CAC CAG AGA ACC CAC1535345 Lys Ala Phe Thr Gln Ser Ser His Leu Ile Gly His Gln Arg Thr His 3601536 AAT AGG ACA AAG CGA AAG AAG AAA CAG CCT ACC TCA TAG CTC TCA AGC1583361 Asn Arg Thr Lys Arg Lys Lys Lys Gln Pro Thr Ser *** 3731584 CAG TTG AAG AAA CCT TGC CTT TTC AGC TTG ACC CTG CAA TAT AAC ATG16311632 CAC AGG CCT GCT TGT GAA TCA GGA CTG AAT GTG AAA GGG AAG TAT TGA16791680 GTG AGG ACA TTC CCA AAA CCA AAG GAC AAC TGA GGA GAC TGC CCA GCA17271728 CAT AAT GAA TAA ATA AGA AAA TGA GTG AGG AGT TAT TAA CAT CAT TTG17751776 GAA AAA AGA TTT CCC ATT CAC TTG ATA TTG TTT GTT CAC TCA TTT AGT18231824 CAT TAA AAG TGA GAT TAA TAA AAT CTG AAA ATG TTA TAT AAT AAC TTT18711872 AAA AAG CCA GGT AAT TAA TAA TCT GCA CTG ATA TTA CAT CCA CAG TAC19191920 CAC AGT ATT TAT GTG TAT GAA TTA AGG ATT AAA AGA TAA TGT GGA TAA19671968 AAA AAA AAA AAA A 1980在本發(fā)明提及的所有文獻(xiàn)都在本申請中引用作為參考,就如同每一篇文獻(xiàn)被單獨(dú)引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請所附權(quán)利要求書所限定的范圍。
權(quán)利要求
1.一種分離的具有促進(jìn)癌細(xì)胞生長功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ IDNO29;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權(quán)利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼如權(quán)利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補(bǔ)的多核苷酸。
4.如權(quán)利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ IDNO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。
5.如權(quán)利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ ID NO12、SEQ ID NO15、SEQID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30的編碼區(qū)序列或全長序列。
6.一種載體,其特征在于,它含有權(quán)利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細(xì)胞,其特征在于,它是選自下組的一種宿主細(xì)胞(a)用權(quán)利要求6所述的載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞;(b)用權(quán)利要求3所述的多核苷酸轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞。
8.一種具有促進(jìn)癌細(xì)胞生長功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達(dá)具有促進(jìn)癌細(xì)胞生長功能的人蛋白的條件下,培養(yǎng)權(quán)利要求7所述的宿主細(xì)胞;(b)從培養(yǎng)物中分離出具有促進(jìn)癌細(xì)胞生長功能的人蛋白活性的多肽。
9.一種能與權(quán)利要求1所述的具有促進(jìn)癌細(xì)胞生長功能的人蛋白特異性結(jié)合的抗體。
10.一種核酸分子,它含有權(quán)利要求3所述的多核苷酸中連續(xù)的10-800個(gè)核苷酸。
全文摘要
本發(fā)明公開了一類新的具有促進(jìn)癌細(xì)胞生長功能的人蛋白,編碼此多肽的多核苷酸和經(jīng)重組技術(shù)產(chǎn)生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有促進(jìn)癌細(xì)胞生長功能的人蛋白的多核苷酸的用途。
文檔編號C12P21/00GK1351082SQ0012710
公開日2002年5月29日 申請日期2000年10月31日 優(yōu)先權(quán)日2000年10月31日
發(fā)明者顧健人 申請人:上海市腫瘤研究所