專利名稱:與早老性癡呆病有關的基因序列和蛋白及其用途的制作方法
技術領域:
本發(fā)明主要涉及與早老性癡呆病有關的神經病學和生理學功能失調。更具體地說,本發(fā)明涉及鑒定、分離并克隆與早老性癡呆病有關的基因以及其轉錄本、基因產物、有關的序列資料和相關基因。本發(fā)明還涉及檢測并診斷這些基因的正常和突變等位基因的載體的方法、涉及檢測并診斷早老性癡呆病的方法、涉及鑒定與早老性癡呆有關的或與早老性癡呆基因和蛋白相互作用的基因和蛋白的方法、涉及篩選潛在的早老性癡呆病療法的方法、涉及治療早老性癡呆病的方法,還涉及用于篩選并評估對治療早老性癡呆病有效的細胞系和動物模型。
背景技術:
為了便于參考各種期刊文章,在本發(fā)明說明書后列出了所述文章。
早老性癡呆病(AD)是人中樞神經系統(tǒng)的衰退性紊亂,其特征在于在中年到老年期間,有進行性記憶損傷,而且認識和智力衰退(Katzman,1986)。該病伴有神經病理學特征的出現(xiàn),其中主要是出現(xiàn)了細胞外淀粉樣或衰老斑以及神經元的神經纖維衰退。該病的病因很復雜,盡管在某些家族中,它是以常染色體顯性特征遺傳的。但是,甚至在AD的這些遺傳形式中,有至少三種不同的基因,它們賦予對該病的遺傳敏感性(St.George-Hyslop等,1990)。在晚年發(fā)作的顯著比例的病例中,阿撲脂蛋白(ApoE)基因的ε4(C112R)等位基因多態(tài)性也與AD有關(Saunders等,1993;Strittmatter等,1993)。同樣,很小比例的在65歲前發(fā)作的家族病例也與β-淀粉樣前體蛋白(APP)基因的突變有關(Chartier-Harlin等,1991;Goate等,1991;Murrell等,1991;Karlinsky等,1992;Mullan等,1992)。最近將與許多早期發(fā)作AD病例有關的第三座位(AD3)定位在染色體14q24.3(Schellenberg等,1992;St.George-Hyslop等,1992;Van Broeckhoven等,1992)。
盡管染色體14q區(qū)攜帶了數(shù)個基因,所述基因可以作為與AD3有關的突變位點的候選基因(例如cFOS,α-1-抗胰凝乳蛋白酶和組織蛋白酶G),但是根據(jù)其在AD3區(qū)外的物理位置和/或在其相應的開放閱讀框架中沒有突變而排除了這些候選基因中的大部分(Schellenberg等,1992;VanBroeckhoven等,1992;Rogaev等,1993;Wong等,1993)。
在早老性癡呆病的治療和診斷方面,已經有一些研究和商業(yè)方法或策略。公開的PCT申請WO94/23049描述了將高分子量YAC DNA轉染到特異性小鼠細胞中。用該方法分析了許多基因結合物。例如,轉基因小鼠APP基因的量可能會增加,這樣模擬了在先天愚型綜合征中普遍存在的三體性狀況,而且可以產生帶有β-淀粉樣變的動物模型,這種β-淀粉樣變在患有早老性癡呆病個體中普遍存在。公開的國際申請WO94 00569描述了轉基因非人動物,它們帶有大量的轉基因如含有人APP基因的轉基因。所述動物模型可作為人遺傳病如早老性癡呆病的有用模型。
加拿大專利申請2096911描述了編碼APP-裂解蛋白酶的核酸,它與早老性癡呆病和先天愚型綜合征有關。可以用從染色體19中分離的遺傳物質診斷早老性癡呆病。加拿大專利申請2071105描述了通過YAC核苷酸序列來檢測并治療遺傳性或獲得性早老性癡呆病。用23CB10、28CA12和26FF3鑒定了不同的YAC。
美國專利5297562描述了檢測與染色體21的三體性有關的早老性癡呆病。治療包括降低染色體21三體性增殖的方法。加拿大專利申請2054302描述了識別人腦細胞核蛋白的單克隆抗體,所述蛋白由染色體21編碼,并且所述抗體用于檢測因早老性癡呆病或先天愚型綜合征而引起的表達改變。所述單克隆抗體對于由人染色體21編碼的蛋白有特異性,并在人腦組織的許多錐體細胞可以找到。
發(fā)明綜述本發(fā)明部分基于被稱為早衰素-1(PS1)和早衰素-2(PS2)的兩種哺乳動物基因的鑒定、分離、克隆和測序。這兩個基因和其相應的蛋白產物是高度保守的基因家族,早衰素(presenilin)的成員,在其它哺乳動物(如小鼠、大鼠)中有同源性或直向性,在無脊椎動物(如C.elegans,黑尾果蠅(D.melanogaster))中是直向的。這些基因中的突變與人類中家族性早老性癡呆病的發(fā)生有關,而且可能也是其它疾病(如其它認識、智力、神經或生理疾病如腦出血、精神分裂癥、抑郁癥、精神發(fā)育不全和癲癇)的病因。本發(fā)明公開提供了人PS1(hPS1)和人PS2(hPS2)基因的基因組和cDNA核苷酸序列、鼠PS1同系物(mPS1),以及來自C.elegans(sel-12,SPE-4)和黑尾果蠅(DmPS)的相關基因。本公開還提供了由這些基因編碼的預測的早衰素蛋白的氨基酸序列以及早衰素的結構特征,包括推測的功能結構域和抗原決定基。還公開了是早老性癡呆病(AD)病因的早衰素中的許多突變,并涉及所述蛋白的功能結構域。
因此,在一系列的實施方案中,本發(fā)明提供了分離的核酸,所述核酸包括含有或衍生于早衰素基因的核苷酸序列,并且/或者所述核酸編碼含有或衍生于早衰素蛋白的多肽。本發(fā)明的早衰素序列包括具體公開的序列、這些序列的剪接突變體、這些序列的等位基因突變體、同物異名序列和這些序列的同源或直向突變體。因此,例如本發(fā)明提供了hPS1基因、hPS2基因、mPS1基因和DmPS基因的基因組和cDNA序列。本發(fā)明還通過可常規(guī)得到所述突變體的方法提供了等位基因變體和同源或直向序列。本發(fā)明還通過公開許多具體的突變體序列以及通過可常規(guī)得到所述變體的方法而具體提供了早衰素的突變體或致病變體。由于可將本發(fā)明核酸用于許多診斷、治療和重組應用中,所以還提供了早衰素序列的不同亞單位和早衰素序列與異源序列的組合。例如為了用于等位基因特異性雜交篩選或PCR擴增,提供了早衰素序列的亞單位包括有意和反義序列、正常的和突變序列、以及內含子、外顯子和非翻譯序列。所述序列可含有少量在本文中公開或能夠得到的序列的連續(xù)核苷酸,但優(yōu)選包括來自早衰素序列的至少8-10個,更優(yōu)選9-25個連續(xù)核苷酸。早衰素序列其它優(yōu)選的亞單位包括編碼一個或多個早衰素蛋白功能結構域或抗原決定基的那些,特別是可包括正常(野生型)或突變序列。本發(fā)明還提供了各種核酸構建體,其中將早衰素序列(完整的或部分序列)與外源序列可操作相連以形成克隆載體、表達載體、融合載體、轉基因構建體等。因此,根據(jù)本發(fā)明的另一方面,還提供了用于轉化哺乳動物或無脊椎動物組織細胞的重組載體以便在細胞中表達正?;蛲蛔冊缢ニ匦蛄?。
在另一系列實施方案中,本發(fā)明提供了用本發(fā)明核酸之一轉染或轉化的宿主細胞。轉化所述細胞可以僅僅是為了增殖本發(fā)明的核酸構建體或轉化所述細胞以表達早衰素序列。可以將本發(fā)明的轉化細胞用在檢測中以鑒定影響正?;蛲蛔冊缢ニ乇磉_的、與正?;蛲蛔冊缢ニ氐鞍紫嗷プ饔?、和/或調節(jié)或影響正?;蛲蛔兊鞍坠δ艿牡鞍缀?或其它化合物,或者以便生產本發(fā)明早衰素蛋白、融合蛋白、功能結構域、抗原決定基和/或抗體。出于治療或其它原因,可以將轉化的細胞植入到宿主(包括人)中。優(yōu)選的宿主細胞包括哺乳動物的來自神經元、成纖維細胞、骨髓、脾、器官型細胞或混合的細胞培養(yǎng)物,以及細菌、酵母、線蟲、昆蟲和其它無脊椎動物細胞。為了下文所述用途,優(yōu)選細胞包括胚干細胞、受精卵、配子和種系細胞。
在另一系列的實施方案中,本發(fā)明提供了用于AD和與早衰素基因突變有關的其它疾病或失調的轉基因動物模型。所述動物可以是任何哺乳動物,包括大鼠、小鼠、倉鼠、豚鼠、兔、狗、貓、山羊、綿羊、豬和非人靈長動物。另外,也可以將無脊椎動物模型包括線蟲和昆蟲用于特定的應用。通過標準轉基因方法,包括用含有基因組或cDNA片段、小基因的載體、同源重組載體、病毒插入載體等微注射、轉染或胚干細胞、受精卵、配子和種系細胞的其它轉化形式可以產生動物模型。適宜的載體包括痘苗病毒、腺病毒、腺相關病毒、反轉錄病毒、脂質體運輸、神經營養(yǎng)型病毒和單純皰疹病毒。動物模型可包含含有或衍生于早衰素的轉基因序列(包括正常和突變序列、內含子、外顯子和非翻譯序列),和編碼早衰素亞單位如功能結構域的序列。所提供的主要動物模型包括(1)其中已經將正常人早衰素基因作為在外源或內源啟動子調節(jié)下的附加基因,或作為小基因或大基因組片段而重組導入動物基因組中的動物;其中通過同源重組或基因導向而用正常人早衰素基因取代一個或兩個拷貝的動物同源早衰素基因的動物;和/或其中通過同源重組或基因導向而經編碼人同系物的序列的部分取代,已將一個或兩個拷貝的動物同源早衰素基因之一重組“人源化”的動物。(2)其中已經將突變人早衰素基因作為在外源或內源啟動子調節(jié)下的附加基因,或作為小基因或大基因組片段而重組導入動物基因組中的動物;其中通過同源重組或基因導向而用突變人早衰素基因取代一個或兩個拷貝動物同源早衰素基因的動物;和/或其中通過同源重組或基因導向而經編碼突變人同系物的序列的部分取代,已將一個或兩個拷貝的動物同源早衰素基因之一重組“人源化”的動物。
(3)其中已經將突變動物早衰素基因之一的突變體作為在外源或內源啟動子調節(jié)下的附加基因,并作為小基因或大基因組片段而重組導入動物基因組中的動物;其中通過同源重組或基因導向而用動物早衰素基因之一的突變體取代一個或兩拷貝動物同源早衰素基因的動物。(4)其中通過同源重組或基因導向而部分或全部缺失了一個或兩個拷貝的動物早衰素基因之一,或通過外源序列的同源重組或基因導向來完成插入或取代,從而使一個或兩個拷貝的動物早衰素基因之一失活的“剔除”動物。在優(yōu)選實施方案中,AD的轉基因小鼠模型有一編碼正常人PS1或PS2蛋白、編碼人或鼠PS1或PS2蛋白的突變體或人源化正常的或突變鼠PS1或PS2蛋白的轉基因。
在另一系列實施方案中,本發(fā)明提供了基本上純的含多肽的蛋白制劑,所述多肽含有或衍生于早衰素蛋白。本發(fā)明的早衰素蛋白序列包括具體公開的序列、因改變mRNA剪接而產生的這些序列的變體、這些序列的等位基因變體和這些序列的同源或直向同源變體。因此,例如本發(fā)明提供了hPS1蛋白、hPS2蛋白、mPS1蛋白和DmPS蛋白的氨基酸序列。本發(fā)明還通過可以常規(guī)得到所述變體的方法,而提供了等位基因變體和同源或直向同源蛋白。本發(fā)明還通過公開許多具體的突變體基因和通過可以得到所述變體的方法而具體提供了早衰素的突變體或致病變體。由于可以將本發(fā)明的蛋白用于各種診斷、治療和重組應用,因此,還提供了各種早衰素蛋白序列亞單位和早衰素蛋白序列與異源序列的組合。例如,為了用作免疫原或用于結合試驗,提供了早衰素蛋白序列的亞單位包括正常和突變體序列。所述蛋白序列可含有少量在本文中公開或能夠得到的序列的連續(xù)核苷酸,但優(yōu)選包括來自早衰素序列的至少8-10個,更優(yōu)選9-25個連續(xù)核苷酸。早衰素蛋白序列其它優(yōu)選的亞單位包括相應于早衰素蛋白一個或多個功能結構域或抗原決定基的那些,特別是可包括正常(野生型)或突變體序列。本發(fā)明還提供了各種蛋白構建體,其中將完整的或子序列與外源序列相連以形成融合蛋白等 根據(jù)這些實施方案,本發(fā)明還提供了生產所有上述含有或衍生于早衰素的蛋白的方法。
在另一系列的實施方案中,本發(fā)明提供了多克隆和單克隆抗體的生產方法和用途,所述抗體包括抗體片段,包括Fab片段,F(xiàn)(ab’)2和單鏈抗體片段,它們可與早衰素或早衰素的特異性抗原決定基選擇性結合??梢栽谛∈蟆⑼?、山羊或其它適宜動物中,或在培養(yǎng)的細胞如雜交瘤細胞系中生產所述抗體。優(yōu)選生產抗含早衰素序列至少4-8,優(yōu)選至少9-15個連續(xù)氨基酸殘基的抗體??蓪⒈景l(fā)明抗體用于本文所述的各種診斷、治療和技術應用。
在另一系列的實施方案中,本發(fā)明提供了篩選或鑒定蛋白、小分子或其它化合物的方法,這些物質能夠誘導或抑制早衰素基因表達并誘導或抑制蛋白(如PS1或PS2)??捎梅寝D化細胞、固定的細胞系或重組細胞系在體外,或用本文的轉基因動物模型在體內完成所述試驗。特別是,所述試驗可在mRNA表達增加或減少的基礎上,檢測PS1、PS2或其它早衰素-相關基因或蛋白的表達是否有增加或減少,檢測早衰素-相關蛋白產物水平是否有增加或降低,或在重組構建體中,與早衰素5’調節(jié)區(qū)可操作相連的標記基因(β-半乳糖苷酶、綠熒光蛋白、堿性磷酸酶或熒光素酶)的表達水平是否有增加或降低。溫育已知表達特定早衰素或轉化后表達特定早衰素的細胞,然后將一種或多種試驗化合物加到培養(yǎng)基中。在經過使所述化合物足以誘導早衰素表達的時間(如0-72小時)后,可用上述任何技術檢測建立在基本表達水平上的任何變化,在特別優(yōu)選的實施方案中,細胞是來自固定的細胞系如人成神經細胞瘤、膠質母細胞瘤或雜交瘤細胞系或本發(fā)明的轉化細胞。
在另一系列實施方案中,本發(fā)明提供了鑒定與早衰素結合或與之直接相互作用的蛋白和其它化合物的方法。所述蛋白和化合物包括與早衰素體內相互作用并因此為藥物和治療提供新靶的內源細胞組分,以及具有早衰素結合能力并因此可作為候選藥物的重組、合成和其它外源化合物。因此在一系列的實施方案中,可篩選細胞溶解產物或組織勻漿物(如人腦勻槳物、淋巴細胞溶解產物)以得到與正?;蛲蛔冊缢ニ刂唤Y合的蛋白或其它化合物。另外,可就早衰素結合能力對任何外源化合物(天然和/或合成的(如小分子或肽文庫))進行篩選。在這些實施方案中,完成試驗以檢測“早衰素組分”和一些其它部分之間的結合。在這些試驗中的“早衰素組分”可以是含有或衍生于正?;蛲蛔冊缢ニ氐鞍椎亩嚯模ㄔ缢ニ毓δ芙Y構域或早衰素的抗原決定基或早衰素融合蛋白。用非特異性測量法(如細胞內Ca2+的變化,GTP/GDP比率)或特異性測量法(如通過示差顯示、2D凝膠電泳、示差雜交或SAGE方法監(jiān)測的Aβ肽生產變化或其它下游基因表達方面的變化)可檢測所述結合。優(yōu)選方法涉及下列技術的改變(1)通過親和層析直接提取;(2)通過免疫沉淀共分離早衰素組合和結合的蛋白;(3)生物分子相互作用(Biomolecular Interaction)試驗(BIAcore);和(4)酵母雙雜交系統(tǒng)。
在另一系列的實施方案中,本發(fā)明提供了鑒定能夠調節(jié)正常或突變早衰素活性的蛋白、小分子和其它化合物的方法。使用正常細胞或動物,本發(fā)明的轉化細胞和轉基因動物模型,或從攜帶正?;蛲蛔冊缢ニ鼗虻氖茉囌叩玫降募毎景l(fā)明以其影響早衰素表達、早衰素細胞內定位、細胞內Ca2+、Na+、K+或其它離子水平或代謝、細胞凋亡或細胞死亡的發(fā)生或速率、Aβ肽生產的水平或圖譜、微管相關蛋白的磷酸化水平或其它區(qū)別攜帶正常和突變早衰素序列的細胞的生物化學組織學或生理學標記為基礎,提供了鑒定所述化合物的方法。利用本發(fā)明的轉基因動物,還以所述化合物影響與早衰素中突變相關的行為、生理學或組織學表型的能力為基礎,提供了鑒定所述化合物的方法。
在另一系列的實施方案中,本發(fā)明提供了篩選與AD相關的早衰素等位基因的載體、診斷AD患者、篩選并診斷相關的早衰和老年癡呆、精神病如精神分裂癥和抑郁癥和神經學疾病如中風和腦出血(這些疾病均與PS1或PS2基因中的突變有關)的方法。通過以核酸(包括基因組和mRNA/cDNA序列)、蛋白、和/或本文公開并能夠得到的抗體為基礎的方法,包括設計用來檢測正常早衰素活性喪失或增強和/或是否存在因突變早衰素而賦予的特殊新活性的功能試驗可完成篩選和/或診斷。因此,提供了以早衰素蛋白為基礎的篩選和診斷方法,所述方法可在電泳遷移率、蛋白水解裂解圖譜、各種氨基酸殘基的摩爾比、與特異性抗體的結合能力方面,檢測突變體和正常早衰素之間的差異。另外,提供了以核酸(gDNA,cDNA或mRNA)為基礎的篩選和診斷方法,所述方法可通過直接的核苷酸測序、利用等位基因特異性寡核苷酸的雜交、限制酶消化和作圖(如RFLP,REF-SSCP),電泳遷移率(如SSCP,DGGE)、PCR圖譜、RNase保護、化學錯配裂解、連接酶介導的檢測以及各種其它方法來檢測核苷酸序列中的差異。還提供了其它方法來檢測PS1、PS2、APP或與PS1、PS2或APP反應的蛋白的不正常加工(如,異常磷酸化、糖基化、糖化(glycation)酰胺化或蛋白水解裂解)在早衰素轉錄、翻譯和翻譯后修飾方面的改變;早衰素基因產物的細胞內和細胞外運輸方面的改變;或早衰素的異常細胞內定位。根據(jù)這些實施方案,還提供了診斷試劑盒,所述試劑盒含有上述診斷篩選所必需的試劑。
在另一系列的實施方案中,本發(fā)明提供了用于治療早衰素-相關疾病如AD的方法和藥物制品。這些方法和藥物是基于(1)施用正常PS1或PS2蛋白,(2)用正常PS1或PS2基因進行基因治療以補償或取代突變體基因,(3)以與突變體PS1或PS2基因的反義序列或“剔除”突變體基因為基礎的基因治療,(4)以編碼阻斷或更正PS1或PS2突變體的有害作用的蛋白的序列為基礎的基因治療,(5)以正常和/或突變體PS1或PS2蛋白的抗體為基礎的免疫治療,或(6)小分子(藥物),它們改變PS1或PS2表達,阻斷PS1或PS2的突變體形式與其它蛋白或配體之間的異常相互作用,或通過改變突變體蛋白的結構,通過增強其代謝清除率或通過抑制其功能而阻斷突變體PS1或PS2蛋白的異常功能。
根據(jù)本發(fā)明的另一方面,可用本發(fā)明蛋白作為理論藥物設計的啟始點以提供配體、治療藥物或其它類型的小化學分子。另外,可將用上述方法鑒定小分子或其它化合物在理論藥物設計中作為“先導藥物”。
本發(fā)明特別公開的核苷酸和氨基酸序列標為SEQ ID NO1-25。另外,根據(jù)布達佩斯條約,已將本文公開的特定核酸的生物保藏物在ATCC(Rockville,MD)進行了保藏。這些保藏物包括保藏號97124(1995年4月28日保藏),保藏號97508(1995年6月25日保藏),保藏號97214(1995年6月28日保藏)和保藏號97428(1996年1月26日保藏)。
附圖簡述
圖1該圖表示hPS1基因組DNA的結構。用實體黑影方框表示非編碼外顯子。用空框表示編碼外顯子,用劃陰影線的框表示其它剪接序列。限制位點是B=BamH;E=EcoRI;H=HindIII;N=NotI;P=PstI;V=PvuII;X=XbaI。在水平線上限制位點之間的不連續(xù)區(qū)域表示未確定的基因組序列。用雙向水平箭頭表示含各外顯子的克隆的基因組片段。提供了基因組亞克隆的大小和個基因組序列的保藏號。
圖2該圖表示推定PSI蛋白的疏水性圖。該圖是根據(jù)Kyte知Doolittle(1982)的方法計算的。
圖3該圖表示hPS1和mPS1蛋白序列的序列排列。垂直線表示相同的氨基酸。
圖4該圖表示hPS1和hPS2蛋白序列的序列排列。垂直線表示相同的氨基酸。
圖5是PS1蛋白預測結構的示意圖。羅馬數(shù)字表示跨膜結構域。用星號表示推定的糖基化位點,磷酸化位點位于與兩個酸性親水環(huán)相同的膜外表面。MAP激酶位點位于115殘基,PKC位點位于114殘基。FAD突變位點用水平箭頭表示。
圖6是PS2蛋白預測結構的示意圖。羅馬數(shù)字表示跨膜結構域。用星號表示推定的糖基化位點,磷酸化位點位于與兩個酸性親水環(huán)相同的膜外表面。FAD突變位點用水平箭頭表示。
本發(fā)明的詳細描述I定義為了便于研究本發(fā)明不同的實施方案,理解在完成和使用本發(fā)明中所用的各元件和組成,在描述和權利要求中所用的特定術語的定義如下早衰素。如本文沒有進一步說明,術語“早衰素”指早衰素-1(PS1)和/或早衰素-2(PS2)基因/蛋白。具體地說,未修飾的術語“早衰素”指哺乳動物PS1和/或PS2基因/蛋白,優(yōu)選人PS1和/或PS2基因/蛋白。
早衰素-1基因。如本文所用,術語“早衰素-1基因”或“PS1基因”指第一次公開并描述于美國申請08/431048(1995年4月28日申請),以及后來描述于Sherrington等(1995)中的哺乳動物基因,包括任何等位基因變體和異特異性的哺乳動物同系物。一種人早衰素-1(hPS1)cDNA序列在本文中以SEQ ID NO1公開。通過改變hPS1 mRNA轉錄本的剪接而得到的另一人cDNA序列以SEQ ID NO3公開。如下文所述,還發(fā)現(xiàn)了另外的人類剪接變體,其中在某些轉錄本中,33個殘基的編碼區(qū)被剪接掉。一種鼠同系物(mPS10的cDNA以SEQ ID NO16公開。術語“早衰素-i基因”或“PS1基因”主要指編碼序列,但還可包括部分或全部側調節(jié)區(qū)和/或內含子。術語PS1具體指從cDNA或基因組DNA產生的人工或重組基因,包括以剪接變體為基礎的重組基因。也曾將早衰素-1基因稱為S1S2基因(如Sherrington等,1995)或早老性癡呆病相關的膜蛋白(ARMP)基因(如美國申請08/431048,1995年4月28日申請)。
早衰素-1蛋白。如本文所用的,術語“早衰素-1蛋白”或“PS1蛋白”指由PS1基因,包括等位基因變體和異特異性哺乳動物同系物編碼的蛋白。人早衰素-1(PS1)蛋白序列在本文中以SEQ ID NO2公開。通過改變hPS1mRNA轉錄本的剪接而得到的另一人PS1蛋白以SEQ ID NO4公開。如下文所述,還發(fā)現(xiàn)了另外的人剪接變體,其中在某些轉錄本中,33個殘基的編碼區(qū)被剪接掉。這些變體也被本文的術語早衰素-1蛋白所包括。鼠同系物(mPS1)的蛋白序列以SEQ ID NO17公開??赏ㄟ^重組細胞或生物體生產所述蛋白,從天然組織或細胞系中可基本上純化所述蛋白,或用化學或酶學方法合成所述蛋白。因此,“早衰素-1蛋白”或“PS1蛋白”包括糖基化的、部分糖基化的或非糖基化形式以及磷酸化、部分磷酸化、非磷酸化的、硫酸化、部分硫酸化的或非硫酸化形式的蛋白。該術語還包括PS1氨基酸序列的等位基因變體和其它功能等同物,包括生物活性蛋白水解片段或其它片段。也曾將該蛋白稱為S182蛋白或早老性癡呆病相關的膜蛋白(ARMP)(如美國申請08/431048,1995年4月28日申請)。
hPS1基因和/蛋白。如本文所用的,縮寫“hPS1”指PS1基因和/或蛋白的人等位基因變體。在本文中人PS1基因的cDNA序列以SEQ ID NO1和SEQ ID NO3公開。相應的蛋白序列以SEQ ID NO2和SEQ IDNO4公開。還公開了各種等位基因變體包括有害突變體,而且可從下文描述中得到所述變體。
mPS1基因和/或蛋白 如本文所述,縮寫“mPS1”指PS1基因和/或蛋白的鼠同系物和鼠等位基因變體。一種鼠PS1基因的cDNA序列以SEQID NO16公開。相應的mPS1蛋白序列以SEQ ID NO17公開。從下文的描述中可以得到包括有害突變體的等位基因變體。
早衰素-2基因。如本文所用的,術語“早衰素-2基因”或“PS2基因”指第一次在美國申請08/496841(1995年6月28日申請)中公開的,后來在Rogaev等(1995)和Levy-Lahad等(1995)中描述的哺乳動物基因,包括任何等位基因變體和異特異性哺乳動物同系物。本文以SEQ IDNO18公開了一種人早衰素-2(hPS1)cDNA序列。如下文所述,還發(fā)現(xiàn)了其它的人剪接變體,其中在某些轉錄本中剪接掉了單個密碼子或33個殘基的編碼區(qū)。術語“早衰素-2基因”或“PS2基因”主要指編碼序列,但也可包括部分或全部側調節(jié)區(qū)和/或內含子。術語PS2基因具體包括從cDNA或基因組DNA產生的人工或重組基因,包括以剪接變體為基礎的重組基因。曾將早衰素-2基因稱為E5-1基因(如Rogaev等,1995;美國申請08/496841,1995年6月28日申請)或STM2基因(如Levy-Lahad等1995)。
早衰素-2蛋白。如本文所用的,術語“早衰素-2蛋白”或“PS2蛋白”指由PS2基因編碼的蛋白,包括等位基因變體和異特異性哺乳動物同系物。以SEQ ID NO19公開了一種人早衰素-2(hPS2)蛋白。如下文所述,還發(fā)現(xiàn)了其它人剪接變體,其中在某些轉錄本中剪接掉了單個殘基或含33個殘基的區(qū)域。這些變體也被本文所用的術語早衰素-2蛋白所包括。通過重組細胞或生物體可以生產所述蛋白,從天然組織或細胞系中可基本上純化所述蛋白,或用化學或酶學方法合成所述蛋白。因此,術語“早衰素-2蛋白”或“PS2蛋白”包括糖基化、部分糖基化或非糖基化形式以及磷酸化、部分磷酸化、非磷酸化、硫酸化、部分硫酸化或非硫酸化形式的蛋白。該術語還包括PS2氨基酸序列的等位基因變體和其它功能等同物,包括生物活性蛋白水解或其它片段。曾將早衰素-2基因稱為E5-1蛋白(如Rogaev等,1995;美國申請08/496841,1995年6月28日申請)或STM2蛋白(Levy-Lahad等1995)。
hPS2基因和/或蛋白。如本文所用的,縮寫“hPS2”指PS2基因/蛋白的人同系物和人等位基因變體。本文以SEQ ID NO18公開了人PS2基因的一種cDNA序列。本文以SEQ ID NO19公開了相應的hPS2蛋白序列。公開了包括有害突變體的許多等位基因變體,而且從下文的描述中可得到。
DmPS基因和/或蛋白。如本文所用的,編寫“DmPS”指PS1和PS2基因/蛋白的果蠅屬同系物和等位基因變體。該定義包括在所述基因或蛋白序列中的取代、插入或缺失不影響所述基因產物的基本功能的核酸和氨基酸序列多態(tài)性。本文以SEQ ID NO20公開了DmPS基因的一種cDNA的核苷酸序列,并以SEQ ID NO21公開了相應的氨基酸序列術語“DmPS”主要指編碼序列,但也包括部分或全部的側調節(jié)區(qū)和/或內含子正常的。就本文所用的基因而言,術語“正常的”指編碼正常蛋白的基因。就本文所用的蛋白而言,術語“正常的”指可完成其常規(guī)或正常生理作用,而且與致病的條件或狀態(tài)無關或不是病因的蛋白。因此,如本文所用的,術語“正常的”基本上是野生型的同義詞。對于所給的基因或相應的蛋白,可存在正常等位基因變體的多重性,它們之中沒有一個與致病條件或狀態(tài)的發(fā)展有關。所述正常等位基因變體包括,但不限于其中一個或多個核苷酸取代不會導致所編碼的氨基酸序列發(fā)生改變的變體。
突變體。就本文的基因而言,術語“突變體”指編碼突變體蛋白的基因。就本文的蛋白而言,術語“突變體”指不能完成其常規(guī)或正常生理作用,而且與致病的條件或狀態(tài)相關或者是致病條件或狀態(tài)的原因的蛋白。因此,如本文所用的,術語“突變體”基本上是“功能失調”、“致病的”、“病因的”和“有害的”的同義詞。就本發(fā)明的早衰素基因和蛋白而言,術語“突變體”指攜帶一個或多個核苷酸/氨基酸取代、插入和/或缺失的早衰素基因,當所述基因在人類中表達時,會導致發(fā)生早老性癡呆病和/或其它相關的遺傳表型(如腦出血、精神發(fā)育遲緩、精神分裂癥、精神病和抑郁癥)。該定義包括天然存在的各種突變,包括但不限于本文所公開的、以及人為合成的或重組突變。當將術語“突變體”用于早衰素基因時,由于遺傳密碼的簡并性,既并不僅僅包括編碼與本文公開或能夠得到的正常序列相同的序列變體;也不僅僅包括編碼功能等同于正常早衰素蛋白的蛋白的序列變體,盡管它們是編碼不同的蛋白。
功能等同物。在本文描述基因序列和氨基酸序列時,術語“功能等同物”指所列舉的序列無需等同于以SEQ ID NO公開的特定序列,僅需提供可在生物和/或化學上起到本文所公開序列的等同物的功能的序列。
基本純的。在本文用于蛋白(包括抗體)或其它制品時,術語“基本純的”指所述化合物至少占制品的60%重(干重)。優(yōu)選至少占制品的75%,更優(yōu)選占90%,最佳占至少99%(均以所述化合物重量計)??捎萌魏芜m宜的方法如柱層析、凝膠電泳或HPLC分析測量純度。
就包括抗體的蛋白而言,如果制品包括兩種或多種所需的不同化合物(如兩種或多種抗體、免疫原、功能結構域或本發(fā)明的其它多肽),“基本純的”制品就指其中所有所需化合物的總重量(干重)至少占總干重的60%。同樣,對于所述含兩種或多種所需化合物的制品而言,優(yōu)選所述化合物的總重量至少是制品總干重的75%,更優(yōu)選至少90%,最佳為至少99%。
分離的核酸。如本文所用的,“分離的核酸”是從在其所衍生于的生物體的天然基因組中緊密相連(一個在5’末端,一個在3’末端)的序列中,分離的核糖核酸、脫氧核糖核酸或含有多核苷酸序列的核酸類似物。因此,該術語包括例如插入到載體、自主復制質粒或病毒或原核或真核生物基因組DNA中的重組核酸;或以獨立于其它序列的單獨分子(如,用PCR或限制內切酶處理產生的cDNA或基因組DNA片段)存在的重組核酸。該術語還包括作為雜種基因一部分的重組DNA,所述雜種基因編碼其它的多肽序列和/或包括外源調節(jié)元件。
基本相同的序列。如本文所用的,“基本相同的”氨基酸序列是僅通過保守氨基酸取代,如一種氨基酸被同類中的另一種所取代(如纈氨酸取代甘氨酸,精氨酸取代賴氨酸等)或通過在不破壞所述蛋白功能(檢測的,如本文所述的)的氨基酸序列中的位置上進行非保守取代、缺失或插入而產生的不同的氨基酸序列。優(yōu)選在氨基酸水平上,所述序列與被比較的蛋白或肽序列有至少85%,優(yōu)選90%,最佳為95%的相同。對于核酸來說,比較序列的長度通常至少50個核苷酸,優(yōu)選至少60個核苷酸、更優(yōu)選至少70個核苷酸,最佳為110個核苷酸。如上所述,“基本相同的”核酸序列編碼基本相同的氨基酸序列。
轉化的細胞。如本文所用的,“轉化的細胞”是通過重組DNA技術,已經導入了所需核酸分子的細胞(或導入到其祖代細胞中)。所需核酸通常編碼肽或蛋白。所述轉化的細胞可表達所需的序列或可僅僅用于增殖所述序列。本文所用的術語“轉化的”包括導入外源核酸的任何方法,包括,但不限于轉化、轉染、電穿孔、微注射、病毒介導的轉染等。
可操作相連的。如本文所用的,當編碼序列和調節(jié)區(qū)以可使編碼序列在調節(jié)區(qū)的影響或控制下進行表達或轉錄的方式共價相連時,則認為編碼序列和調節(jié)區(qū)是“可操作相連的”。如果需要將編碼序列翻譯成功能蛋白,如果啟動子功能的導入導致編碼序列的轉錄,而且如果兩個DNA序列之間的連續(xù)性質不會(1)導致移碼突變,(2)影響調節(jié)區(qū)指導編碼序列轉錄的能力或(3)影響相應RNA轉錄本翻譯成蛋白的能力,則認為這兩個DNA序列是可操作相連的。因此,如果調節(jié)區(qū)能夠影響DNA序列的轉錄,以致可將所得的轉錄本翻譯成所需的蛋白或多肽,則所述調節(jié)區(qū)是與編碼序列可操作相連的。
嚴謹雜交條件。嚴謹雜交條件是本領域專業(yè)人員能夠理解的術語。對于任何給定的核酸序列,嚴謹雜交條件是溫度、離液序列高的酸、緩沖液和離子強度可以使核酸序列與其互補序列雜交,而不與實質上不同序列進行雜交的條件。構成“嚴謹”條件的精確條件取決于核酸序列的性質、所述序列的長度和在其它非相同序列中所述序列的子序列出現(xiàn)的頻率。通過將雜交條件從發(fā)生非特異性雜交的嚴謹度水平改變到只發(fā)生特異性雜交的水平,本領域專業(yè)人員無需過分試驗,即可確定使給定序列僅與互補序列雜交的條件。在Krause和Araoson(1991)中描述了所述嚴謹度條件的適宜范圍。根據(jù)序列的長度和共性,雜交條件可包括溫度為20-65℃,離子強度5x到0.1xSSC。高度嚴謹?shù)碾s交條件可包括溫度為低達40-42℃(當包含變性劑如甲酰胺時)或高達60-65℃,離子強度為0.1xSSC低。但這些范圍只是說明性的,根據(jù)靶序列的特性和可能的未來技術的發(fā)展,可以比需要的更嚴謹??捎脟乐敹容^低的條件以分離與給定序列實質上相似的、等位基因或同源的核酸序列。
選擇性結合。對本文抗體所用的,如果抗體識別并與靶結合,但實質上不識別并結合包含所述靶的樣品(如生物樣品)中其它分子,就認為抗體與靶是“選擇性結合”。
II早衰素本發(fā)明部分是基于發(fā)現(xiàn)了一個哺乳動物基因家族,當其突變時,所述基因家族與早老性癡呆病的發(fā)生有關。下文將描述這些基因(稱為早衰素-1和早衰素-2)的發(fā)現(xiàn)以及這些基因、其蛋白產物、突變體的表征,和可能的功能。還討論了早衰素的無脊椎動物同系物,原因是它們可闡明早衰素的功能并達到將其用于下文所述的各種實施方案的程度。
1分離人早衰素-1基因AAD3區(qū)的遺傳作圖Sherrington等(1995)描述了PS1基因(后來稱為AD3基因或S182基因)的最初的分離和表征。在開始將AD3基因區(qū)域定位于靠近無名的微衛(wèi)星標記D14S43和D14S53的14q24.3座位(Schellenberg等,1992;St.George-hyslop等,1992;Van Broeckhoven等,1992)后,用21個系譜分離作為推定的常染色體顯性特征的AD(St.George-Hyslop等,1992)并用于研究18個來自14q24.3區(qū)的附加遺傳標記的分離,所述區(qū)已被編制成高密度的遺傳連鎖圖(Weissenbach等,1992;Gyapay等,1994)。以前公開的成對最大可能性分析證實了家族性早老性癡呆病(FAD)和所有這些標記之間連鎖的實際累加證據(jù)。但是許多支持與這些標記連鎖的遺傳數(shù)據(jù)是來自6個大的早期發(fā)作系譜,F(xiàn)AD1(Nee等,1983)、FAD2(Frommelt等,1991)、FAD3(Goudsmit等,1981;Pollen,1993)、FAD4(Foncin等,1985)、TORl.l(Bergamini,1991)和603(Pericak-Vance等,1988),每個系譜提供了至少一個來自14q24.3的常染色體無名遺傳標記(St.George-Hyslop等,1992)。
為了從14q24.3的已知遺傳標記座位更精確地確定AD3基因的位置,通過直接檢查原始單元型數(shù)據(jù),來尋找重組界標,所述數(shù)據(jù)來自基因型受影響的、與染色體14有確定連鎖的6個系譜的成員。在這種特定的情況下,這種選擇性方法要除去來自死亡的、受影響成員以及來自大系譜的年齡較大的無癥狀成員的重建基因型的數(shù)據(jù),不考慮無確定連鎖狀態(tài)的小系譜。但是,這種方法是很可靠的,因為它還避免了使用潛在的引人誤解的基因型數(shù)據(jù),所述數(shù)據(jù)錯誤是因死亡的受影響成員(因無淵源而引起)的重建基因型中的錯誤或取樣錯誤或因包含了無關系譜而產生的。
在檢查了受影響的受試者的單元型數(shù)據(jù)后,直接確定了其基因型的6個大系譜的成員在D14S48和D14S53,以及D14S58和D14S63有必要的重組子。在D14S53的單重組子(描述了FAD區(qū)的端粒界限)發(fā)生于FAD1系譜中同樣患AD的受試者中,以前曾發(fā)現(xiàn)這個家系的成員在位于D14S53(包括S14S48)到端粒區(qū)域的數(shù)個其它標記有重組子(St.George-Hyslop等,1992)。相反,在D14S258的單重組子(表示FAD區(qū)的著絲粒界限)發(fā)生于FAD3系譜的的一個患病成員中,該患者也是在位于D14S258(包括D14S63)到著絲粒之間的數(shù)個其它標記有重組子。通過在其它家族患病成員中的疾病標準臨床試驗表明,兩種重組子患者有明確的早老性癡呆病癥狀,在D14S53著絲粒到D14S258端粒間隔內的多座位上,兩種重組子患者的基因型是指示性的而且是共分離的。
擴大單元型分析以包括6個大系譜死亡患者的重建基因型以及來自剩余15個連鎖概率小于0.95的系譜的數(shù)據(jù)時,在D14S53到D14S258的間隔內的一個或多個標記座位上,檢測到數(shù)個另外的重組子。因此,在3個較大FAD系譜(FAD1、FAD2和其它相關家族)中死亡患者的重建基因型中分別檢測到一個另外的重組子,在5個較小FAD系譜的患者中檢測到8個另外的重組子。但是,盡管一些這樣的重組子可正確地將AD3基因放在更確定靶區(qū)內,但由于不可靠,還需要考慮這些潛在較近的“內重組子”,這種不可靠不僅是由于上文討論的原因,而且還因為它們?yōu)镈14S53-D14S258間隔內的AD3基因提供了突變上不一致的位置。
B構建跨AD3區(qū)的物理重疊群作為克隆AD3基因開始的步驟,構建克隆到酵母人工染色體載體、噬菌體人工染色體載體和粘粒載體中的重疊基因組DNA片段的重疊群。利用衍生于YAC克隆932c7和964f5的粘粒所進行的FISH作圖研究表明,最有可能攜帶AD3基因的間隔至少有5兆堿基大小。由于所述小共分離區(qū)較大使得定位克隆方法難以操作,所以尋找其它的遺傳指標,以便將AD3基因的研究集中在D14S53和D14S258間隔內的一個或多個亞區(qū)。不論是否將所述分析限于有早期FAD發(fā)作形式的那些系譜,還是推廣到包括所有系譜,D14S53和D14S258間隔之間標記的單元型分析不能從統(tǒng)計學上顯著說明FAD特征與任何這些標記上等位基因之間的連鎖不平衡和/或等位基因相關。如果我們的系譜來自不同的人種,得出這樣的結果就不意外了。但是,比較相似人種后代的系譜,對相似人種的不同系譜中分離的帶病染色體進行直接的單元型檢查,表明有兩個標記座位群。這些群中的第一個位于D14S77(D14S786,D14S277和D14S268)到著絲粒,并且跨在YAC78842中所含的0.95Mb物理間隔。第二個群位于D14S77(D14S43、D14S273和D14S76)到端粒,并且跨交疊YAC克隆964c2,74163、797d11和部分854f5所含的~1Mb物理間隔。在來自相同人種的至少2個系譜中觀察到相同的等位基因。由于分開方法,所以認為在物理成簇的標記座位之一存在共有等位基因可能反映了各人種種群中,源建立者染色體上PS1基因周圍小物理區(qū)的共遺傳。在正常高加索人種群中,各共有延伸的單元型極為稀少,在染色體14q24.3跨相似遺傳間隔的其它標記群上,未觀察到等位基因共享。
C候選基因的轉錄作圖和分析為了分離在兩個重要間隔內編碼的表達序列,使用包括固定、克隆的直接篩選方法,以人基因組DNA作為雜交靶以回收來自一級互補DNA池的轉錄序列,所述DNA池衍生于人腦mRNA(Rommens等,1993)。從這些區(qū)中回收約900個大小為100-600堿基對的目的cDNA片段。將這些片段與含基因組DNA的Southern印跡雜交,所述基因組DNA來自各重疊的YAC克隆和人和其它哺乳動物的基因組DNA。這樣鑒定了151個克隆的亞單位,提供了進化保守和/或復合結構的證據(jù),表明它們衍生于剪接的mRNA。以物理圖譜位置、交叉雜交和核苷酸序列為基礎比較所述亞單位內的克隆,并用于篩選用于較長cDNA的常規(guī)人腦cDNA文庫。分離了至少19個長度在1kb以上的獨立cDNA克隆,然后排列成AD3區(qū)的部分轉錄圖譜。這些轉錄本中,只有3個對應于已經表征的基因(cFOS,二氫硫辛酰胺琥珀酰轉移酶和潛伏轉化的生長因子結合蛋白2)。
D候選基因的回收通過RT-PCR從mRNA回收各候選基因的開放閱讀框架,所述mRNA是從正常對照受試者尸體解剖后的腦組織和6個系譜患者的尸體解剖后的腦組織或培養(yǎng)的成纖維細胞系中分離的,已確定所述6個系譜與染色體14有關。然后用化學裂解和限制內切酶指紋單鏈序列構象多態(tài)性方法(Saleeba和Cotton,1993;Liu和Sommer,1995),以及通過直接核苷酸測序就序列差異對RT-PCR產物進行篩選。一種例外是,所有檢測的基因(盡管是所需的)均不含有患病受試者所特有的,或與所述疾病共分離的序列改變。所述例外是克隆S182所表現(xiàn)的候選基因,該克隆含有在正常受試者中未觀察到的一系列核苷酸改變,而且預期在患病受試者中改變了氨基酸序列?,F(xiàn)已將相應于該克隆的基因命名為早衰素-1(PS1)。本文以SEQID NO1和SEQ ID NO3公開了兩個PS1cDNA序列(表示下文所述的可變剪接變體)。分別以SEQ ID NO2和SEQ ID NO4公開了相應的推定的氨基酸序列。已將攜帶這些cDNA克隆的Bluescript質粒于1995年4月28日保藏在ATCC,Rockville,Md,保藏號為97124和97508。相應于SEQ ID NO1和SEQ ID NO2的序列也已保存在GenBank數(shù)據(jù)庫中,并可通過登錄號#42110進行檢索。
2分離鼠早衰素-1基因用來自hPS1基因的標記人DNA探針,通過篩選小鼠cDNA文庫,回收人PS1基因的鼠同系物(mPS1)。用這種方法,回收了2kb的部分轉錄本(代表該基因的3’末端)和代表5’末端的RT-PCR產物。對鼠同系物的共有cDNA轉錄本進行測序表明與hPS1有實質性的氨基酸同一性。重要的是(如下所述),在FAD系譜中突變的所有氨基酸在鼠同系物和正常人變體之間是保守的。PS1基因的這種保守性表明在小鼠(mPS1)中存在直向同源基因,現(xiàn)在通過用人PS1探針篩選基因組或cDNA文庫,可以克隆其它哺乳動物同系物或直向同系物(orthologues)。因此可以用相似的方法鑒定并表征其它種中的PS1基因。本文以SEQ ID NO16公開了mPS1克隆的核酸序列和以SEQ ID NO17公開了相應的氨基酸序列。已將兩個序列均保存在GenBank數(shù)據(jù)庫并可以登錄號#42177進行檢索。
3分離人早衰素-2基因已經分離了第二個人基因,現(xiàn)稱為早衰素-2(PS2),并表明與PS1基因有實質性的核苷酸和氨基酸同源性。Rogaev等(1995)首先詳細描述了該基因的分離。Levy-Lahad等(1995)也報道了用很相近的方法分離人PS2基因(稱為“STM2”),簡而言之,用Altschul等(1990)的BLASTN范例,通過PS1 cDNA的核苷酸序列檢索數(shù)據(jù)庫,可鑒定PS2基因。定位了用登錄號#T03796、R14600和R05907鑒定的用實質性同源性(p<1.0e-100,在至少100個連續(xù)的堿基對范圍內有97%以上的同一性)的3個表達的序列標記位點(EST)。
從這些序列產生寡核苷酸引物并用于經反轉錄酶PCR(RT-PCR)產生PCR產物。將這些短RT-PCR產物部分測序以確定其與數(shù)據(jù)庫內序列的同一性,然后用作雜交探針來篩選全長cDNA文庫。從癌細胞cDNA文庫(Caco2)和人腦cDNA文庫(E5-1,G1-1,cc54,cc32)中回收了大小為1kb-2.3kb的數(shù)個不同的cDNA。這些克隆的核苷酸序列表明所有序列均是相同轉錄本的衍生物。
用CEPH Mega YAC克隆的兩個組群的雜交作圖組,將編碼所述轉錄本的基因,PS2基因定位于人染色體1上,已將所述組群定位在重疊群物理圖譜(用FISH法將YAC克隆750g7,921d12定位到1q41;YAC免隆787g12定位到1p36.1-p35)上。本文以SEQ ID NO18公開了hPS2克隆的核酸序列,以SEQ ID NO19公開了相應的氨基酸序列。這兩個序列均已保存在GenBank數(shù)據(jù)庫中,并可通過登錄號#L44577檢索。還已將hPS2克隆的DNA序列摻入到載體中,并于1995年6月28日保藏在ATCC,Rockvile,MD,保藏號為97214。
4 C.elegans和黑尾果蠅中同系物的鑒定A C.elegans的SPE-4用BLAST排列范例,將PS1的核酸和預期的PS1氨基酸序列與數(shù)據(jù)庫中的序列進行比較,表明與C.elegans精膜內在蛋白SPE-4有中等程度的相似性(P=1.5e-25,在至少50個殘基的三組范圍內有24-37%同一性),與數(shù)種其它跨膜蛋白包括哺乳動物嗜鉻粒蛋白A和哺乳動物電壓依賴性鈣通道蛋白的α亞單位(Altschul等,1990)的部分有很低的相似性。在推定跨膜結構域之間的氨基酸序列相似性可偶然產生簡單起因于有限數(shù)目的疏水氨基酸的排列,但在PS1和SPE-4之間的數(shù)個親水結構域也有延伸的序列排列。認為推定的PS1蛋白和SPE-4有類似的大小(分別為467和465個殘基),如下文更詳細描述的,并在最終預期的跨膜結構域前,含有至少7個具有較大酸性結構域的跨膜結構域。PS1蛋白在N末端確實有較長的預期親水區(qū)。
BLASTP排列分析還檢測了PS2和C.elegans SPE-4蛋白之間的顯著同源性(p=3.5e-26;在至少22個殘基的5個結構域上,同一性=20-63%),而且檢測到與不同種的腦鈉通道蛋白(αIII亞單位)和電壓依賴性鈣通道蛋白的α亞單位(p=0.02;在至少35個殘基的兩個或多個結構域上有20-28%的同一性)有弱同源性(Altschul等,1990)。這些排列與上述對PS1基因描述的那些相似。
BC.elegans的Sel-12發(fā)現(xiàn)來自C.elegans的461個殘基的Sel-12蛋白與S182(SEQ IDNO2)在460個氨基酸上有48%的序列同一性(Levitan和Greenwald,1995)。還認為Sel-12蛋白有多個跨膜結構域。通過篩選Iin-12獲得功能突變(gain-of-function)抑制劑而鑒定了sel-12基因(登錄號U35660),并通過轉化獲救(Levitan和Greenwald,1995)而進行了克隆。
C黑尾果蠅的DmPS制備編碼早衰素/sel12蛋白的高度保守區(qū)的豐余寡核苷酸,并用于鑒定來自成年和胚胎黑尾果蠅的相關mRNA。對這些mRNA進行測序并表明含有與人早衰素的推定氨基酸序列高度同源的開放閱讀框架。將DmPScDNA鑒定為SEQ ID NO20。
該序列編碼541個氨基酸的多肽(SEQ ID NO21),與人早衰素有約52%的同一性。
黑尾果蠅同系物的結構與具有至少7個推定跨膜結構域的人早衰素的結構(用15的窗口值和1.5截止值的Kyte-Doolittle疏水性分析)相似。在含541個氨基酸的ORF的克隆pds13中,至少檢測到一個可變剪接形式,而克隆pds7、pds14和pds1不含1300-1341的寡核苷酸。這種可變剪接會使推定TM6→7環(huán)中的殘基384上的Gly變成Ala,在較長ORF的密碼子399上,產生Glu殘基的框內融合黑尾果蠅氨基酸序列和人基因之間的主要差異是在N-末端的酸性親水結構域和TM6→7環(huán)的酸性親水部分。TM6→7環(huán)周圍的殘基特別保守(殘基220-313到451-524),表明這些是功能重要的結構域。在人PS1或PS2中鑒定的突變并引起人FAD的20個殘基中的16個在黑尾果蠅同系物中是保守的。
將克隆的DmPS基因的DNA序列插入到Bluescript質粒中。于1996年1月26日將該穩(wěn)定的載體保藏在ATCC,Rockville,MD,保藏號為97428。
5人早衰素基因的表征AhPS1轉錄本和基因結構PS1(S182)克隆與Northern印跡的雜交將腦和外周組織的許多區(qū)域中廣泛表達的轉錄本鑒定為主要的~2.8kb的轉錄本和少量的~7.5kb的轉錄本(參見,Sherrington等,1995中的圖2)。在腦的大部分區(qū)域和除肝以外的外周組織中PS1的表達相當均勻,在肝中的轉錄很低。盡管~7.5kb轉錄本的同一性不清楚,但兩種觀察結果表明~2.8kb的轉錄本代表該基因的活性產物。PS1克隆與含不同鼠組織(包括腦)的mRNA的Northern印跡的雜交只鑒定了一個大小等于~2.8kb人轉錄本的轉錄本。已將到目前為止回收的所有較長的cDNA克隆(2.6-2.8kb),包括5’和3’UTR并產生在Northern印跡上的~2.8kb帶,全部定位于染色體14的相同物理區(qū)域。
從這些試驗中,~7.5kb的轉錄本可代表少見的可變剪接的或~2.8kb轉錄本的聚腺苷酸化異構體,或可代表與PS1同源的另一基因。篩選表達高水平PS1和PS2的Caco2細胞cDNA文庫中的長轉錄本。得到了兩個不同的克隆,GL40和B53。測序表明這兩個克隆均含有相似的5’UTR和與腦中短2.8kb轉錄本相同的ORF。
這兩個克隆均含有不正常的長3’UTR。該長3’UTR表示使用了下游更遠的約3kb的另外的聚腺苷酸化位點。該長3’UTR含有許多導致回文結構或莖-環(huán)結構的核苷酸序列基元。這些結構與mRNA的穩(wěn)定性以及翻譯效率有關,這一觀察結果的實用性在于它可能會產生重組表達構建體和/或轉基因(其中除去了上游聚腺苷酸化位點),由此迫使使用下游聚腺苷酸化位點和長3’UTR。在特定的情況下,這樣可促進所選mRNA種的穩(wěn)定性,通過種系治療或利用病毒載體如修飾的單純皰疹病毒載體作為基因治療的形式,可利用優(yōu)先翻譯來改變靶細胞系或甚至體內腦中突變體與野生型轉錄本的平衡。
hPS1基因跨至少60kb的基因組間隔,所述間隔在來自Roswell ParkPAC文庫的200kbPAC1克隆RPCI-154D12和來自Los Alamos染色體14粘粒文庫的3個重疊粘??寺?7-H10、1-G9和24-D5內。PSI基因的轉錄本含有來自13個外顯子的RNA,它們是通過寡核苷酸和部分cDNA探針的重復雜交以亞克隆PAC和粘??寺〉南拗破我约巴ㄟ^直接將這些亞克隆測序而鑒定的。外顯子1-4含5’UTR,同時外顯子1和2表示所述轉錄本另外的5’末端。在外顯子4-13內含有ORF,同時改變的剪接過程導致去掉了外顯子4的部分或外顯子9的全部。外顯子13還包括3’UTR。
除非另外說明,為了清楚和簡潔起見,hPS1衍生核苷酸序列中的所有核苷酸位置均使用SEQ ID NO1(L42110)中的堿基編號,從外顯子1的hPS1 cDNA序列開始。在該cDNA中,將外顯子1與外顯子3直接剪接,然后與外顯子4-13剪接。在SEQ ID NO1中,外顯子1從1位到113位核苷酸,外顯子3從位置114到195,外顯子4從位置196到335,外顯子5從位置336到586,外顯子6從位置587到728,外顯子7從位置729到796,外顯子8從位置797到1017,外顯子9從位置1018到1116,外顯子10從位置1117到1203,外顯子11從1204到1377,外顯子12從位置1378到1496,外顯子13從位置1497到2765。同樣,除非另外說明,hPS1衍生的蛋白序列中的所有氨基酸位置均使用SEQID NO2(SEQ ID NO1的翻譯產物)中的殘基編號。
已經得到了外顯子1-12的側基因組序列,并列在SEQ ID NO5-14(登錄號為L76518-L76527)中。還確定了外顯子13的5’基因組序列,并列于SEQ ID NO15(登錄號為L76528)。SEQ ID NO5-14還包括全部的外顯子序列。但SEQ ID NO15不包括外顯子13的3’末端。對應于外顯子1和2的基因組序列位于以約240bp相隔的2.6kbBamHI-HindIII片段(SEQ ID NO5)上。外顯子3和4(含有ATG啟始密碼子)位于一分開的3kb BamHI片段。尚未鑒定位于外顯子2下游~850bp處BamHI位點與外顯子3上游~600bp處BamHI位點之間的內含子2的完整序列,也未能通過使用來自BamHI位點側的引物的PCR立即回收所述完整序列,說明內含子2會很大。
外顯子1和2周圍的核苷酸序列(SEQ ID NO5)分析表明在內含子1中包含了許多含NotI限制位點的CpG二核苷酸。在內含子1和外顯子1的5’序列(SEQ ID NO5)中,存在數(shù)個含多組激活劑蛋白-2(AP-2)的推定轉錄調節(jié)蛋白的共有序列、信號傳導因子和轉錄激活劑(STAT3)(Schindler和Darnell,1995)、γ激活劑序列(GAS或STAT1)、多啟始位點元件下游(MED)(Ince和Scotto,1995)和GC元件。兩個推定的TATA盒存在于外顯子1的上游,在SEQ ID NO5的bp925-933和978-987,然后是兩個推定的轉錄啟始共有序列,SEQ ID NO5的484的bp1002-1007和1038-1043bp。相反,外顯子2的緊接上游序列沒有TATA盒或CAP位點,但富集CpG島。
圖1列出了hPS1基因的結構組織示意圖譜。用實體黑影方框表示非編碼外顯子。用空框表示編碼外顯子,用劃陰影線的框表示其它剪接序列。限制位點是B=BamH;E=EcoRI;H-HindIII;N=NotI;P=PstI;V=PvuII;X=XbaI。在水平線上限制位點之間的不連續(xù)區(qū)域表示未確定的基因組序列。用雙向水平箭頭表示含各外顯子的克隆的基因組片段。提供了基因組亞克隆的大小和各基因組序列的保藏號。
以外顯子1的上游290bp內和內含子1內的核苷酸序列為基礎,DNA二級結構的預測表明有數(shù)個回文結構,其穩(wěn)定性大于16 kcal/mol。這些二級結構分析還預測存在3個穩(wěn)定的莖-環(huán)基元(在bp 1119-1129/1214-1224;在bp 1387-1394/1462-1469;在bp1422-1429/1508-1515,均在SEQID NO5中)和一個足以包含一核小體(~76bp)的環(huán)。所述莖-環(huán)結構是含TATA基因的共同特征( Kollmar和Farnham,1993)。
在表1中總結了這些5’區(qū)中的特征。所有堿基位置均以SEQ ID NO5為參考。
在SEQ ID NO1中,最長的預期的開放閱讀框架編碼SEQ ID NO2中467個氨基酸的蛋白。該開放閱讀框架的啟始密碼子是位于TGA終止密碼子下游的第一個框內ATG。前兩個框內ATG密碼子的周圍沒有典型的Kozak共有序列(Sherrington等,1995)。與其它沒有典型的“強”啟始密碼子的基因一樣,人轉錄本的推定5’UTR富集GC。
B hPSl 5’UTR的可變轉錄和剪接盡管前3個外顯子和部分第4個外顯子含有非翻譯序列,但分析從人海馬cDNA文庫(Stratagene,La Jolla CA)中和結腸腺癌細胞系(J.Rommens的Caco2)分離的多全長cDNA克隆表明在大部分克隆中,開始的序列來自外顯子1,然后直接與外顯子3剪接(登錄號L42110,SEQ ID NO1)。出現(xiàn)很少的情況是(9個克隆中的1個),開始轉錄的序列來自外顯子2,并與外顯子3剪接(登錄號L76517,SEQ ID NO3)。用外顯子1中的引物分離的至少40個獨立RT-PCR轉錄本的直接核苷酸測序不能鑒定同時含外顯子1和外顯子2的任何克隆,最后,檢查外顯子2上游的基因組序列,沒有3’剪接位點序列。這些觀察結果說明,外顯子2是真正的開始外顯子,而不是在外顯子1開始的轉錄本的可變剪接形式或贗cDNA克隆。此外,由于從相同的單克隆Caco2細胞系得到了含外顯子2的克隆(cc44),所以,在相同的細胞中可能同時存在含外顯子1的轉錄本和含外顯子2的轉錄本。
為了試驗對以外顯子1附近5’上游區(qū)的核苷酸序列為基礎的轉錄啟始位點所作的預測,我們檢測了3個含外顯子1的獨立“全長”cDNA克隆(cc33、cc58和cc48)的5’末端序列和利用位于外顯子3的反義引物,通過引物延伸而回收的3個序列。在cDNA G40L中發(fā)現(xiàn)了最遠的5’延伸,其定位于含外顯子1SEQ ID NO5(L76518)的基因組序列中,最接近轉錄啟始位點的位置1214bp,因此,對應于SEQ ID NO1的位置-10。另外兩個克隆(cNDA cc48和5’RACE產物#5),在基因序列SEQ ID NO5中的位置1259bp有共同的啟始位點,它對應于SEQ IDNO1的位置34。剩下的兩個cDNA以及剩余的5’RACE克隆從外顯子1內更遠的位置開始。5’RACE克隆#8開始于對應于SEQ ID NO1中位置1的1224bp。因此,這些克隆中,沒有一個延伸到外顯子1上游的CAP位點。由于含來自外顯子2的啟始序列的轉錄本很少,因此,未進行相似的啟始位點研究。
C hPS1 ORF的可變剪接除有不同啟始序列的轉錄本外,分析從不同文庫中回收的多cDNA克隆還表明在PS1轉錄本中有兩種影響ORF的變異。
其中第一個是沒有外顯子4的3’末端的12個核苷酸,SEQ ID NO1中的核苷酸324-335。這種情況產生于在核苷酸323后的外顯子4剪接代替了核苷酸335后的剪接。從所進外顯子4的可變剪接產生的轉錄本不編碼SEQ ID NO2中的氨基酸殘基Val26-Arg27-Ser28-G1n29。在所檢查的所有組織中,從這兩種外顯子4的可變剪接而產生的轉錄本有大約相同的頻率。應注意,在到目前為止所檢查的克隆中,鼠PS1轉錄本確實只含有Ile26-Arg27-Ser28-Gln29的cDNA序列,而Val-Arg-Ser-Gln基元的序列在人PS2中只是部分保守的,即Arg48-Ser49-Gln50(Rogaev等1995)。這些觀察結果均表明這些差異對于PS1發(fā)揮適當?shù)墓δ軟]有重要影響。
影響ORF的第二種剪接變異會導致沒有外顯子9,在SEQ ID NO1中為1018到1116的核苷酸。分析從不同組織mRNA衍生的RT-PCR產物表明腦(包括主要受AD影響的新大腦皮質區(qū))和數(shù)種其它組織(肌肉、心、肺、結腸)主要表達帶外顯子9的單個轉錄本。另一方面,白細胞(但不是成淋巴細胞)也表達不含外顯子9的較短形式。預測外顯子9的剪接變化將SEQ ID NO2中257位的天冬氨酸殘基變成了丙氨酸,去掉了接下來的33殘基,導致與外顯子10編碼的位置291的蘇氨酸為起點的蛋白的剩余部分形成框內融合。
D hPS2轉錄本尚未完全表征包含人PS2基因的基因組DNA。然而,PS1和PS2基因之間有許多相似之處是顯而易見的。但是這兩個基因的內含子/外顯子界限除TM6→7環(huán)外,似乎很相似或相同。
在許多組織(包括腦區(qū))中,PS2 cDNA克隆與Northern印跡的總結檢測了~2.3kb的mRNA帶,以及在肌肉、心肌和胰腺中的~2.6kb帶。除轉錄水平很高的胼胝體外,PS2的表達水平在腦的大部分區(qū)域是很低的。在骨骼肌、心肌和胰腺中,PS2基因的表達水平比腦中相對要高,兩種轉錄本分別為~2.3kb和~2.6kb。這兩種轉錄本明顯不同于2.7kb的PS1轉錄本,而且在高嚴謹度條件下,與PS1探針沒有交叉雜交。將hPS2等位基因的cDNA序列鑒定為SEQ ID NO18(登錄號L44577)。
所述PS2 cDNA共有核苷酸序列中的最長ORF預測了含448個氨基酸的多肽(SEQ ID NO19),從第一個相位內ATG密碼子(在SEQ IDNO18中的位置366--368,其周圍是Kozak共有序列)開始編號。
象對PS1一樣,分析來自數(shù)種組織(包括腦和肌肉)RNA的PS2RT-PCR產物表明有兩種可變的剪接變體,其中剪接出了相對較大的片段。因此,以相對較低的頻率生產轉錄本,其中PS2轉錄本(SEQ ID NO18)的核苷酸1152-1250(編碼SEQ ID NO19中的殘基263-295)被可變剪接。如下文所討論的,所述剪接過程很接近于PS1外顯子9的剪接改變(Rogaev等,1995)。
在所有被檢測的組織中,還發(fā)現(xiàn)了另一PS2 cDNA序列的剪接變體,該變體沒有SEQ ID NO18中核苷酸1338-1340位GAA三聯(lián)體。這種剪接改變會刪掉在325位氨基酸的Glu殘基。
6早衰素蛋白的結構A早衰素蛋白家族現(xiàn)在討論的早衰素是一個新的高度保守的膜內在蛋白家族,它們有共同的結構基元、共同的剪接改變模式以及共同的與推定結構的結構域(存在于許多無脊椎動物和脊椎動物細胞中)相關的突變區(qū)熱點。用Hopp和Woods算法分析人早衰素基因的預期氨基酸序列表明所述蛋白是多跨膜內在蛋白如受體、通道蛋白或結構膜蛋白。在圖2中列出了推定hPS1蛋白的Kyte-Doolittle親水性圖。親水圖和結構分析表明這些蛋白具有約7個通過親水環(huán)分離的疏水跨膜結構域(稱為TM1到TM7)根據(jù)在預測公式中所用的參數(shù),其它模型可預測最少5個,最多10個跨膜結構域。7個跨膜結構域的存在是數(shù)種G-結合的受體蛋白的特征,但在其它蛋白(如通道蛋白)中也可觀察到。值得注意的是,沒有可識別的信號肽,而且糖基化位點少。
在圖3中比較了hPS1和mPS1蛋白的氨基酸序列,在圖4中比較了hPS1和hPS2蛋白的序列。在這些圖中,用直線表示相同的氨基酸殘基。用序列上或下的水平線表示7個推定的跨膜結構域。
該家族成員間的主要差異是在N-末端的親水、酸性環(huán)結構域的氨基酸序列,和早衰素蛋白推定TM6和TM7結構域之間(TM6→7環(huán))。大部分有hPS1外顯子9編碼的殘基(在一些非神經組織中發(fā)生的剪接改變)形成了推定TM6→7環(huán)的部分。另外,在hPS2中鑒定的相應改變的剪接變體似乎編碼TM6→7環(huán)的部分。這種親水環(huán)的剪接改變以及該基因家族成員之間環(huán)氨基酸序列的不同說明所述環(huán)是所述蛋白的重要功能結構域,而且可給個體早衰素蛋白的生理學和致病相互作用賦予某些特異性。由于N-末端親水結構域帶有與TM6→7親水酸性環(huán)相同的酸性電荷,在7個跨膜結構域模型中,可能有與膜相同的方向,而且在早衰素之間是可變的,所以這兩個結構域在官能度上享有等同的或獨立的方式(如相同或不同的配體或功能特性)。因此,有可能N-末端也是所述蛋白的重要功能結構域,而且可給個體早衰素蛋白的生理學和致病相互作用賦予某些特異性。
如下文詳細討論的,在TM1→2環(huán)和TM6→7環(huán)結構域周圍的PS1和PS2群的致病突變還說明,這些結構域是這些蛋白的功能結構域。圖5和6分別描述了PS1和PS2蛋白推定結構的示意圖,在圖上標明了已知的突變位點。如圖中所示,預測TM1→2連接序列位于與N-末端相反的膜一側,而且TM6→7也是這樣,而且所示連接序列在跨膜聯(lián)系中可能是很重要的。在有早期發(fā)作的家族性AD(30-40歲)系譜中觀察到的PS1 Y115H突變和在可能使所述環(huán)去穩(wěn)定的TM1/2螺旋中的其它突變支持這種觀點。TM1→2環(huán)相對較短(PS1殘基101-132;PS2殘基107-134),使得對這些肽更適于進行常規(guī)的肽分析。7個PS1突變集中在約密碼子82到密碼子146之間區(qū)域,該區(qū)域含有PS1中推定的第一跨膜結構域(TM1)、TM1→2環(huán)和TM2結構域。同樣,PS2上密碼子141的突變也位于TM2結構域。這些突變可能使TM1→2環(huán)和其在TM1和TM2中的錨點不穩(wěn)定。12個PS1突變導致改變了約密碼子246和410之間的氨基酸,這些密碼子涉及TM6、TM6→7環(huán)和TM7結構域。這些突變可能修飾了TM6→7環(huán)的結構或穩(wěn)定性(直接或通過修飾TM6或TM7的構象)。
TM6→7環(huán)有重要功能的其它證據(jù)是在早衰素蛋白家族的不同成員的TM6→7環(huán)中心部分(約氨基酸300-371)有序列趨異性。同樣,由于早衰素蛋白家族成員的N-末端序列也不相同,所以有可能輕微的序列差異賦予各不同的早衰素蛋白以功能特異性,而保守序列使其具有相同的生物活性。中心區(qū)域代表配體結合位點。如果是這樣的話,在TM6→7區(qū)的突變有可能修飾配體結合活性。在早衰素蛋白家族不同成員之間,TM6→7環(huán)是保守的,這可能在相反膜表面代表了一個效應結構域。除外顯子10的剪接突變外,大部分其它(錯義)突變在推定跨膜螺旋的相同表面上。因此,可用這些結構域(如TM6→7環(huán)和TM1→2環(huán))作為位點研制特異性結合劑,以抑制患早老性癡呆病患者中早衰素蛋白的突變作用和/或恢復所述蛋白的正常功能。
C.elegans SPE-4和PS1基因推定產物之間的相似性說明它們有相似的活性。SPE-4蛋白可能與在精子發(fā)生過程中,氈狀體-膜細胞器(FBMO)復合物的形成和穩(wěn)定有關。FBMO是特殊化高爾基體-衍生的細胞器,組成了粘附于并部分圍繞平行蛋白纖維復合物的膜結合的泡囊,而且可能與可溶性和膜結合多肽的運輸和貯存有關。在SPE-4中的突變破壞了FBMO復合物,并抑制了精子發(fā)生因此,SPE-4的生理功能可能是穩(wěn)定膜內在出芽與融合過程之間的相互作用,或在精子發(fā)生過程中,穩(wěn)定FBMO復合物細胞內運輸中膜與原纖維蛋白的相互作用。可沒想早衰素的類似功能。例如PS1可能在其它膜結合蛋白如βAPP的??恐衅鹱饔?,或如在高爾基體或內體-溶酶體系統(tǒng)中,在蛋白運輸過程中的膜結合小泡軸突運輸和融合出芽中起作用。如果這些假設是正確的話,那么所述突變會導致βAPP運輸和加工異常和/或與細胞骨架蛋白如微小管-相關蛋白Tau的相互作用異常。βAPP和Tau在細胞內和細胞外的不正常沉積,事實上是早老性癡呆病神經病學特征的內在原因。盡管在推定蛋白保守結構域內,高度保守殘基中PS1和PS2突變的位置表明它們是致病性的,但這些突變中至少有3個本身是保守的,這與成年期疾病的發(fā)作相一致。由于到目前為止所觀察到的突變中,沒有一個是預期會引起表達或功能完全喪失的缺失或無義突變,所以我們不能預期這些突變是否會有顯性功能獲得作用,由此促進βAPP的異常加工或抑制正常βAPP加工的顯性獲得功能作用。外顯子10剪接突變引起外顯子9與外顯子10的框內融合,而且可能對可改變細胞內導向或配體結合的PS1蛋白有結構作用,或可能影響PS1的功能。
另一種可能性是PS1基因產物可能代表受體或通道蛋白。所述蛋白的突變與脊椎動物(如人中的惡性高熱、血鉀過多性麻痹)和無脊椎動物(C.elegans中的deg-l(d)突變)中數(shù)種其它顯性神經性疾病有關。盡管這些其它疾病的病理學與早老性癡呆病的不同,但在早老性癡呆病的離子通道中也有功能失調。例如報道了在四-乙基銨敏感性l13ps鉀通道和鈣內環(huán)境穩(wěn)定方面的失調。從PS1與電壓-依賴性鈣通道蛋白α-ID亞單位之間的弱同源性來看,跨膜鈣流量的波動可能是特別相關的,而且培養(yǎng)細胞中細胞內鈣的增加會加重早老性癡呆病的生物化學特征,如Tau-微小管相關蛋白磷酸化方面的改變和Aβ肽的生產增加。
B hPS1結構如SEQ ID NO2所示,人PS1蛋白的最大已知形式含有467個氨基酸,而且預期的分子量為約51.37kDa。具有上述外顯子4剪接改變的變體(其中缺失了SEQ ID NO2位置26-29的殘基)少4個氨基酸,分子量為約50.93kDa。同樣,具有上述外顯子9剪接改變的變體(其中缺失了SEQ ID NO2位置258-290的殘基)少33個氨基酸,分子量近似為47.74kDa。
在表2中列出了推定結構域的位置。再次提醒注意,殘基位置的編號參照SEQ ID NO2,而且是近似的(即,±2個殘基)。
在圖5中列出了推定PS1結構的示意圖。N-末端是高度親水的,帶負電荷的結構域,有數(shù)個潛在的磷酸化結構域,然后接約19個殘基的跨膜疏水結構域(TM1),約32個殘基的帶電荷親水環(huán)(TM1→2),其中分布有短(1-15個殘基)的親水結構域(TM2→3到TM5→6)的5個另外的疏水跨膜結構域(TM2到TM6),另一較大的酸性親水帶電荷的環(huán)(TM6→7)和至少1個(TM7),可能是2個另外的疏水強的跨膜結構域,這些結構在C-末端的極性結構域結束。
所述蛋白還含有許多潛在的磷酸化位點,其中之一是MAP激酶共有位點,該位點還與正常Tau轉變成神經纖維原纏結過程中Tau的超磷酸化有關。所述共有序列可提供推定的元件,該元件將所述蛋白的活性與早老性癡呆病的其它生物化學特征聯(lián)系起來,因此,所述共有序列代表可能的治療靶。研究所述蛋白的結構表明有兩個序列YTPF(SEQ ID NO2中的殘基115-118)和STPE(SEQ ID NO2中的殘基353-356),它們代表是MAP激酶共有序列的5/T-P基元。數(shù)個其它磷酸化位點與蛋白激酶C(PKC)活性的共有序列共存。由于PKC活性與APP(與早老性癡呆病有關)代謝中的差異有關,所以,在PS1蛋白和其同系物上的這些位點也是靶治療劑的位點。初步跡象表明,至少在轉染的細胞中,PS1蛋白的磷酸化程度很低,而PS2蛋白被顯著磷酸化。至少對PS2而言,所述磷酸化是通過與PKC無關的機制而發(fā)生在N-末端結構域中的絲氨酸殘基(Capell等,1996)。
應注意在外顯子4末端的剪接改變,使得從N-末端結構域除去了4個氨基酸,而且認為是除去了磷酸化共有序列。另外,外顯子9的剪接改變產生了PS1蛋白的截斷異構體,其中去掉了TM6 C-末端的5個疏水殘基和緊接TM6的部分親水帶負電荷的TM6→7環(huán)。所述剪接改變異構體的特征在于保留了N-末端到并包括SEQ ID NO2位置256酪氨酸的序列,將位置257的天冬氨酸變成丙氨酸,與從并包括酪氨酸291的蛋白的C-末端部分剪接。所述剪接差異常常與所述蛋白的功能結構域相關。這說明該疏水環(huán)(和具有相似氨基酸電荷的N-末端疏水環(huán))是PS1產物的活性功能結構域,因此是治療的靶位點C人PS2的結構人PS1和PS2蛋白總共有63%的氨基酸同一性,而且有數(shù)個結構域有基本完全相同。因此,如所預期的,疏水分析表明兩種蛋白有相似的結構組織。因此,認為這兩種蛋白均有7個推定的疏水跨膜結構域,而且這兩種蛋白在N-末端和TM6與TM7之間均有較大的酸性親水結構域。進一步的相似性來自腦和肌肉RNA的RT-PCR產物的上述分析,所述分析表明PS2轉錄本的核苷酸1153-1250有不同的剪接方式。這些核苷酸編碼氨基酸263-296,這些氨基酸位于推定PS2蛋白的TM6→7環(huán)結構域內并與PS1剪接改變的氨基酸257-290有94%的同一性。
在表3中描述了hpS2蛋白的推定功能結構域的位置。應注意殘基位置指SEQ ID NO19中的殘基位置,而且所述位置是近似的(即,±2個殘基)。
圖6中列出了推定PS2結構的示意圖。在對應于TM1與TM6之間、從TM7到PS1蛋白C-末端的數(shù)個蛋白結構域中,hPS1和hPS2之間的相似性最大。PS1和PS2的主要不同之處在于其大小和帶負電荷的親水TM6→7環(huán)的氨基酸序列,乙基N-末端親水結構域的序列。
兩種預期氨基酸序列之間最引人注目的差異在TM6→7親水環(huán)(hPS1的殘基304-374;hPS2的310-355)中心部分的氨基酸序列和N-末端的親水結構域。同樣,該結構域在鼠和人PS1基因之間的保守性較低(同一性=47/60),而且與SPE-4的等同區(qū)域沒有相似性。
7早衰素突變體A PS1突變體已經鑒定了PS1基因中引起幾種典型的家族性早老性癡呆病的數(shù)個突變體。這些突變體中的一個或其組合引起了這種形式的早老性癡呆病和數(shù)種其它的神經性疾病。只要可導致預期氨基酸序列中的改變或可導致不正常的轉錄本加工、水平或穩(wěn)定性,所述突變可以是任何核苷酸序列取代、插入或缺失。下文將描述核苷酸和/或氨基酸缺失或取代形式的具體致病突變,但在其它家族中,也會發(fā)現(xiàn)其它突變。的確,在從8個不同系譜中開始發(fā)現(xiàn)5種不同的錯義突變(Sherrington等,1995)后,從來自其它遺傳性疾病的經驗看(如與Ca2+超氧化物歧化酶基因中的突變有關的肌萎縮性側索硬化癥),還會鑒定其它突變。這種預期因我們隨后發(fā)現(xiàn)早衰素中的其它突變(Rogaev等,1995)和其它人分相似發(fā)現(xiàn)(如,Cruts等,1995;Campion等,1995)而得到證明,因此就本文PS1基因和蛋白而言,術語“突變體”不限于這些特定的突變,而是解釋為上述突變體。
直接對從與染色體14相關的6個大系譜患病成員中分離的包括2.8kbS182轉錄本的重疊RT-PCR產物進行測序,從而首先發(fā)現(xiàn)了在這6和系譜中的5個錯義突變。在各系譜中,這些突變與疾病共分離,但在來自與FAD系譜相同人種的142個無關的神經正常受試者中不存在(284個獨立的染色體)。確定與AD3特征分離的物理間隔內的基因的位置,明確在6個系譜中與疾病特征共分離的8個不同的錯義突變與染色體14相關,而在284個獨立正常染色體中不存在這些突變的事實說明PS1基因是AD3座位。這種假設的其它生物學證據(jù)是在FAD同種中的突變在進化中是高度保守的(如hPS1對mPS1),所述突變定位于在其它脊椎動物和無脊椎動物同系物中高度保守的所述蛋白的結構域,而且在腦的大部分區(qū)域,包括受AD嚴重影響的區(qū)域中,PS1基因產物以高水平表達。
由于PS1基因的新發(fā)現(xiàn),已經列出了與AD發(fā)生有關的許多其它突變。表4對所述突變進行了表征。認為在PS1轉錄本的推定ORF中所觀察到的核苷酸缺失或取代改變在所述位置被編碼的氨基酸。參考其在SEQ IDNO1中的核苷酸位置和在SEQ ID NO2中的其氨基酸位置,列出了所述突變?!癗A”表示未得到數(shù)據(jù)。
如下節(jié)將討論的,還發(fā)現(xiàn)了許多PS2突變。在圖4中列出了hPS1和hPS2的序列比較,并說明這些致病突變是在PS2的區(qū)域中,這些區(qū)域在PS1蛋白中是高度保守的。因此,預期在PS1蛋白中的相應突變也是致病的,而且包括在本文提供并可得到的PS1突變體中。此外,推測在任何早衰素基因保守區(qū)中所鑒定的任何致病突變代表其它共有所述保守區(qū)的早衰素突變體。
令人感興趣的是,突變260V、C263R、P264L、P267S、E280A、E280G、A285V、L286V、Δ291-319、G384A、L392V和C410Y均發(fā)生在或接近推定跨膜結構域TM6和TM7之間的酸性親水環(huán)。還將這些突變中的8個(260V、C263R、P264L、P267S、E280A、E280G、A285V、L286V)定位在另外的剪接結構域(SEQ ID NO2的殘基257-290)。
用代表成熟mRNAcDNA或基因組DNA的RT-PCR產物,可通過各種方法(直接核苷酸測序、等位基因同源性寡核苷酸、連接聚合酶鏈反應、SSCP、RFLP、新“DNA芯片(chip)”技術等)檢測所有這些突變。
最后,應注意還發(fā)現(xiàn)了無明顯有害作用的數(shù)種多態(tài)性。其中之一,SEQID NO1中。863位核苷酸T→G改變引起TM4中的F205L多態(tài)性。其它發(fā)生(在bp1700的C→A;在bp2603的G→A;bp2620缺失)在3’UTR中。
B PS2突變體PS1和PS2基因產物之間的強相似性表明了在少量其中遺傳連鎖研究排除了染色體14、19和21的早期發(fā)作的AD系譜中,PS2基因可能是致病突變的位點的可能性。用RT-PCR分離對應于8個系譜(患有早期發(fā)作的FAD)患者的成淋巴細胞、成纖維細胞或尸體解剖后腦組織的PS2轉錄本的cDNA,其中用直接測序研究排除了βAPP和PS1基因中的突變。
在所有4個延伸系譜的意大利人患者(Flo10)中,檢查這些RT-PCR產物在核苷酸1080的雜合A→G取代,所述意大利人患有早期發(fā)作的病理學確定的FAD(50-70歲發(fā)作)。認為所述突變在TM5中的密碼子239引起了Met→Val錯義。
在伏爾加日爾曼祖先相關系譜的患者(用細胞系AG09369、AG09907、AG09952和AG09905,Coriell Institute,Camden NJ代表)中,在TM中的密碼子141發(fā)現(xiàn)了引起Asn→Ile取代的第二個突變(在核苷酸787是A→T)。明顯的是,一個患者(AG09907)的該突變是純合的,這與這些系譜的近親交配特征相符。另外,該患者沒有顯著不同于N141 I突變的雜合患者的臨床形象。PS2基因突變不但在284個高加索人對照中未發(fā)現(xiàn),而且在患AD3型AD的系譜患者中也不存在。
認為這兩種PS2突變均可引起PS1/PS2基因家族內高度保守的殘基的取代。
通過在堿基對1624中的T→C取代而使C-末端密碼子420上發(fā)生Ile→Thr的取代,從而產生了另外的PS2突變。在其它早期發(fā)現(xiàn)(45歲)的家族AD病例中發(fā)現(xiàn)了該突變。
參考SEQ ID NO18的核苷酸位置和SEQ ID NO19中的氨基酸位置,在表5中列出了這些hPS2突變。在表中的“NA”表示未得到數(shù)據(jù)如在前節(jié)所討論的,還發(fā)現(xiàn)了許多PS1突變。在圖4中列出了hPS1和hPS2序列的比較,表明這些致病突變位于PS1蛋白區(qū)域中,但所述區(qū)域在PS2蛋白中是高度保守的。因此,認為在PS2中的相應突變是致病的,而且包括在本文提供并可得到的PS2突變體中。此外,認為在任何早衰素基因保守區(qū)中鑒定的任何致病突變代表共有所述保守區(qū)的其它早衰素的突變體。
發(fā)現(xiàn)了其產物與PS1基因產物有基本的氨基酸和結構相似性的基因,表明這些蛋白作為具有重疊功能的獨立蛋白可能是功能相關的,但作為多肽的物理相關亞單位或作為在相同途徑中完成連續(xù)功能的獨立蛋白,可能具有稍微不同的比活性。
觀察在患家族性AD患者的PS2蛋白保守結構域中的3個不同錯義突變后認為,可能與PS1基因中的那些一樣,這些突變可能是AD的致病因素。這一結論是很顯然的,因為盡管與PS1基因突變相關的疾病表型(30-50歲發(fā)作,持續(xù)10年)與PS2基突變相關的那些(40-70歲發(fā)作;持續(xù)達20年)有極細微的差別,但總的相似性清楚地說明該基因家族成員所包括的生物化學途徑是至少早期發(fā)作AD的重要原因。在疾病表型中的所述細微差別反映了在CNS中PS2轉錄本的表達水平較低,或可能反映了PS2基因產物有不同的作用。
與PS1突變的作用相似,PS2發(fā)生突變時會使APP(淀粉樣前體代表)到Aβ肽的加工、Tau微管相關蛋白的超磷酸化產生異常,而且細胞內鈣的體內平衡失常。阻止這些異常相互作用為治療AD提供了方法。
最后,在一正常個體中發(fā)現(xiàn)了至少一種核苷酸多態(tài)性,所述個體的PS2cDNA在SEQ ID NO18的bp626發(fā)生了T→C改變,但在所編碼的氨基酸序列中沒有任何改變。
III優(yōu)選實施方案部分基于本文公開并描述的發(fā)現(xiàn),提供了本發(fā)明的下列優(yōu)選實施方案。
1分離的核酸在一系列的實施方案中,本發(fā)明提供了對應于或相關于本文所公開的早衰素核酸序列的分離的核酸。如下文更全面討論的,這些序列包括來自人和其他哺乳動物的正常PS1和PS2序列、來自非哺乳動物如果蠅和C.elegans的同源序列、可用作探針和PCR引物的這些序列的亞序列、早衰素蛋白或對應于特定結構域或多態(tài)區(qū)的這些編碼序列片段亞序列、對應于早衰素基因片段的互補或反義序列、其中已將早衰素編碼區(qū)與外源調節(jié)區(qū)可操作相連的序列,以及融合到其他蛋白上的早衰素融合蛋白的編碼序列,所述其他蛋白用作表達標記、純化“標記”或用于篩選和檢測蛋白與早衰素的相互作用因此,在第一系列的實施方案中,提供了編碼正?;蛲蛔凅wPS1和PS2蛋白的分離的核酸序列。本文公開了所述核酸序列的實例。這些核酸可以是基因組序列(如SEQ ID NO5-15)或可以是cDNA序列(如SEQ IDNO1、3、16和18)。另外,所述核酸可以是重組基因或“小基因”,其中可將內含子和外顯子以及局部順式作用調節(jié)元件的所有或某些內含子不同組合加工成增殖或表達構建體或載體。因此,例如本發(fā)明提供了核酸序列,其中在DNA水平摻入本文所述的剪接改變變體,因此使包含這些序列的細胞只在各剪接位置表達一種剪接變體。例如,可生產一重組基因,其中將PS1基因的外顯子1的3’末端(SEQ ID NO5的bp1337)直接與外顯子3的5’末端(SEQ ID NO6的bp 588)相連,以便只生產對應于主要轉錄本的轉錄本。顯然,人們可生產“強迫”剪接改變外顯子2和外顯子3的重組基因。同樣,可生產另外的重組基因,其中將PS1的外顯子4或外顯子9剪接變體之一(或對應的PS2TM6→7剪接變體)摻入到DNA中,以便使包含所述重組基因的細胞只表達這些變體之一。為了達到減小重組早衰素基因的目的,可以用cDNA基因或從DNA構建體中除去內含子和不翻譯外顯子的各種組合。最后,可生產其中5’UTR被改變,以便必須從兩個轉錄啟始位點中的一個或另一個進行的重組基因。如下文所述,所述構建體在鑒定可誘導或抑制早衰素表達的化合物中可以是特別有用的。通過本文對早衰素基因的詳細描述,現(xiàn)可得到這些實施方案的許多變體。
除公開的早衰素序列外,本領域專業(yè)人員現(xiàn)在可以鑒定并分離代表早衰素基因或cDNA的核酸,所述cDNA是公開序列的等位基因或異同源性同系物。因此,本發(fā)明提供了對應于這些等位基因和同系物的分離的核酸,以及通過本領域熟知的方法,從這些序列衍生的各種上述重組構建體??傊⒂锰结樆騊CR引物本領域專業(yè)人員現(xiàn)在可以篩選基因組或cDNA制品(包括從個體生物體(如人AD患者或其家族成員)制備的樣品)以及細菌、病毒、酵母或其它基因組或cDNA文庫以鑒定等位基因或同源序列。由于需要鑒定引起AD或其它疾病的其它早衰素基因突變,由于需要鑒定無致病性的其它早衰素多態(tài)性并由于還需要產生用于研究AD并篩選潛在治療劑的各種動物模型,所以特別設想從其它制品或人核酸文庫以及從包括大鼠、小鼠、倉鼠、豚鼠、兔、狗、貓、山羊、綿羊、豬的動物和非人靈長類的制品或文庫中分離其它的早衰素序列。此外,來自酵母或無脊椎動物包括C.elegans和其它線蟲,以及果蠅和其他昆蟲的早衰素同系物也有藥物篩選的用途。例如可以用攜帶突變早衰素同系物(或哺乳動物早衰素轉基因)(引起很快發(fā)生并容易記錄的表型(如在數(shù)天后不正常的陰門或眼發(fā)育))的無脊椎動物篩選用于阻斷突變體基因作用的藥物。所述無脊椎動物比較大的脊椎動物能夠更迅速有效地進行大量篩選。在通過所述篩選發(fā)現(xiàn)了提示化合物后,就可以在高等動物中對其進行檢測。
利用相對短的早衰素基因序列,可以用標準雜交篩選或PCR技術(如用于鑒定mPS1基因)以鑒定和/或分離等位基因和同源序列。根據(jù)靶序列的性質、所用的方法和所需的特異性,所述序列可包含8個或更少的核苷酸。未來技術的發(fā)展使得可使用甚至更短的序列。就目前技術而言,9-50個核苷酸,而且約18-24個核苷酸的序列是優(yōu)選的。這些序列可從本文公開的序列中選出,或從本文可得到的其它等位基因或異特異性同系物衍生。在檢測mRNA或篩選cDNA文庫時,優(yōu)選使用來自編碼序列(而不是內含子)的探針和引物,避免了通常在剪接變體中被刪除了的序列,除非特別需要鑒定那些變體。認為早衰素的等位基因變體可以在嚴謹雜交條件(如本文所定義的)下,與公開的序列雜交,而可用較低的嚴謹度鑒定異特異性同系物。
在另一系列的實施方案中,本發(fā)明提供了包括早衰素序列亞序列或其補體的分離的核酸。如上所述,在早衰素基因的等位基因和同源變體的鑒定和分離中,所述序列有作為探針和PCR引物用途。在篩選和/或用于診斷目的的個體基因型確定中,對應于早衰素多態(tài)性區(qū)域的亞序列(如上所述)也有特別的用途。另外,如下文描述的,所述亞序列具有編碼(1)在融合蛋白中所含的早衰素蛋白的片段,(2)含有早衰素蛋白功能結構域的用于結合研究的片段,(3)早衰素蛋白的片段,可用所述片段作為免疫原以產生抗早衰素蛋白的抗體和(4)早衰素片段,所述片段用作早衰素的競爭性抑制劑或模擬物以抑制或模擬其生理學功能。最后,所述亞序列可編碼或代表在生理條件下,與早衰素基因或早衰素mRNA轉錄本雜交以抑制所述序列轉錄或翻譯的互補或反義序列。因此,根據(jù)所需要的用途,本發(fā)明提供了長度從8-10個核苷酸(如用作探針)到接近全長的早衰素基因組或cDNA的早衰素基因的核酸亞序列。因此,本發(fā)明提供了分離的核酸序列,所述核酸序列含有對應于早衰素基因的至少8-10個,優(yōu)選15個,更優(yōu)選至少20個連續(xù)核苷酸的序列(如本文公開或的得到的)或對應其補體的序列。但如上所述,根據(jù)不同的技術,可以使用較短的序列。
在另一系列的實施方案中,本發(fā)明提供了核酸,其中具有或不含內含子或如上所述重組工程的早衰素編碼序列與內源或外源5’和/或3’調節(jié)區(qū)可操作相連。本文詳細描述了hPS1基因的內生調節(jié)區(qū)。用本發(fā)明的公開和標準遺傳技術(如PCR延伸,導向基因步查),本領域專業(yè)人員還可克隆相應的hPS25’和/或3’內生調節(jié)區(qū)。同樣,通過不過分的試驗,可得到hPS1和hPS2內源調節(jié)區(qū)的等位基因變體,以及來自其它哺乳動物同系物的內源調節(jié)區(qū)。另外,內源調節(jié)區(qū)(即來自不同的同種基因的調節(jié)區(qū)或異特異性調節(jié)區(qū))可與早衰素編碼序列可操作相連以便引導表達。適宜的5’調節(jié)區(qū)包括啟動子元件并還可包括其它元件如操縱子或增強子序列、核糖體結合序列、RNA加帽序列等。所述調節(jié)區(qū)可選自控制原核和真核細胞、其病毒的基因表達的序列和其組合。所述調節(jié)區(qū)包括,但不限于lac系統(tǒng)、trp系統(tǒng)、tac系統(tǒng),和trc系統(tǒng);λ噬菌體的主要操縱子和啟動子區(qū);fd被膜蛋白的控制區(qū);SV40的早期和晚期啟動子;從多瘤病毒、腺病毒、反轉錄病毒、桿狀病毒和猴病毒衍生的啟動子;3-磷酸甘油酸激酶啟動子;酵母酸性磷酸酶啟動子;酵母α因子啟動子;在神經元或其它類型的細胞中表達的其它真核基因的啟動子元件;和其組合。特別是,可以選擇可誘導或可阻抑的調節(jié)元件(如β-半乳糖苷酶啟動子)以便在用這些核酸轉化的細胞中進行可控制的和/或可操作的表達。另外,可將早衰素編碼區(qū)與在多細胞生物體中提供組織特異性表達的調節(jié)元件可操作相連。所述構建體對于生產轉基因生物體以便僅在適宜的組織中表達早衰素基因是特別有用的。適宜調節(jié)區(qū)的選擇在本領域專業(yè)人員的能力和判斷能力范圍內,而且所述調節(jié)區(qū)的重組用途也是本領域熟知的。
在另一系列的實施方案中,本發(fā)明以融合蛋白的形式提供了編碼所有或部分早衰素蛋白的分離的核酸。在這些實施方案中,核酸調節(jié)區(qū)(內源或外源的)與第一編碼區(qū)可操作相連,所述第一編碼區(qū)與第二編碼區(qū)在框內共價相連。所述第二編碼區(qū)按需要可與一個或多個其它的編碼區(qū)共價相連,而最后一個編碼區(qū)與終止密碼子和按需要適宜的3’調節(jié)區(qū)(如多聚腺苷酸化信號)相連。融合蛋白的早衰素序列可代表第一、第二或任何其它編碼區(qū)。所述早衰素序列可以是保守的或非保守的結構域并可放在融合蛋白的任何編碼區(qū)中。根據(jù)實踐者的需要和判斷能力選擇融合蛋白的非早衰素序列,但不受本發(fā)明的限制。但有用的非早衰素序列包括有助于鑒定或純化所得融合蛋白的短序列“標記”如抗原決定基或poly-His標記。另外,非早衰素編碼區(qū)可編碼較大的蛋白或蛋白片段如有助于鑒定并純化所述蛋白的或在檢測(如下文所述的那些)中有用的酶或結合蛋白。具體的早衰素融合蛋白包括用于分離并純化早衰素的poly-His和GST(谷胱甘肽S-轉移酶)融合蛋白,下文所述的用于鑒定其它蛋白的檢測中的酵母雙雜交融合蛋白,所述其它蛋白與早衰素結合或相互作用。
在另一系列的實施方案中,本發(fā)明提供了重組DNA構建體形式的分離的核酸,其中標記或報道基因(如β-半乳糖苷酶、熒光素酶)與早衰素基因的5’調節(jié)區(qū)可操作相連以便在所述早衰素調節(jié)序列的控制下表達所述標記基因。利用本文公開或可得到的早衰素調節(jié)區(qū),包括來自人和其它哺乳動物的PS1和PX2基因的調節(jié)區(qū),本領域專業(yè)人員可以生產所述構建體。如下文更詳細討論的,可以用所述分離的核酸生產用于鑒定化合物的細胞、細胞系或轉基因動物,所述化合物可直接或間接有差別地影響所述早衰素的表達。
最后,當包含在載體中時,本發(fā)明分離的核酸包括上述任何序列。適宜的載體包括所有類型的克隆載體和表達載體,包括質粒、噬菌粒、粘粒、附加體等以及整合載體。所述載體可包含各種標記基因(如抗生素抗性或敏感性基因),所述標記基因用于鑒定用其成功地轉化了的細胞。另外,所述載體可包含本發(fā)明核酸與之可操作相連的調節(jié)序列,和/或可包含編碼區(qū)以便本發(fā)明的核酸在與載體適宜相連后,以融合蛋白的形式被表達出來。所述載體包括在酵母“雙雜交體”中所用的載體、桿狀病毒和噬菌體展示系統(tǒng)。按照實踐應用的需要選擇載體以用于原核、真核或病毒表達。例如,牛痘病毒載體或含SV40啟動子的猴病毒載體(如pSV2)或單純皰疹病毒或腺相關病毒可用于轉染哺乳動物細胞,包括培育或體內的神經元,桿狀病毒可用于轉染昆蟲細胞(如蝴蝶細胞)?,F(xiàn)在市場上有許多不同的載體而且是本領域熟知的,因此適宜載體的選擇在本領域專業(yè)人員的能力和判斷能力范圍內。
2基本純的蛋白本發(fā)明提供了基本純的早衰素蛋白制品、早衰素蛋白片段和包括早衰素和其片段的融合蛋白。如本文所述,所述蛋白、片段和融合蛋白在生產抗正?;蛲蛔冊缢ニ氐目贵w、鑒定早衰素結合蛋白以及診斷和治療方法中有效用。因此,根據(jù)所需要的用途,本發(fā)明提供了基本純的含氨基酸序列的蛋白或肽,所述氨基酸序列是完整早衰素蛋白的亞序列,而且長度從4-10個氨基酸(如用作免疫原)或10-100個氨基酸(如用于結合試驗)到完整的早衰素蛋白。因此,本發(fā)明提供了基本純的蛋白或肽,所述蛋白或肽含有對應早衰素蛋白(如本文所公開或能夠得到的)的至少4-5個、優(yōu)選6-10個,更優(yōu)選至少50或100個連續(xù)氨基酸的序列。
用任何方法均可分離并純化本發(fā)明的蛋白或肽,所述方法是以其蛋白序列所揭示的性質為基礎選擇的。由于早衰素具有內在的或跨膜蛋白的特性,所以可以分離其中一般來講高度表達早衰素的細胞(如神經元、少突神經膠質、肌肉、胰腺)的膜級分,然后通過例如去污劑溶解提取蛋白。從用表達載體(如桿狀病毒系統(tǒng)如pPbac和pMbac載體(Stratagene,LaJolla,CA));酵母表達系統(tǒng)(如pYESHIS Xpress載體(Invitrogen,San Diego,CA));真核表達系統(tǒng)如有恒定的組成性表達的pcDNA3(Invitrogen,SanDiego,CA)或可誘導的LacSwitch(Stratagene,La Jolla,CA);或原核表達載體如pKK233-3(Clontech,Palo Alto,CA)轉化或轉染的細胞中純化早衰素蛋白、融合蛋白或其片段。在蛋白或片段整合到重組細胞(如固定的人細胞系或其它真核細胞)的內質網或質膜的過程中,可從膜級分中純化所述蛋白。另外,如果蛋白不適當?shù)匚挥诨蚓奂谥亟M細胞(如原核細胞)內的包含體中,則可從溶解的細胞或從溶解的包含體中純化所述蛋白。
用標準蛋白純化方法可完成純化,所述純化方法包括,但不限于凝膠過濾層析、離子交換層析、高效液相層析(RP-HPLC、離子交換HPLC、大小排阻HpLC)、高效層析聚焦層析、疏水相互作用層析、免疫沉淀或免疫親和純化、可以用電泳(如PAGE、SDS-PAGE)以分子量、電荷特性和疏水性為基礎,分離蛋白或肽。
通過產生融合蛋白可以很方便地純化早衰素蛋白或其片段,所述融合蛋白是將所需的早衰素序列與另一種肽如抗原決定基或poly-His標記(如QIA表達載體,QIAGEN Corp.,Chatsworth,CA)或較大的蛋白(如利用pGEX-27載體(Amrad,USA)的GST)或利用Green Lantern載體(GIBCO/BRL,Gaithersburg,MD)的熒光蛋白融合??梢员磉_融合蛋白,然后從原核或真核細胞中回收,然后以融合載體序列為基礎,用任何標準方法純化。例如,可用抗體,通過免疫親和或免疫沉淀純化融合蛋白,所述抗體抗融合蛋白的非早衰素部分,在有poly-His標記的情況下,通過與鎳柱親和結合來純化。通過酶促裂解融合蛋白,可從融合蛋白中進一步純化所需的早衰素蛋白或片段。制備并使用所述純化蛋白的融合構建體的方法是本領域已知的,而且已經有用于該目的的數(shù)種市售試劑盒。從本發(fā)明的公開看,人們能夠使用含有早衰素的所述融合構建體。
3抗早衰素的抗體本發(fā)明還提供了與早衰素蛋白或其片段選擇性結合的抗體,以及制備抗體的方法。特別重要的是,通過鑒定早衰素的功能結構域和與AD相關的多態(tài)性區(qū)域,本發(fā)明提供了抗體和制備抗體的方法,所述抗體選擇性地結合并由此可鑒定和/或區(qū)分早衰素蛋白的正常和突變體(即致病)形式。本發(fā)明的抗體具有作為實驗室試劑的效用,所述試劑用于免疫純化早衰素、Western印跡鑒定表達早衰素的細胞或組織、免疫細胞化學或免疫熒光技術以確定所述蛋白的亞細胞位置。另外,如下所述,還可用本發(fā)明的抗體作為診斷工具以鑒定AD相關的早衰素等位基因的攜帶者,或作為治療工具來選擇性地結合并抑制體內早衰素蛋白的致病形式。
可以用本發(fā)明的完整早衰素蛋白或任何早衰素表位生產本發(fā)明的抗體,所述表位應是所述蛋白的特征或可使所述蛋白區(qū)別于其它宿主蛋白。通過將來自早衰素序列的序列如4-10個氨基酸殘基與來自相關宿主的蛋白序列計算機數(shù)據(jù)庫進行比較,可鑒定所述表位。優(yōu)選從N-或C-末端,或從連接所述蛋白跨膜結構域的環(huán)結構域中選擇所述表位。特別是,期望多態(tài)性N-末端區(qū)域,TM1→2環(huán)或TM6→7環(huán)有最大的診斷和治療效用。另一方面,期望抗高度保守結構域的抗體有最大的早衰素純化或鑒定效用。
用IBI Pustell程序,可將氨基酸殘基位置鑒定為hPS1蛋白中的潛在抗體位點,并可用于產生本發(fā)明的抗體。在表6中列出了這些位置(對應于SEQ ID NO2中的位置)。
當然,選擇抗原決定基的其它方法是本領域已知的,因此,也可以使用。另外,也可使用包括一些這些表位的較大的片段(如8-20或優(yōu)選9-15個殘基)。例如,包括109-112表位的片段可含有殘基107-114或105-116。甚至包括如整個功能結構域或多功能結構域(如TM1、TM1→2、TM2或TM6、TM6→7)的更大片段也是優(yōu)選的。對于其它早衰素蛋白(如對于mPS1或其它非人同系物,或對于PS2),可以選擇同系物位點。
用相同的IBI Pustell程序,可將氨基酸殘基位置鑒定為hPS2蛋白中的潛在抗體位點,并可用于產生本發(fā)明的抗體。在表7中列出了這些位置(對應于SEQ ID NO19中的位置)。
就PS1而言,當然選擇抗原決定基的其它方法是本領域熟知的,而且可以使用這些方法。另外,也可使用包括一些這些表位的較大的片段(如8-20或優(yōu)選9-15個殘基)。例如,包括310-314表位的片段可含有殘基308-316或307-317。甚至包括如整個功能結構域或多功能結構域(如TM1、TM1→2、TM2或TM6、TM6→7)的更大片段也是優(yōu)選的。對于其它早衰素蛋白(如對于mPS1或其它非人同系物,或對于PS2),可以選擇同系物位點。
從粗提取物(如高度表達所述蛋白的細胞的膜級分)、從來自天然或重組表達蛋白或肽的細胞中基本純化的蛋白或肽中可生產早衰素免疫原制品作為短免疫原,通過化學肽合成方法也可生產所述制品。所述早衰素免疫原可以是融合蛋白形式的,其中根據(jù)其輔助特性選擇非早衰素區(qū)。如本文所用的,應將早衰素免疫原定義為包含肽的制品,所述肽含有早衰素蛋白(如本文共可和可得到的)的至少4-8,優(yōu)選至少9-15個連續(xù)的氨基酸殘基。當然,根據(jù)所需的用途和未來的技術發(fā)展,較少的殘基序列也有效用。因此,用于產生抗早衰素抗體的早衰素衍生的序列應被視作早衰素免疫原。
本發(fā)明的抗體可以是多克隆或單克隆的,或可以是抗體片段,包括Fab片段、F(ab’)2、和單鏈抗體片段。另外,在用本發(fā)明的方法鑒定了有用的抗體后,可產生包括上述任何抗體片段的重組抗體,以及以抗早衰素的非人抗體為基礎的人源化抗體。從本發(fā)明的公開,以及本文可得到的其它早衰素的特征來看,本領域專業(yè)人員可通過任何本領域已知的標準方法生產上述抗體。就抗體技術綜述而言,參見Antibody EngineeringA PracticalGuide,Borrebaek,ed.,W.H Freeman & Company,NY(1992),或AntibodyEngineering,2nd Ed.,Borrebaek,ed.,Oxford University Press,Oxford(1995)。
總而言之,首先通過用在適宜載體中的早衰素免疫原免疫小鼠、兔、山羊或其它適宜的動物可生產多克隆抗體。為了提高制品的免疫原性,可將免疫原與載體蛋白結合或與佐劑(如弗氏佐劑)混合。盡管無需提醒,但可以進行加強注射,在使體液反應發(fā)展了適宜的時間,優(yōu)選數(shù)周后,從動物中抽血,然后純化血清以分離免疫球蛋白組分。
同樣,總的來說,首先通過用在適宜載體中的早衰素免疫原免疫小鼠、免、山羊或其它適宜的動物可生產單克隆抗-早衰素抗體。如上所述,可使用載體蛋白或佐劑并推薦進行加強注射(如8-10周中的每2或3周)。在使體液反應發(fā)展了適宜的時間后,殺死動物,取出其脾,然后重懸在例如磷酸緩沖的鹽(PBS)中。脾細胞作為淋巴細胞源,其中一些生產適宜特異性的抗體。然后將這些細胞與無限增殖化細胞系(如骨髓瘤)融合,在存在選擇性試劑如HAT的條件下,將融合產物放到大量的組織培養(yǎng)孔中。對所述孔進行系列篩選和重鋪,每次篩選細胞均會得到有用的抗體。通常,要進行數(shù)次篩選和重鋪過程直到90%以上的孔含有抗體生產陽性的單個克隆。用標準方法如利用Protem A Sepharose的親和層析、通過離子交換層析或通過這些技術的變體或組合,可純化用所述克隆生產的單克隆抗體。
可以用其它用于診斷和/或治療用途的化合物或物質標記或結合本發(fā)明的抗體。例如,可將其與放射性核素、熒光化合物或用于成像或治療的酶,或脂質體結合,所述脂質體用于將脂質體中所含的化合物導向到特定的組織位置中。
4轉化的細胞系本發(fā)明還提供了用本發(fā)明核酸轉化或轉染的細胞或細胞系(原核和真核的均可)以便克隆增殖這些核酸和/或表達由其編碼的蛋白或肽。所述細胞或細胞系在本發(fā)明核酸和蛋白的增殖和生產方面有效用,但如下文進一步描述的,也可作為診斷和治療試驗的模型系統(tǒng)。如本文所用的,術語“轉化的細胞”包括不論是用轉化、轉染、注射或其它方法將本發(fā)明的任何核酸導入到其中的任何細胞或任何細胞的子代。生產適宜載體、用那些載體轉化細胞以及鑒定轉化體的的方法是本領域熟知的,而且在此僅簡要綜述(參見例如Sambrook等(1989)分子克隆實驗室手冊,第2版,冷泉港實驗室出版社,冷泉港實驗室、紐約)。
用于生產本發(fā)明轉化細胞的原核細胞包括埃希氏菌屬(如大腸桿菌)、假單胞菌屬(如銅綠假單胞菌)和芽孢桿菌屬(如枯草芽孢桿菌、嗜熱脂肪芽孢桿菌),以及許多其它本領域熟知并常用的細胞。原核細胞對于大量生產本發(fā)明的蛋白或肽(如正常或突變早衰素、早衰素片段、早衰素融合蛋白)是特別有用的,可以用含有各種表達載體系統(tǒng)的細菌細胞(如大腸桿菌),所述載體系統(tǒng)包括例如含T7 RNA聚合酶/啟動子系統(tǒng)、λ噬菌體調節(jié)序列的質?;騇13噬菌體mGPI-2。用融合蛋白載體也可轉化細菌宿主,所述融合蛋白載體產生例如lacZ、trpE、麥芽糖結合蛋白、 poly-His標記或谷胱甘肽-S-轉移酶融合蛋白。所有這些,以及許多其它原核表達系統(tǒng)是本領域熟知的,而且市場上廣為銷售(如用于GST融合體的pGEX-27(Amrad,USA))。
用于生產本發(fā)明轉化細胞的真核細胞和細胞系包括哺乳動物細胞和細胞系(如PC12、COS、CHO、成纖維細胞、骨髓瘤、神經母細胞瘤、雜交瘤、人胚胎腎293、卵母細胞、胚胎干細胞)、昆蟲細胞系(如用桿狀病毒載體如pPbac或pMbac(Stratagene,La Jolla,CA))、酵母(如用酵母表達載體如pYESHIS(Invitrogen,CA))和真菌。真核細胞對于有些實施方案是特別有用的,在所述實施方案中,要求早衰素蛋白或其功能片段完成與正?;蛲蛔凅w蛋白相關的功能和/或進行細胞內相互作用。因此,例如優(yōu)選將被轉化的真核細胞用作早衰素功能或相互作用的模型,而且篩選候選治療劑的試驗優(yōu)選使用轉化的細胞。
為了完成在真核細胞中的表達,已經發(fā)展了許多載體,而且可以在市場上買到,所述載體在人工啟動子元件的調節(jié)下,可誘導(如LacSwitch表達載體,Stratagene,La Jolla,CA)或同源(如pcDNA3載體,Invitrogen,Chatsworth,CA)表達早衰素核苷酸序列。所述啟動子元件通常衍生于CMV或SV40病毒基因,盡管也可使用其它在真核細胞中有活性的強啟動子元件來誘導早衰素核苷酸序列的轉錄。通常,這些載體還含有人工多聚腺苷酸化序列和衍生于外源病毒基因序列或其它真核基因的3’UTR。此外,在某些構建體中,在所述載體中還包含人工的、非編碼可剪接內含子或外顯子以使所需核苷酸序列(在這種情況下,是早衰素序列)的表達增強。這些表達系統(tǒng)通常可從市場上購買,有代表性的載體是如pcDNA3和pZeoSV(Invitrogen,San Diego,CA)。已經成功地將后兩種載體用于在轉染的COS、CHO和PCI2細胞中表達早衰素蛋白(Levesque等,1996)。無數(shù)的市售和習慣設計的表達載體可從市場上購買,從而可在連續(xù)或暴露于特定的外源刺激(如停用四環(huán)素或暴露于IPTG)后,在或多或少理想類型的細胞中表達任何所需的早衰素轉錄本。
通過本領域熟知的各種方法,將載體導入到受體或“宿主”細胞中,所述方法包括,但不限于磷酸鈣轉染、磷酸鍶轉染、DEAE葡聚糖轉染、電穿孔、脂轉染(如Dosper Liposomal轉染試劑,Boehringer Mannheim,Germany)、微注射、在微珠上射擊插入、原生質融合或,對于病毒或噬菌體載體來說,通過用重組病毒或噬菌體感染。
5轉基因動物模型本發(fā)明還提供了轉基因非人動物模型的生產方法,所述動物模型用于研究早老性癡呆病、篩選候選藥物化合物、產生其中表達突變體或野生型早衰素序列或使早衰素基因失活(如“剔除”缺失)的外植的哺乳動物CNS細胞培養(yǎng)物(如,神經元、神經膠質、器官型或混合的細胞培養(yǎng)物)、已經評估潛在的治療效果。在本發(fā)明前,通過在血小板衍生的生長因子β受體啟動子元件(Gemes等,1995)的控制下,插入并過表達人淀粉樣蛋白前體基因的突變體形式,而建立在早老性癡呆病的部分動物模型。該突變體(βAPP717,Val→Ile)接合的病理學表現(xiàn)和在攜帶高拷貝數(shù)的轉基因動物的腦中,淀粉樣β肽沉積。在轉基因動物腦中的這種變化與人AD中所見到的很相似(Gemes等,1995)。但是,到目前為止,還不清楚這些動物是否會變成癡呆者,但有一點共識是,現(xiàn)在可以在小鼠中再產生至少某些AD的特征。
在本發(fā)明的動物模型中適用的動物包括,但不限于大鼠、小鼠、倉鼠、豚鼠、兔、狗、貓、山羊、綿羊、豬和非人靈長類(如恒河猴、猩猩)。對于初步的研究而言,由于其相對容易保持,而且生命期較短,所以轉基因嚙齒類動物(如小鼠)是優(yōu)選的。如上所述,對于某些研究而言,轉基因酵母或無脊椎動物(如線蟲、昆蟲)是優(yōu)選的,因為它們可以更迅速地生長,而且篩選費用低。但,轉基因非人靈長類對于長期研究而言是優(yōu)選的,因為它們與人更相似,而且它們有較高的認知能力。
用本文公開并可得到的核酸,現(xiàn)在有數(shù)種方法可以產生早老性癡呆病的轉基因動物模型。因此,能夠得到的動物包括(1)其中正常人早衰素基因作為在內源或外源啟動子元件的調節(jié)下的附加基因,并作為小基因或大基因組片段已經被重組導入到動物基因組中的動物;其中已經通過同源重組或基因導向用正常人早衰素基因取代一個或兩拷貝的動物同源早衰素基因;和/或其中經同源重組或基因導向,用編碼人同系物的序列取代,而將一個或兩拷貝的動物同源早衰素基因進行重組“人源化”。將這些動物用于評估轉基因方法的作用,人或人化早衰素基因的導入或取代的作用。(2)其中已經將突變(即致病的)人早衰素基因作為在外源或內源啟動子調節(jié)下的附加基因,或作為小基因或大基因組片段而重組導入動物基因組中的動物;其中通過同源重組或基因導向而用突變人早衰素基因取代一個或兩拷貝動物同源早衰素基因的動物;和/或其中通過同源重組或基因導向而經編碼突變人同系物的序列的部分取代,已將一個或兩個拷貝的動物同源早衰素基因之一重組“人源化”的動物。將這些動物作為表現(xiàn)出某些或全部(無論是在生物化學、病理學和/或行為水平上)攜帶一個或多個等位基因的人特征的動物模型,所述等位基因對于早老性癡呆病或其它與早衰素基因突變相關的疾病來說是致病性的。(3)其中已經將突變動物早衰素基因(攜帶例如對應于或相似于人早衰素致病突變之一的特定突變)之一的突變體作為在外源或內源啟動子調節(jié)下的附加基因,或作為小基因或大基因組片段而重組導入動物基因組中的動物;和/或其中通過同源重組或基因導向而用動物早衰素基因(攜帶例如對應于或相似于人早衰素致病突變之一的特定突變)之一的突變體取代一個或兩拷貝動物同源早衰素基因的動物。將這些動物作為表現(xiàn)出某些或全部(無論是在生物化學、病理學和/或行為水平上)攜帶一個或多個等位基因的人特征的動物模型,所述等位基因對于早老性癡呆病或其它與早衰素基因突變相關的疾病來說是致病性的。(4)其中通過同源重組或基因導向而部分或全部缺失了一個或兩拷貝動物早衰素基因之一,或通過外源序列(如終止密碼子,lox p位點)的同源重組或基因導向來完成插入或取代,從而使一個或兩拷貝動物早衰素基因之一失活的“剔除”動物。所述動物是有用的動物模型,可用來研究失去早衰素基因表達可能會產生的影響,評估功能的丟失對于繼續(xù)表達突變體形式是否是優(yōu)選的,檢測是否可恢復其它基因以取代突變早衰素(如用PS2取代PS1)或干擾其它致AD基因(如APP或ApoE)的作用。例如正常早衰素基因對于突變體APP基因實際表達成AD是必需的,因此,轉基因早衰素動物模型可用來說明所述多基因相互作用。
為了產生動物模型(如轉基因小鼠),正?;蛲蛔冊缢ニ鼗?如正?;蛲蛔僪PS1、mPS1、hPS2、mPS2等),或編碼早衰素的至少一個功能結構域的突變重組核酸(如含有mPS1的重組構建體,其中已經用對應人突變序列的核苷酸序列取代了所述mPS1)可通過用標準卵母細胞微注射技術插入到種系或干細胞中,或轉染或微注射到胚胎干細胞中。用這些或相似方法生產的動物稱為是轉基因的。同樣,如果需要失活或取代內源早衰素基因,可使用利用胚胎干細胞的同源重組。用這些或相似方法生產的動物稱為“失效” (失活)或“knock-in” (取代)模型。
對于卵母細胞注射來說,可將一個或多拷貝的本發(fā)明重組DNA構建體插入到剛剛受精的卵母細胞的前核中。然后將該卵母細胞再植入到假孕的孵育母體中。通過分析DNA(如來自后代小鼠尾靜脈)中是否存在插入的重組轉基因序列,在活的出生動物中篩選整合體。轉基因可以是以YAC、BAC、PAC形式注射的完整基因組序列或具有天然啟動子或異源啟動子的其它染色體DNA片段、cDNA,或含所有編碼區(qū)或發(fā)現(xiàn)對于最佳表達所必需的其它元件的小基因。
也可以完成早期胚胎的反轉錄病毒注射以便插入本發(fā)明的重組DNA構建體。用這種方法,可將轉基因(如正?;蛲蛔僪PS1或PS2序列)插入到反轉錄病毒載體中,用所述反轉錄病毒載體在發(fā)育早期直接感染胚胎(如小鼠或非人靈長類胚胎)以得到嵌合體,其中的一些會產生種系傳遞。
利用干細胞的同源重組可以篩選基因轉移細胞以鑒定罕見的同源重組事件。鑒定后,用其通過胚細胞注射來產生嵌合體,所得動物的比例將說明從重組體系而進行的種系傳遞。如果要使早衰素基因失活,這種方法是特別有用的。例如通過設計含來自mPS1外顯子側的可選擇標記序列的DNA片段,可以失活小鼠中的mPS1基因。同源重組會導致在外顯子的中部插入標記序列,從而引起mPS1基因失活和/或內部序列缺失。然后對個體克隆進行DNA分析以識別同源重組事件。
產生轉基因動物的技術和用于同源重組或基因導向的技術現(xiàn)已被廣泛接受和采用。例如對小鼠胚胎操作的實驗室手冊是生產轉基因小鼠的詳細的標準實驗室技術(Hogan等,1986)。為了產生轉基因,通常將所需的靶序列(如突變體或野生型早衰素序列)連接到位于一些啟動子元件下游的克隆位點,所述啟動子元件要調節(jié)從早衰素序列進行的RNA表達。所述早衰素序列下游,通常有人工多聚腺苷酸化序列。在已用于成功地產生了模擬人遺傳性神經變性疾病的動物的轉基因模型中,盡管也可使用在中樞神經系統(tǒng)細胞中指導表達的其它啟動子元件,但最成功的啟動子元件是血小板衍生的生長因子受體β基因亞單位啟動子和倉鼠朊病毒蛋白基因啟動子。產生轉基因的另一種方法是用內源早衰素啟動子和調節(jié)序列以驅動早衰素轉基因的表達。最后,可以用含完整早衰素基因和其適宜調節(jié)序列的大基因組DNA片段如YAC產生轉基因。已成功地將所述構建體用于在轉基因小鼠中人APP的表達(Lamb等,1993)。
通過導向內源早衰素基因以便通過同源重組改變內源早衰素序列也可以產生動物模型。這些導向事件有除去內源序列(剔除)或改變內源序列的作用,從而產生與人疾病有關的氨基酸改變或其它不正常序列(如更類似人序列而不是源動物序列的序列)(在knock-in動物模型中)。有大量的載體可達到此目的,從許多公司如GenomeSystems Inc.(St.Louis,Missouri,USA)可購買適宜來源的小鼠基因組DNA和其它待導向的動物基因組。這些導向載體構建體的典型特征是2-4kb的基因組DNA與可選擇標記(如在稱為“新霉素盒”的其自身啟動子元件控制下的細菌新霉素抗性基因)的5’相連。。然后將來自所需基因的第二DNA片段連接在新霉素盒的下游,但在第二個選擇性標記(如胸苷激酶)的上游。對DNA片段進行選擇以便通過在所述載體中所包含的序列之一,同源取代內源序列,從而將突變體序列導入到靶動物的種系中。另外,可對序列進行選擇以缺失正常在新霉素盒周圍,位于載體左右臂之間的序列。前者稱為knock-in,后者稱為剔除。此外,還產生了無數(shù)的模型系統(tǒng),特別是導向剔除包括與神經變性疾病有關的基因(如Zheng等,1995導向缺失鼠APP基因;Bueler等,1996導向缺失與成年發(fā)作的人CNS變性有關的鼠朊病毒基因)。
最后,通過配子的化學或X-射線誘變,然后受精可產生轉基因動物的等同物,包括帶有突變或失活早衰素基因的動物。用本文公開或可得到的分離的核酸,本領域專業(yè)人員通過例如為檢測突變體的直接測序RFLP、PCR或雜交分析,或說明因劑量引起的一個等位基因丟失的Southern印跡可以更迅速地篩選所得的子代。
6影響早衰素表達的藥物的試驗在另一系列的實施方案中,本發(fā)明提供了鑒定能夠誘導或抑制早衰素基因和蛋白(如PS1或PS2)表述的小分子或其它化合物的試驗。用非轉化細胞、無限增殖細胞系或重組細胞系在體外,或用本文能夠得到的轉基因動物在體內完成所述試驗。
特別是,以增加的或降低的mRNA表達(例如用本文公開并可得到的核酸探針)、增加或降低水平的PS1、PS2或其它早衰素相關蛋白產物(例如用本文公開并可得到的抗-早衰素抗體)、或增加或降低水平的在重組構建體中與早衰素5’調節(jié)區(qū)可操作相連的標記基(如β半乳糖苷酶或熒光素酶)表達為基礎,所述試驗可以檢測PS1、PS2或其它早衰素-相關基因或蛋白的表達是否有增加或降低。
因此,例如人們可以培養(yǎng)已知細胞以表達特定的早衰素,然后向培養(yǎng)基中加入一種或多種試驗化合物。在使所述化合物對早衰素的表達誘導或抑制了足夠的時間(如0-72小時)后,用上述和本領域熟知的任何技術均可檢測以確定的基線為基礎,表達水平的變化。在特別優(yōu)選的實施方案中,所述細胞是來自無限增殖的細胞系如人成神經細胞瘤、成膠質細胞瘤或雜交瘤細胞系。用本文公開并能夠得到的核酸探針和/或抗體,檢測早衰素表達的改變,由此鑒定所述化合物是早衰素表達的誘導劑或阻遏劑,這些只需要常規(guī)試驗。
在特別優(yōu)選的實施方案中,使用了重組試驗,其中報道基因如β-半乳糖苷酶、綠熒光蛋白、堿性磷酸酶或熒光素酶與早衰素的5’調節(jié)區(qū)可操作相連。優(yōu)選的載體包括Green Lanternl載體(GIBCO/BRL,Gaithersburg,MD)和the Great EScAPe pSEAP載體(Clontech,Palo Alto)。以本發(fā)明公開的這些基因編碼區(qū)為基礎,本領域專業(yè)人員可以容易地分離并克隆本文公開的hPS1調節(jié)區(qū)或其它早衰素調節(jié)區(qū)。報道基因和調節(jié)區(qū)在框內(或在三個可能的閱讀框架中的每一個中)相連以便可在早衰素調節(jié)元件的控制下進行報道基因的轉錄和翻譯。然后,將重組構建體導入任何適宜的細胞類型中,盡管哺乳動物細胞是優(yōu)選的,人細胞最佳。使被轉化的細胞在培養(yǎng)基中生長,確定報道基因的表達基線水平后,將待測化合物加到培養(yǎng)基中。報道基因表達的易于檢測為鑒定早衰素基因的誘導劑和阻遏劑提供了迅速高效的檢測方法。
用該方法鑒定的化合物在修飾PS1、PS2或其它早衰素相關基因的體內表達方面有潛在的應用。還可以在本文公開并可得到的動物模型中進一步檢測這些化合物以鑒定體內作用最強的那些化合物。另外,如本文對具有早衰素結合活性的小分子所述的,這些分子可作為“先導化合物”,例如通過使所述化合物經連續(xù)修飾、分子定型以及在常規(guī)藥物設計中所用的其它方法來進一步開發(fā)藥物。
7鑒定有早衰素結合能力的化合物根據(jù)本發(fā)明,本領域專業(yè)人員可以實施新的篩選方法,以用于鑒定與早衰素結合或與之相互作用的蛋白和其它化合物。所述蛋白和化合物包括體內與早衰素相互作用,并因此為藥物和治療介入提供了新靶的內源細胞組分,以及重組的、合成的和其它具有早衰素結合能力并因此可作為侯選藥物的內源組分。因此,在一系列的實施方案中,篩選細胞溶解產物或組織勻漿物(如人腦勻漿物、淋巴細胞溶解產物)中與正常或突變早衰素之一結合的蛋白或其它化合物。另外,可對任何不同的內源化合物,天然和或合成的(如小分子或肽文庫)進行篩選,以篩選其早衰素結合能力。在本發(fā)明中,小分子是特別優(yōu)選的,因為在口服給藥后,它們很容易被吸收,而且只有很小的潛在抗原決定基,和/或比大分子如核酸或蛋白更有可能跨過血液腦障礙。本發(fā)明的方法是特別有用的,即可用它們鑒定選擇性或優(yōu)先結合突變體形式的早衰素蛋白(而不是正常形式的)的分子,因此,它們在治療這種常染色體顯性疾病的雜合患者方面有特別的效用。
由于尚不了解PS1和PS2的正常生理作用,因此結合正常、突變體或這兩種形式的早衰素的化合物在治療和診斷方面有效用。例如只與正常早衰素結合的化合物可作為其正?;钚缘脑鰪妱纱酥辽俨糠盅a償在早老性癡呆病患者中失去的或異常的突變早衰素形式的活性。結合正常和突變體形式早衰素的化合物如果它們能夠區(qū)別影響這兩種形式的活性,從而消除與正常功能的所有偏離,則它們也是有效用的。另外,阻斷PS1或PS2正常和突變體形式的活性比使疾病正常發(fā)展的生理和臨床后果的嚴重程度小,那么結合并抑制正?;蛲蛔凅w形式早衰素的化合物在治療上也是有用的,但優(yōu)選鑒定與突變早衰素的結合親和性高于與正常早衰素的(如至少2-10倍高的Ka),而且選擇性或優(yōu)先抑制突變體形式的活性的化合物用本文公開的任何技術,然后通過比較候選化合物與正常和突變體PS1或PS2的結合親和性,可鑒定所述化合物。
通過用儀器(如,BIAcore,LKB Pharmacia,Sweden)直接監(jiān)測諸如所述結合的熒光、分子量的變化或檢測結合劑或早衰素在可溶相或在底物結合相中的濃度,可監(jiān)測結合早衰素(正?;蛲蛔凅w形式)的試劑的作用。
用上述方法鑒定后,以足以用于藥物施用或試驗的量(如μg或mg或更大的量)生產侯選化合物,然后配制在可藥用載體中(參見如Remington’sPharmaceutical Sciences,Gennaro,A.,ed.,Mack Pub.,1990)。將這些候選化合物施用于本發(fā)明的轉化細胞、本發(fā)明的轉基因動物模型、從動物模型或人患者衍生的細胞系或早老性癡呆病患者。本發(fā)明公開并可得到的動物模型對于進一步檢測結合正?;蛲蛔冊缢ニ氐暮蜻x化合物的治療效用是特別有用的。
另外,在用上述方法鑒定后,所述候選化合物在新藥物的設計和開發(fā)中可作為“先導化合物”。例如如本領域熟知的,在開發(fā)新藥的藥物工業(yè)中,連續(xù)修飾小分子(如用肽取代氨基酸殘基,用肽或非肽化合物取代功能基團)是標準方法。所述開發(fā)通常是從已知具有至少部分所需活性(如PS1結合或阻斷能力)的“先導化合物”開始的。具體地說,在鑒定了具有至少某些所需活性(如早衰素活性的調節(jié))的一種或多種化合物后,本領域實踐者就可通過所述分子的結構比較,了解哪些是先導化合物中應保留的部分,哪些是在設計新候選化合物中可改變的部分。因此,本發(fā)明還提供了鑒定先導化合物的方法,可對所述先導化合物進行連續(xù)修飾以產生用于治療早老性癡呆病的新候選化合物。然后檢測這些新化合物的早衰素結合或阻斷(如在上述結合試驗中)以及治療效用(如在本文所述的動物模型中)。可重復所述方法,直到鑒定出具有所需治療活性和/或效用的化合物。
在本發(fā)明的各系列實施方案中,可完成一種試驗以檢測“早衰素組分”與某些其它部分之間的結合。特別有用的是系列試驗,其中在結合試驗中,用突變體和正常早衰素組分檢測僅與正常或僅與突變體形式早衰素有結合能力的化合物 如下文更全面描述的,預期所述化合物具有最大的治療效用。在這些試驗中的“早衰素組分”可以是完整的正?;蛲蛔凅w形式的早衰素蛋白(如hPS1或hPS2變體),但不是必需的。如上所述,早衰素的的具體功能結構域可作為不同的分子或融合蛋白的部分。例如,為了分離與這些功能結構域相互作用的蛋白或化合物,用對應于這些區(qū)域的融合構建體和/或合成的肽可完成篩選。因此,就PS2而言,可制備包含對應于約氨基酸1-87(N-末端)、或269-387(TM6→7環(huán))或任何其它所需的保守結構域的序列的GST-融合肽。對于較短的功能結構域而言,可生產對應于例如約氨基酸107-134(TM1→2環(huán))的合成肽。同樣,就PS1而言,可制備包含對應于約氨基酸1-81(N-末端)、或266-410(TM6→7環(huán))或對應于例如約氨基酸101-131(TM1→2環(huán))的合成肽。顯然,各種組合的融合蛋白和早衰素功能結構域是可能的,而且這些僅僅是實例。另外,可以改變功能結構域以便有助于在試驗中,例如通過將促進所述結構域固定在底物上的反應性基團或氨基酸殘基(如半胱氨酸)(如通過巰基反應)導入到功能結構域中。因此,例如已經合成了含其它C-未端半胱氨酸殘基的PS1 TM1→2環(huán)片段(31-單體)。用該肽產生用于親和層析(Sulfo-link;Pierce)的親和底物以分離用于微測序的結合蛋白。同樣用修飾的殘基可生產其它功能結構域或抗原片段(參見例如實施例10)用本領域熟知的任何標準方法可以純化并表征用這些方法鑒定的蛋白或其它化合物。例如可利用電泳(如SDS-PAGE,2D PAGE)或層析(如HPLC)技術純化并分離蛋白,然后進行微測序。對于具有阻斷的N-末端的蛋白,裂解(例如提供CNBr和/或胰蛋白酶)特定的結合蛋白以釋放肽片段。用HPLC的進一步純化/表征和微測序和/或用常規(guī)方法進行的質譜分析提供了有關所述阻斷蛋白的內序列數(shù)據(jù)。對于非蛋白化合物,可以用標準有機化學分析技術(如IR、NMR和質譜分析;功能基團分析;X-射線結晶學)確定其結構和特性。
用于篩選細胞溶解產物、組織勻漿物、或候選早衰素結合分子的小分子文庫的方法是本領域熟知的,而且根據(jù)本發(fā)明公開,可用來鑒定結合正?;蛲蛔冊缢ニ亟M分或調節(jié)早衰素活性的化合物,所述早衰素活性是用非特異性測量(如細胞內Ca2+/GTP/GDP比率的改變)或通過特異性測量(如Aβ肽生產的改變或通過示差顯示、2D凝膠電泳、示差雜交或SAGE方法可監(jiān)測的其它下游基因表達方面的變化)來定義的。優(yōu)選的方法包括有關下列技術的改變(1)通過親和層析直接提??;(2)通過免疫沉淀共分離早衰素組分和結合的蛋白;(3)生物分子相互作用試驗(BIAcore);和(4)酵母雙雜交系統(tǒng)。下文將對這些和其它方面分別進行討論。
A親和層析根據(jù)本發(fā)明公開,可以用本領域熟知的各種親和結合技術分離結合本文公開或其它可得到的早衰素的蛋白或其它化合物。總之,可將早衰素組分固定在底物(如柱式濾紙)上,將含待測化合物的溶液在允許進行結合的條件下,與早衰素蛋白、融合蛋白或片段接觸。然后用溶液洗滌底物以除去未結合或結合弱的分子。然后第二次洗滌洗脫與固定的正?;蛲蛔冊缢ニ亟M分強結合的那些化合物。另外,可以固定待測化合物,然后將含一種或多種早衰素組分的溶液與柱、濾紙或其它底物接觸。桉上述可以確定所述早衰素組分與待測化合物的結合能力,或用標記形式的早衰素組分(如放射性標記的或化學發(fā)光結構域)更迅速地評估與底物-固定的化合物的結合,另外,由于認為PS1和PS2均是膜相關蛋白,所以優(yōu)選將早衰素蛋白、融合蛋白或片段摻入到雙分子脂膜(如脂質體)中以促進其適當?shù)恼郫B。當使用包含至少一種跨膜結構域的早衰素組分時,這是特別有用的??蓪⑺鲈缢ニ?脂質體固定在底物(直接或通過脂質體膜中的另一組分)上,從帶有固定的待測化合物的底物上經過,或用于各種熟知的膜蛋白結合試驗中。另外,可從生產所運組分的細胞中分離在膜級分中的早衰素組分,然后將所述膜級分用于結合試驗。
B共免疫沉淀另一種熟知的分離早衰素組分和其相關蛋白或其它化合物的技術是用抗體直接免疫沉淀。已經用該方法例如成功地分離了許多突觸小泡相關的蛋白(Phizicky and Fields,1994)。因此,可以在允許結合的條件下,在溶液中將正?;蛲蛔凅w、游離或膜結合的早衰素組分與候選化合物混合,然后免疫沉淀所述早衰素組分,然后用上述標準技術鑒定與早衰素組分共免疫沉淀的蛋白或其它化合物。用于免疫沉淀的主要技術見于例如Harlowand Lane,(1988)抗體實驗室手冊,冷泉港出版社,冷泉港,紐約。
在該試驗中所用的抗體(如本文所述和可得到的)可以是多克隆或單克隆的,并包括不同的抗體片段(如Fab,F(xiàn)(ab’)2)以及單鏈抗體等。
C生物分子相互作用試驗另一種用于檢測并分離結合蛋白的方法是由Pharmacia Biosensor開發(fā)并在制造商(LKB Pharmacia,Sweden)方法中描述的生物分子相互作用試驗或“BIAcore”系統(tǒng)。根據(jù)本發(fā)明公開,本領域專業(yè)人員可以使用該系統(tǒng)或基本等同物以鑒定具有早衰素結合能力的蛋白或其它化合物。BIAcore系統(tǒng)使用親和純化的抗-GST抗體以便將GST-融合蛋白固定在傳感器芯片上。顯然,可用其它融合蛋白或相應的抗體代替。所述傳感器利用作為光學現(xiàn)象的表面胞質團共振,可檢測折射指數(shù)的變化。使所需組織的勻漿物從上面經過固定的融合蛋白,蛋白-蛋白相互作用被記錄為指數(shù)系數(shù)的變化??梢杂迷撓到y(tǒng)確定結合動力學并評估然后觀測到的結合作用是否是生理學相關的。
D酵母雙雜交系統(tǒng)酵母“雙雜交”系統(tǒng)利用了由兩個物理上分開的、功能結構域(Phizickyand Fields,1994)組成的轉錄因子。最常用的是酵母GAL4轉錄激活因子,它由DNA結合結構域和轉錄激活結構域組成。用兩種不同的克隆載體產生GAL4與編碼潛在結合蛋白的基因融合的不同融合蛋白。所述融合蛋白被共表達,導向到核中,如果發(fā)生相互作用,報道基因(如LacZ)的基因就會產生可檢測的表型。例如,可將Clontech Matchmaker系統(tǒng)-2可與含早衰素-GAL4結合結構域融合克隆的Clontech腦cDNA GAL4激活結構域融合蛋白文庫(Clontech,Palo Alto,CA)一起使用。根據(jù)本文的公開,本領域專業(yè)人員現(xiàn)在可以生產各種早衰素融合蛋白,包括含有早衰素蛋白的正?;蛲蛔凅w功能結構域的融合蛋白,以及篩選所述融合蛋白文庫以鑒定早衰素結合蛋白。
E其它方法可將核苷酸序列和蛋白產物(包括這些核酸和其對應蛋白的突變體和正常形式)與上述技術一起使用以分離其它相互作用的蛋白,并鑒定其表達受正常早衰素序列過表達、正常早衰素序列表達不足或突變早衰素序列表達影響的其它基因。鑒定這些相互作用的蛋白以及鑒定不論在何種突變早衰素序列(例如)的情況下,其表達水平將被改變的其它基因,可鑒定出其臨床或病理學形式與所述疾病的致病機制直接相關的其它基因靶。具體地說,可鑒定其本身是導致早老性癡呆病的其它突變位點,或本身可以被治療導向(如將其表達水平降到正常水平或藥物學上可阻斷其過表達作用的水平)以作為這種病的潛在治療方法的其它基因。具體地說,這些技術依賴于PCR為基礎的和/或雜交為基礎的方法,以鑒定在兩種不同條件下差別表達的基因(表達正常早衰素的細胞系與表達突變早衰素序列的相同類型的細胞相比)、這些技術包括示差顯示、基因表達的系列分析(SAGE)和蛋白2D-凝膠質譜和扣除雜交(參見Nowak,1995,和Kann,1995)。
對于本領域專業(yè)人員顯而易見的是,有許多篩選個體蛋白或其它化合物,以及蛋白或其它化合物文庫的方法(如噬菌體展示文庫和來自Stratagene,La Jolla,CA的克隆系統(tǒng)),從而可鑒定與正?;蛲蛔冊缢ニ亟M分結合的分子。所有這些方法均包括如下步驟將正?;蛲蛔冊缢ニ氐鞍住⑷诤系鞍谆蚱闻c待測化合物混合,然后激活(如果需要的話),接著檢測結合的復合物。所有這些方法現(xiàn)在通過本發(fā)明公開的基本純的早衰素、基本純的早衰素功能結構域片段、早衰素融合蛋白、早衰素抗體和制備和使用它們的方法均是可實施的。
8鑒定調節(jié)早衰素活性的化合物的方法在另一系列的實施方案中,本發(fā)明提供了鑒定化合物的方法,所述化合物具有調節(jié)正常和突變早衰素的活性的能力。就所述系列實施方案所用的,術語“活性”廣義地包括基因和蛋白表達、早衰素蛋白翻譯后加工、運輸和定位、以及任何功能活性(如酶促、受體-效應物、結合和通道),以及任何這些的下游作用。早衰素可能是正常與內質網和/或高爾基體有關的膜內在蛋白,而且可能有與APP轉運和運輸和/或調節(jié)細胞內鈣水平有關的功能。另外,已知早衰素突變與Aβ肽生產的增加、淀粉樣斑的出現(xiàn)以及神經纖維原纏結、認識功能降低和編程性(apoptitic)細胞死亡有關。因此,利用本發(fā)明的轉化細胞和轉基因動物模型、從攜帶突變早衰素基因的受試者得到的細胞或攜帶天然早衰素突變的動物或人類受試者,現(xiàn)在通過檢測一種或多種正常或突變早衰素表達的這些功能特征或表型的變化可以篩選有治療作用的候選藥物和治療方法。
因此,本發(fā)明提供了通過體內或體外將細胞與候選化合物接觸,然后檢測與正常或突變早衰素活性相關的標記的變化,從而來篩選或檢測調節(jié)早衰素活性的蛋白、小分子或其它化合物的方法。與早衰素活性相關的標記可以是任何可測量的與早衰素表達有關的生物化學、生理學、組織學和或行為特征。具體地說,有用的標記包括任何可測量的生物化學、生理學、組織學和/或行為特征,所述特征可將攜帶至少一種突變早衰素基因的細胞、組織、動物或個體與其正常對應物區(qū)別開。另外,所述標記可以是任何早衰素活性的特異性或非特異性測量結果。所述早衰素特異性測量結果包括可用本發(fā)明核酸探針或抗體的早衰素表達的測量結果(如早衰素mRNA或蛋白水平)。非特異性測量結果包括細胞生理學方面的變化,如pH、細胞內鈣、環(huán)AMP水平、GTP/GDP比率磷脂酰肌醇活性、蛋白磷酸化等,可用儀器如Cytosensor microphysiometer(Molecular Devices Inc.,United States)監(jiān)測。通過檢測其它基因表達的變化,也可以監(jiān)測在其突變體或正常形式中,早衰素活性的激活或抑制,所述其它基因是導致早老性癡呆病的早衰素代謝途徑特異性的。這些可通過如示差顯示、示差雜交和SAGE(基因表達的系列分析)、以及細胞溶解產物的2D凝膠電泳來監(jiān)測在各種情況下,通過在應用候選化合物之前和其后的情況,通過相同的研究觀察可確定表達水平不同的基因。此外,如在另外一處所述的,通過克隆、核苷酸測序、氨基酸測序或質譜(參見Nowak,1995)可確定其表達受候選化合物調節(jié)的具體基因。
總之,可將細胞與候選化合物接觸,然后在適宜的時間后(如培養(yǎng)細胞有最大生物化學測量結果的0-72小時),檢測早衰素活性的標記,然后與基值進行比較。所述基值在將細胞與候選化合物接觸前測量或可以是用其它試驗確定的或本領域已知的外部基值。所述細胞可以是本發(fā)明的轉化細胞或來自動物或個體的外植物。具體地說,所述細胞可以是來自早衰素突變攜帶者(如患早老性癡呆病的人患者)或本發(fā)明動物模型(攜帶突變早衰素基因的轉基因線蟲或小鼠)的外植物。為了增強早衰素突變對Aβ肽途徑的影響,可用Aβ肽生產提高的轉基因細胞或動物。優(yōu)選細胞包括來自神經組織如神經元、神經膠質或混合細胞培養(yǎng)物的細胞;和培養(yǎng)的成纖維細胞、肝、腎、脾或骨髓的細胞。可將所述細胞在培養(yǎng)中體外與候選化合物接觸,或體內施用給活動物或人類受試者。對于給活動物或人類受試者,可口服或通過任何適合于所述化合物的胃腸道外途徑施用待測化合物。對于人類受試者的臨床試驗,可在數(shù)月或數(shù)年內定期完成測量(如每天、每周或每月)。
由于大部分早衰素突變的攜帶者均是雜合的(即攜帶一個正常的和一個突變早衰素等位基因),所以可檢測化合物調節(jié)正常以及突變早衰素活性的能力,因此例如,提高正常早衰素功能的化合物可具有治療早衰素相關疾病如早老性癡呆病的效用。另外,由于在雜合個體中抑制同時正常和突變早衰素的活性比相關疾病的發(fā)展的臨床危害更小,因此,需要鑒定失活或抑制所有形式早衰素的化合物。但優(yōu)選,鑒定選擇性或特異性失活或抑制突變早衰素活性,而不破壞正常早衰素基因或蛋白的功能的化合物。
根據(jù)鑒定方法、表征和本文公開的早衰素基因和蛋白、早衰素核酸探針和抗體、本發(fā)明的早衰素轉化的細胞和轉基因動物,本領域專業(yè)人員現(xiàn)在可以完成許多檢測候選化合物調節(jié)早衰素活性的試驗。下文將詳細討論特別優(yōu)選和完成的實施方案。
A早衰素表達在一系列實施方案中,用早衰素表達的具體測量結果篩選具有影響早衰素活性的能力的候選化合物。因此,利用本文公開并可得到的早衰素核酸和抗體,人們可以用mRNA水平或蛋白水平作為候選化合物調節(jié)早衰素活性的能力的指標,用所述探針和抗體測量基因和蛋白的表達是本領域熟知的,而且本文將另外討論。特別令人感興趣的是鑒定可改變早衰素不同剪接變體的相對水平的化合物。許多例如與早老性癡呆病有關的早衰素突變均位于推定的TM6→7環(huán)區(qū)域,所述環(huán)區(qū)域在某些外周組織(如白細胞)中會發(fā)生剪接改變,因此可提高所述剪接過程的相對頻率的化合物在預防該區(qū)域突變的表達方面是有效的。
B細胞內定位在另一系列的實施方案中,以其對早衰素原始和細胞內定位的作用為基礎,根據(jù)其調節(jié)早衰素活性的能力篩選化合物。用免疫細胞化學發(fā)現(xiàn)早衰素定位于與內質網和高爾基體有關的膜結構中,而一種早衰素突變體(H163R),但不是其它的,在未知功能的小胞質泡囊中可觀察到。因此,突變體和正常早衰素的定位差異可能說明了早衰素相關疾病的病因??梢杂帽绢I域已知的標準技術檢測早衰素的位置。通常這些技術施用本發(fā)明的抗體,特別是選擇性結合一種或多種突變早衰素,但不結合正常早衰素的抗體。如本領域熟知的,可用任何不同的技術(如熒光或放射性標記、標記的二級抗體、親和素-生物素等)標記所述抗體以有助于肉眼觀察所述早衰素在細胞內的位置。如本領域已知的,用抗那些結構標記(如用于高爾基體的TGN38,用于后-高爾基體運輸小泡的運鐵蛋白受體,用于脂質體的LAMP2)的抗體可將早衰素其定位到特定的結構上,也可使用用于富集不同細胞內膜結合細胞器(如脂質體、突觸小體、高爾基體)的、來自細胞溶解產物的純化級分的Western印跡。另外,例如用電子顯微鏡和抗所述結構域的抗體可檢測跨細胞結構域的早衰素的不同結構域的相對方向。
B離子調節(jié)/代謝在另一系列的實施方案中,可以細胞內Ca2+、Na+、或K+水平或代謝為基礎,根據(jù)其調節(jié)早衰素活性的能力來篩選化合物。如上所述,早衰素是可作用或相互作用于離子受體或離子通道的膜相關蛋白。因此,用膜片鉗、電壓鉗和對細胞內鈣或跨膜電壓敏感的熒光染料,通過測量離子通道流量和/或跨膜電壓或現(xiàn)流量,可根據(jù)其體內或體外調節(jié)早衰素相關鈣或其它離子代謝的能力來篩選化合物。也可通過測量二級信使如環(huán)AMP、cGMP酪氨酸激酶、磷酸鹽的激活,細胞內Ca2+水平的增加等也可檢測離子通道或受體功能。也可在人工膜系統(tǒng)中重建重組制備的蛋白以研究離子通道傳導,因此在所述研究中所用的細胞可含有人工膜或細胞。對表達內源正?;蛲蛔冊缢ニ氐呐囵B(yǎng)細胞可檢測其離子調節(jié)或代謝方面的變化??蓪τ幂d體轉染的細胞完成所述研究,所述載體能夠表達正?;蛲蛔凅w形式的早衰素之一或早衰素之一的功能結構域。另外,為了在所述檢測中增加測量到的信號,可用編碼通道蛋白的基因共轉染細胞。例如可用正?;蛲蛔冊缢ニ匦蛄泻途幋a大鼠腦Na+β1亞單位、兔骨骼肌Ca2+β1亞單位、或大鼠心K+β1亞單位的序列共轉染非洲爪蟾屬卵母細胞或大鼠腎細胞(HEK293)。通過卵母細胞中2-微電極電壓鉗記錄值或HEK293細胞中的全細胞膜片鉗記錄值,可測量早衰素相關或早衰素介導的離子通道活性方面的變化。
C細胞凋亡或細胞死亡在另一系列的實施方案中,以其對早衰素相關或早衰素介導的細胞凋亡或細胞死亡的作用為基礎,根據(jù)其調節(jié)早衰素活性的能力篩選化合物。因此,例如在培養(yǎng)基中確定細胞的細胞凋亡或細胞死亡基礎速率,或在動物模型或人類受試者尸體解剖后確定在特定年齡神經元損失的基礎程度,從而測量抑制細胞凋亡或細胞死亡的候選化合物的能力。通過標準顯微鏡技術(如光學顯微鏡)可測量細胞死亡,或通過核形態(tài)學特征或產生核小體的DNA片段圖譜更特異性地測量細胞凋亡(參見如,Gavrieli等,1992;Jacobson等,1993;Vito等,1996)。也可用TUNEL評估腦中的細胞死亡(參見例如Lassmann等,1995)。在優(yōu)選的實施方案中,根據(jù)其在本發(fā)明轉基因動物模型中抑制神經元損失的能力篩選化合物。例如可用攜帶突變體人突變體小鼠或人源化突變體基因的轉基因小鼠鑒定或評估延遲或抑制了與早老性癡呆病相關的神經變性的化合物。最近有Games等(1995)報道了攜帶突變體APP基因的相似的轉基因小鼠模型。
D Aβ肽生產在另一系列的實施方案中,根據(jù)其在APP加工中,其調節(jié)早衰素相關或早衰素介導之變化的能力來篩選化合物。在因APP加工中的差異而產生的數(shù)個異構體中生產了Aβ肽。Aβ肽是βAPP的一個39-43個氨基酸的衍生物,它在擴散的衰老斑和AD患者的血管中進行性沉積。在人腦中,Aβ肽在N-和C-末端均是異種的。但一些觀察結果表明在殘基42或43終止的長尾Aβ肽(即Aβ1-42/43和Aβx-42/43)的截斷形式在AD中比在殘基40終止的肽具有更重要的作用。因此,Aβ1-42/43和Aβx-42/43是衰老斑和擴散斑早期的顯著特征,而在殘基40終止的肽(即Aβ1-40和Aβx-40)與成熟斑(mature plaque)的亞型和淀粉樣血管顯著相關(參見如Iwatsubo等,1995;Gravina等,1995;Tamaoka等,1995;Podlisny等,1995)。此外,所述長末端異構體更傾向于原纖維形成,而且認為比其Aβ1-40肽有更大神經毒性(Pike等,1993;Hilbich等,1991)。最后,在與早期發(fā)作FAD有關的βAPP基因的密碼子717所發(fā)生的錯義突變會導致在突變攜帶者的腦中,以及在患有了和癥狀發(fā)生前的攜帶者的外周細胞和血漿中,在用βAPP717突變體cDNA轉染的細胞系(Tamaoka等1994;Suzuki等1994)中生產過量長尾Aβ。如下文實施例18所述,我們現(xiàn)公開了長Aβ肽形式生產的增加也與早衰素基因中的突變有關。
因此,在一系列的實施方案中,本發(fā)明提供了根據(jù)其阻斷或抑制表達突變早衰素基因的細胞或轉基因動物中Aβ肽長異構體生產增加的能力來篩選候選化合物的方法。具體地說,本發(fā)明提供了所述方法,其中用本文公開的方法轉化的培養(yǎng)的哺乳動物細胞(如腦細胞或成纖維細胞),或其中用本文公開的方法生產的轉基因動物表達相對高水平的突變早衰素。按需要,也可轉化所述細胞或轉基因動物以便以相對高的水平表達正常形式的βAPP蛋白。
在所述系列的實施方案中,將候選化合物施用給所述細胞系或轉基因動物(如通過加到培養(yǎng)中的細胞培養(yǎng)基中;或通過口服或胃腸道外施用于動物),然后在適宜的時間后(如細胞培養(yǎng)0-72小時,對于動物模型來說是數(shù)天或數(shù)月),收集生物樣品(如來自培養(yǎng)細胞的細胞培養(yǎng)上清液或細胞溶解產物;來自動物的組織勻漿物或血漿),然后檢測Aβ肽長異構體的水平??梢砸越^對的意義(如nMol/ml)或以相對意義(如長與短Aβ肽異構體的比率)來確定所述肽的水平。用本領域已知的任何方法(如電泳分離和測序)均可檢測所述Aβ肽異構體,但優(yōu)選用對長異構體有特異性的抗體來確定絕對或相對水平的Aβ1-42/43或Aβx-42/43肽。特別是在本發(fā)明的轉基因動物模型中,可降低這些長Aβ肽異構體的絕對或相對水平的候選藥物或治療方法在治療早老性癡呆病或因早衰素突變或APP代謝異常而引起的其它疾病中可能有治療效用。
E微小管相關蛋白的磷酸化在另一系列的實施方案中,通過評估所述化合物對微小管相關蛋白(MAP,如Tau)磷酸化水平的影響,根據(jù)其調節(jié)早衰素活性的能力來篩選候選化合物。在早老性癡呆病患者腦中,Tau和其它MAP的異常磷酸化是本領域熟知的。因此,預防或抑制MAP異常磷酸化的化合物可在治療早衰素相關疾病如AD方面有效用。如上所述,可以使用來自正?;蛲蛔凅w動物或受試者的細胞,或本發(fā)明的轉化細胞系和動物模型。優(yōu)選的檢測方法將使用用突變體人或人源化突變早衰素基因轉化的細胞系或動物模型??纱_定在這些細胞中MAP的基礎磷酸化狀態(tài),然后根據(jù)其預防、抑制或逆轉與突變體相關的超磷酸化作用的能力來試驗候選化合物。通過本領域已知的任何標準方法,可確定MAP的磷酸化狀態(tài),但優(yōu)選使用選擇性結合磷酸化的或非磷酸化表位的抗體。抗Tau蛋白磷酸化表位的所述抗體是本領域已知的(如ALZ50)。
9篩選并診斷早老性癡呆病A一般的診斷方法將本文公開或可得到的早衰素基因和基因產物,以及早衰素衍生的探針、引物和抗體用于篩選與早老性癡呆病有關的等位基因的攜帶者,用于診斷早老性癡呆病患者,以及用于篩選并診斷相關的早老和早老性癡呆、精神病如精神分裂癥和抑郁癥,以及神經性病如中風和大腦出血,所有這些癥狀都或多或少地出現(xiàn)在攜帶PS1或PS2基因或APP基因突變的人體中。通過各種技術,用探針檢測是否存在突變早衰素基因或蛋白就可常規(guī)篩選有患早老性癡呆病危險的個體,如在家族系譜中有AD的那些,或以前不知有此種危險的個體。通過以本文公開并可得到的核酸(包括基因組和mRNA/cDNA序列)、蛋白和/或抗體為基礎的方法,包括設計用來檢測正常早衰素活性衰竭或增強和/或是否存在由突變早衰素所賦予的特并性新活性的功能檢測方法,可診斷這些病的遺傳病例。優(yōu)選,所述方法和產物是以人PS1或PS2核酸、蛋白或抗體(如本文公開或可得到的)為基礎。但對于本領域專業(yè)人員顯而易見的是,甚至象人、小鼠、C.elegans和果蠅這樣各不相同的物種中,大部分PS1和PS2核苷酸和氨基酸序列具有明顯的進化保守性,使得本領域專業(yè)人員可利用所述非人早衰素同系物核酸、蛋白和抗體,甚至直接應用到人或其它動物。因此,為了簡短解釋,但又不限制本發(fā)明的范圍,下列描述將集中于人PS1和PS2同系物的用途。但應理解,來自其它種的同系物,包括本文公開的,對于許多目的來說是等同的。
本領域專業(yè)人員可以理解,本發(fā)明診斷方法的選擇會受到可得到的待檢生物樣品性質和所需信息的性質的影響。例如PS1在腦組織中高水平表達,但腦活檢是侵害性的,而且昂貴的過程,特別是對于常規(guī)篩選來說。但以顯著高的水平表達PS1的其它組織可能有剪接改變(如淋巴細胞),因此,來自所述細胞的PS1或蛋白可提供的資料較少。因此,以受試者的基因組PS1 DNA為基礎的檢測是優(yōu)選的,因為資料不依賴于剪接改變,而且基本上任何成核細胞均可提供可以使用的樣品。以其它早衰素(如hPS2,mPS1)為基礎的診斷也要考慮相似的問題組織的可獲得性、在不同組織中的表達水平以及因剪接改變而引起的不同的mRNA和蛋白產物。
B以蛋白為基礎的篩選和診斷當診斷是以早衰素蛋白為基礎時,可以使用不同的方法。例如,通過監(jiān)測正常和突變體蛋白在電泳遷移率方面的差異,可進行診斷。所述方法在鑒定突變體方面是特別有用的,在所述突變體中存在電荷取代,或其中插入、缺失或取代導致所得蛋白的電泳遷移有顯著的變化。另外,診斷可以以正常和突變體蛋白蛋白水解圖譜方面的差異、不同氨基酸殘基摩爾比方面的差異為基礎,或通過說明基因產物功能發(fā)生改變的功能檢測。
在優(yōu)選的實施方案中,以蛋白為基礎的診斷要利用抗體與正常和突變早衰素蛋白(特別是hPS1或hPS2)結合能力方面的差異。所述診斷試驗可利用結合正常蛋白,但不結合突變體蛋白的抗體,或反之。特別是,可使用多個單克隆抗體的檢測,其中每個單克隆抗體均能結合突變體表位。將抗突變體抗體在得自受試者的樣品中的結合水平(通過例如放射性標記、ELISA或化學發(fā)光肉眼觀察)與結合對照樣品的水平進行比較。另外,可使用結合正常而不是突變早衰素的抗體,可以利用抗體結合水平的降低將純合正常個體與突變體雜合或純合個體區(qū)別開。利用死前或尸檢后得到的CNS組織活檢樣品,所述抗體診斷可用于原位免疫組織化學,包括與這些疾病如神經纖維原纏結和淀粉樣斑相關的神經病理學結構,或可與液體樣品如腦脊液或外周組織如白細胞一起使用。
C以核酸為基礎的篩選和診斷當診斷試驗是以來自樣品的核酸為基礎時,檢測是以mRNA、cDNA或基因組DNA為基礎的。當使用來自樣品的mRNA時,許多有關源組織和剪接改變的可能性的考慮都適用。即,很少或沒有表達轉錄本,除非選擇了或可得到適宜的組織源,剪接改變會使有些信息丟失或很難解釋。但我們已經表明(Sherrington等,1995;Rogaev,1995)在從白細胞和/或皮膚成纖維細胞分離的mRNA/cDNA中,可以鑒定在PS1和PS2的5’UTR、3’UTR、開放閱讀框架和剪接位點中的突變。無論是檢測mRNA、cDNA還是基因組DNA,可以用本領域熟知的方法原位或體外檢測是否存在特定的序列(參見例如,Sambrook等,(1989)分子克隆實驗室手冊,第2版,冷泉港出版社,冷泉港,紐約)。但一般來說,可以檢測含有成核細胞的任何組織。
用于診斷的基因組DNA可從體細胞如血液中存在的那些、組織活檢、外科手術樣品或尸檢材料中得到。DNA可以分離并直接用于檢測特定的序列或在分析前通過聚合酶鏈反應(PCR)擴增。同樣,也可以用RNA或cDNA,可以用或不用PCR擴增。為了檢測特異性核酸序列,可以使用直接核苷酸測序、利用特異性寡核苷酸的雜交、限制酶消化和作圖、PCR作圖、RNase保護以及各種其它方法??梢曰瘜W合成并放射性或非放射性標記(如生物素標記、溴乙錠)特定序列特異性的寡核苷酸,然后與固定在膜或其它固體支持物上的個體樣品雜交(例如,通過點印跡或在電泳后從凝膠中轉移),或在溶液中雜交。然后用例如放射自顯影、熒光測定法或比色法肉眼觀察是否存在靶序列。用高密度固定硅片上的已知序列的、豐富的短寡核苷酸自動完成這些過程。
(1)適宜的探針和引物無論是雜交、RNase保護、連接酶-介導的檢測、PCR擴增還是本文所述的且本領域熟知的任何其它標準方法,本文公開或可得到的各種早衰素序列的亞序列均可用作探針和/或引物,這些序列或亞序列包括正常的早衰素序列和有害的突變體序列。總之,有用的序列包括來自早衰素內含子、外顯子或內含子/外顯子邊界的至少8-9,更優(yōu)選10-50,最佳為18-24個連續(xù)核苷酸。根據(jù)靶序列、所需的特異性以及未來技術的發(fā)展,較短的序列也可能有效用。因此,認為用于分離、克隆、擴增、鑒定或操作早衰素序列的任何早衰素衍生的序列均可作為適宜的探針或引物。認為特別有用的是包括來自其中已知存在致病突變的早衰素基因的核苷酸位置的序列,或這些位置側翼的序列。
(a)PS1探針和引物如上所述,在人PS1基因中已鑒定了不同的致病突變。用從正常或突變體PS1基因衍生的分離的核酸探針或引物,現(xiàn)在可以檢測這些和其它PS1突變。特別有用的是衍生于編碼N-末端、TM1-TM2區(qū)和TM6-TM7區(qū)的序列的探針或引物。但如上所述,已經檢測到影響PS1蛋白其它區(qū)的突變,而且用本文公開的方法,肯定可以檢測到。因此本發(fā)明提供了對應于PS1基因任何部分(包括內含子和5’及3’UTR)的正常和突變序列的分離的核酸探針和引物,可以表明所述部分與早老性癡呆病的發(fā)展有關。
僅作為實例,而不是限制本發(fā)明,在篩選和診斷方法中可以使用從C410Y周圍hPS1 DNA片段衍生的探針和引物。所述突變至少在某些個體中,是因SEQ ID NO1位置1477中的A取代G而引起的。因此,用包括該潛在突變位點的寡核苷酸探針或引物可以篩選來自個體外周血樣品的基因組DNA、mRNA或cDNA。對于該突變的雜交探針,可以使用跨該突變位點(如SEQ ID N01的bp 1467-1487)的8-50,更優(yōu)選18-24個堿基的探針。如果與mRNA一起使用所述探針,當然所述探針應當與mRNA互補,而且因此,對應于PS1基因的非編碼鏈。若探針與基因組DNA或cDNA一起使用,則探針可與任何一條鏈互補。為了用PCR方法檢測包含所述突變的序列,適宜的引物應包括衍生于突變兩側任一側區(qū)域的8-50,優(yōu)選18-24個核苷酸長的序列,而且對應于1-1000bp,但優(yōu)選1-200bp的任何位置,從中除去了突變位點。是突變位點5’(在編碼鏈上)的PCR引物應對應PS1基因編碼鏈的序列,而是突變位點3’(在編碼鏈上)的PCR引物應對應非編碼鏈或反義鏈(如對應于SEQ IDNO1的bp 1451-1468的5’引物,和對應于SEQ ID NO14的719-699補體的3’引物)。
對于其它PS1突變或一般的突變“熱點”,可選擇相似的引物。例如,M146L突變(在bp 684A→C)的5’PCR引物可含有對應于SEQ ID NO1的約bp 601-620的序列,而3’引物可對應于SEQ ID NO8的約bp1328-1309的補體。應注意該實施例使用了來自內含子和外顯子兩方面的序列。而另一實施例,A246E突變(在bp985C→A)的適宜5’引物可含有對應于SEQ ID NO1約bp 907-925序列,或對應于SEQ ID NO1約bp 1010-990的補體的3引物序列。作為另一實施例,H163R突變(SEQ ID NO1的bp736或SEQ ID NO9的bp 419 A→G)的5’引物含有對應于SEQ ID NO 9約bp354-375的序列,而3’引物對應于約bp 581-559的補體。相似的,也可以使用內含子或外顯子序列,例如生產L286V突變(SEQ ID NO1的bp 1104或SEQ ID NO11的bp 398C→G)的5’引物含有對應于SEQ ID NO11約bp 249-268或SEQ IDNO1約bp1020-1039的序列,而3’引物對應于SEQ ID NO11約bp510-491的補體。
還應注意,探針和引物可包括特定突變的核苷酸。因此,例如可生產C410Y突變的含有對應于SEQ ID NO1約bp 1468-1486的序列的雜交探針或5’引物以篩選或擴增正常的等位基因,或對應于相同序列但bp 1477改變了的(G→T)的探針或引物以篩選或擴增突變體等位基因。
(b)PS2探針和引物上述對PS1探針和引物的相同的總考慮也適用PS2的探針和引物。特別是,所述探針或引物可對應于內含子、外顯子或內含子/外顯子邊界序列,可對應于來自編碼或非編碼(反義)鏈的序列,而且可對應于正常或突變體序列。
僅僅作為實施例,用對應于SEQ ID NO18約bp 733-751的5’引物和對應于SEQ ID NO18約bp 846-829的3’引物,通過PCR擴增周圍的DNA片段可以篩選PS1 N141I突變。相似的,M239V突變(在bp 1080A→G)的5’引物可含有對應于約bp 1009-1026的序列,而3’引物可對應于SEQ ID NO 18約bp 1118-1101的補體。作為另一實施例,用對應于SEQ ID NO18約bp 1576-1593的5’引物和對應于SEQ ID NO18約bp1721-1701補體的3’引物,通過PCR擴增基因組DNA,可以篩選I420T突變周圍區(qū)域的編碼序列。例如然后可用野生型(如SEQ ID NO18的bp 1616-1632)和/或突變體(SEQ ID NO18的bp1616-1632,在bp1624T→C)序列的等位基因特異性寡核苷酸可檢測該產物。
(2)雜交篩選為了原位檢測正常或突變體PS1、PS2或其它早衰素相關的核酸序列,用標準技術可制備組織樣品,然后與一種或多種上述探針接觸,優(yōu)選的是標記的探針以便于檢測,在只允許探針與高度或精確互補序列雜交的嚴謹條件下,完成核酸雜交試驗。由于到目前為止,大部分檢測的PS1和PS2突變是單核苷酸取代,因此需要高度嚴謹?shù)碾s交條件來將正常序列與大多數(shù)的突變序列區(qū)別開。當已知受試者的早衰素基因型時,可選擇相應的探針。另外,可連續(xù)或組合使用針對不同突變體的探針。由于攜帶早衰素突變體的個體是雜合的,也可使用正常序列的探針,通過結合量(如通過放射性信號的密度)可將純合正常個體與突變雜合體區(qū)別開。在另一種改變中,在同時使用正常和突變體探針,但只標記了一種的情況下,可以使用競爭性結合試驗。
(3)限制酶切作圖序列改變還產生或破壞了偶然的限制識別位點,所述位點是通過使用適宜的酶消化,然后凝膠印跡雜交而揭示的。通過其大小的增加或減少,或通過增加或減少了相應的限制片段數(shù),可檢測攜帶所述位點(正常或突變體)的DNA片段??梢耘c基因組DNA、mRNA或cDNA一起使用所述限制片段長度多態(tài)性分析(RFLP)或限制酶切作圖。在限制酶切前,用上述引物,通過PCR可擴增早衰素序列,其中PCR產物長度可表明是否存在特定限制位點,和/或在擴增后可進行限制酶切。通過任何常規(guī)方法(如在存在溴乙錠時,在UV光下)肉眼觀察早衰素片段。
僅僅作為實施例,應注意PS1 M146L突變(SEQ ID NO1bp684A→C)破壞了PsphI位點;H163R突變(bp736A→G)破壞了NlaIII位點;A246E突變(bp 985C→A)產生了DdeI位點;L286V突變(bp1104C→G)產生了PvuIII位點。以本文公開并可得到的正常和突變體序列為基礎,本領域專業(yè)人員很容易從眾多市售限制酶中進行選擇,完成限制酶切作圖分析以檢測任何早衰素的突變。
(4)PCR作圖在另一系列的實施方案中,以PCR產物長度或PCR生產中的差異為基礎,可以檢測單個堿基取代突變。因此,可以用跨突變位點或優(yōu)選在突變位點有3’末端的引物擴增來自受試者基因組DNA、mRNA或cDNA的樣品。預期在突變位點的錯配以改變正?;蛲蛔凅w引物促進聚合酶鏈反應的能力,由此產生正常與雜合和/或純合早衰素突變體之間不同的產物圖。通過標準技術,如聚丙烯酰胺或瓊脂糖凝膠電泳并用標記的探針肉眼觀察、溴乙錠等可以有區(qū)別地分離并檢測正常和突變體基因的PCR產物。由于可能產生非特異性引發(fā)或突變位點的連讀,以及大部分突變體等位基因的攜帶者均是雜合的,所以所述技術的能力可能不夠。
(5)電泳遷移率以DNA序列差異為基礎的遺傳試驗也可以通過檢測DNA、mRNA或cDNA片段在凝膠中遷移率的改變來完成。通過單或雙鏈DNA的高分辨凝膠電泳或DNA異源雙鏈在非變性凝膠電泳中遷移圖譜的變化,可以肉眼觀察例如小序列缺失和插入。由于與mRNA或單鏈DNA二級結構相關的單鏈構象多態(tài)性(SSCP),也可以用研究遷移率變動的方法來檢測早衰素突變或多態(tài)性。
(6)錯配的化學裂解利用錯配的化學裂解(CCM)方法(參見例如Saleeba and Cotton,1993,和其中的參考文獻),也可以檢測早衰素中的突變。用該技術,可將探針(可達~1kb)與來自受試者的基因組DNA、cDNA或mRNA樣品混合。將樣品和探針混合,然后放在可形成異源雙鏈的條件下(如果需要的話)。優(yōu)選探針和樣品核酸均是雙鏈的,或將探針和樣品一起經PCR擴增以確保嚴生所有可能的錯配異源雙鏈。錯配的T殘基是四氧化鋨反應性的,而錯配的C殘基是羥胺反應性的。由于每個錯配的A都伴有錯配的T,每個錯配的G均伴有錯配的C,探針和樣品之間的任何核苷酸差異(包括小插入或缺失)均會導致形成至少一個反應性異源雙鏈。在用四氧化鋨和/或羥胺處理以修飾任何錯配位點后,通過例如與哌啶反應,在任何修飾的錯配位點對混合物進行化學裂解。然后用標準技術如凝膠電泳分析混合物以檢測說明探針和樣品之間錯配的裂解產物。
(7)其它方法以本文公開并可得到的早衰素序列為基礎,檢測早衰素突變的各種其它方法對于本領域專業(yè)人員來說是顯而易見的。根據(jù)本發(fā)明,任何這些技術均是可以使用的。這些包括,但不限于核酸酶保護試驗(S1或連接酶介導的)、連接的PCR、變性梯度凝膠電泳(DGGE;殘基例如Fischer andLerman,1983)、與SSCP結合的限制核酸內切酶指紋法(REF-SSCP;參見,Liu and Sommer,1995)等。
D其它篩選和診斷方法由于疾病狀態(tài),在遺傳病例的情況下,作為原發(fā)性疾病,和在非遺傳病例作為繼發(fā)性疾病,可能會發(fā)生PS1、PS2、APP或與PS1、PS2或APP反應的蛋白的異常加工。在身體組織或體液(如CSF或血液)中,可檢測為異常磷酸化、糖基化、糖化酰胺化或蛋白水解裂解產物。
通過觀察在早衰素轉錄、翻譯和翻譯后修飾和加工中的改變以及在腦和外周細胞中,早衰素基因細胞內和細胞外運輸方面的改變也可以完成診斷。所述改變包括早衰素信使RNA和/或蛋白數(shù)量分變化、磷酸化狀態(tài)的變化、異常細胞內定位/分布、異常細胞外分布等。所述試驗包括Northern印跡(用早衰素特異性和非特異性核苷酸探針)、Western印跡和酶聯(lián)免疫測定(ELISA)(用早衰素或早衰素功能結構域特異性的抗體,包括各種翻譯后修飾狀態(tài),包括糖基化和磷酸化異構體)??梢詫ν庵芙M織(如血液細胞、血漿、培養(yǎng)的和其它成纖維細胞組織等)以及死前或尸檢后得到的CNS組織的活檢以及腦脊液完成這些試驗。所述試驗也可包括原位雜交和免疫組織化學(以便將信使RNA和蛋白定位于特定的亞細胞區(qū)室和/或與這些疾病如神經纖維原纏結和淀粉樣斑相關的腦病理學結構內)。
E篩選和診斷試劑盒根據(jù)本發(fā)明,還提供了診斷試劑盒,所述試劑盒包括市售診斷篩選所必需的試劑。例如可提供包括抗體或多組抗體的試劑盒,所述抗體是一種或多種突變體表位特異性的。特別是可用有利于肉眼觀察結合的任何標準方法標記這些抗體。另外,可提供其中含有寡核苷酸探針或PCR引物的試劑盒,所述探針或引物用于檢測和/或擴增突變體PS1、PS2或其它早衰素相關核苷酸序列。此外,可以標記所述探針以便更容易檢測特異性增加。為了適用于上述各種診斷實施方案,可將在所述試劑盒中的寡核苷酸探針或抗體固定在底物上,然后可提供適宜的對照。
10治療方法本發(fā)明現(xiàn)在提供了治療因早衰素中的突變而引起的或可能被引起的疾病的基礎。如上所詳細描述的,在hPS1和hPS2中的突變與早期發(fā)作的早老性癡呆病的發(fā)展有關,因此,本發(fā)明特別涉及治療診斷患有或有可能發(fā)展早老性癡呆病的受試者的方法。但從PS1和PS2基因在各種組織中的表達來看,很可能在這些座位上突變的影響應不限于腦,因此可能是除早老性癡呆病以外的疾病的病因。因此,本發(fā)明還涉及早衰素基因和基因產物中的突變、錯表達、錯代謝或其它遺傳或獲得性改變而引起的其它組織中的疾病表現(xiàn)。另外,盡管早老性癡呆病表現(xiàn)為神經性疾病,但這種表現(xiàn)可能是因早衰素中的突變引起的,所述突變首先影響其它器官組織(如肝),然后釋放出影響腦活性的因子,最終引起早老性癡呆病。因此,在考慮下文所述的各種治療方法中,應理解所述治療可能是以腦以外的組織如心、胎盤、肺、骨骼肌、腎和胰腺為靶的,而在這些組織中也表達PS1和/或PS2。
不限于本發(fā)明的任何特定理論,與早衰素中突變相關的早老性癡呆病的影響似乎是獲得了新功能,或加速了正常功能,所述突變直接或間接引起淀粉樣前體蛋白(APP)不正常加工成Aβ肽,異常磷酸化體內穩(wěn)定和/或腦中的異常細胞凋亡。所述的功能獲得或功能加速模型與成年發(fā)作的癥狀和早老性癡呆病的顯性遺傳一致。然而,尚未了解早衰素中突變可能產生這些影響的機制。
已知APP可通過兩種途徑代謝。在第一種途徑中,將APP傳到高爾基體網絡,然后經包涵素包被的小泡進入分泌途徑而進行代謝的。然后成熟APP傳到漿膜,在漿膜由α-secretase裂解以產生可溶的級分(ProteaseNexinII)加非淀粉樣C-末端肽(Selkoe等,1995;Gandy等,1993)。另外,成熟APP可進入核內體-脂質體途徑,在該途徑中,它要經β和γ-secretase裂解以產生Aβ肽。APP的Ap肽衍生物是神經毒性的(Selkoe等,1994)。細胞的磷酸化狀態(tài)確定了α-secretase(非產淀粉樣)或Aβ途徑(產淀粉樣途徑)(Gandy等,1993)之間的相對平衡,而且通過佛波醇酯、毒蕈堿激動劑和其它試劑可對所述磷酸化狀態(tài)進行藥物修飾。細胞的磷酸化狀態(tài)似乎是由作用于一種或多種高爾基體網絡中的膜內在蛋白的細胞溶質因子(特別是蛋白激酶C)而介導的。
不受本發(fā)明特定理論的任何限制,早衰素,特別是hPS1或hPS2(攜帶蛋白激酶C的數(shù)個磷酸化共有序列)可能是膜內在蛋白,其磷酸化狀態(tài)確定了α-secretase與Aβ途徑之間的相對平衡。因此PS1或PS2中的突變會使其產物的結構和功能發(fā)生改變,從而導致與調節(jié)元件(如蛋白激酶C)或與APP的相互作用出現(xiàn)問題,由此促進APP進入產淀粉樣核內體-脂質體途徑。環(huán)境因素(如病毒、毒素或衰老)對PS1或PS2也有相似的影響。
同樣不受本發(fā)明特定理論的任何限制,還應注意PS1和PS2蛋白都有與人離子通道蛋白和受體基本同源的氨基酸序列。例如用Altschul等(1990)的BLASTP范例,PS2蛋白與人鈉通道α亞單位(E=0.18,P=0.16,在至少35個氨基酸殘基的2個區(qū)內同一性=22-27%)基本同源。其它疾病(如人中的惡性高熱和高鉀血性周期性癱瘓,以及C.elegans中的機械性感覺神經元的變性)是由離子通道或受體蛋白中的突變而引起的。因此PS1或PS2基因中的突變可能會影響相似的功能,并導致早老性癡呆病和/或其它精神性和神經性疾病。
治療早衰素相關疾病如AD的治療方法是基于(1)施用正常PS1或PS2蛋白,(2)用正常PS1或PS2進行基因治療以補償或取代突變基因,(3)以突變PS1或PS2基因的反義序列或“剔除”突變基因為基礎的基因治療,(4)以編碼阻斷或改正PS1或PS2突變體有害作用的蛋白的序列為基礎的基因治療,(5)以正常和/或突變體PS1或PS2蛋白的抗體為基礎的基因治療,或(6)小分子(藥物),它們改變PS1或PS2表達,阻斷PS1或PS2的突變體形式與其它蛋白或配體之間的異常相互作用,或通過改變突變體蛋白的結構,通過增強其代謝清除或通過抑制其功能而阻斷突變體PS1或PS2的異常功能。
A蛋白治療通過用正常蛋白取代突變蛋白、通過調節(jié)突變蛋白的功能或通過提供過量的正常蛋白以降低突變蛋白任何異常功能的影響,可以治療早衰素相關的早老性癡呆病或因早衰素突變而引起的其它疾病。
為了達到此目的,需要得到如本文所述和可得到的大量基本純的PS1蛋白或PS2蛋白,所述蛋白來自可表達所述蛋白的培養(yǎng)的細胞系統(tǒng)。用適宜的包裝或給藥系統(tǒng)可將所述蛋白傳遞到患病的腦區(qū)或其它組織,包括如通過脂質體介導而將蛋白傳遞到靶細胞。
B基因治療在一系列的實施方案中,可使用基因治療,其中將正??截惖腜S1基因或PS2基因導入到患者體內以便在一種或多種不同類型的患病細胞中成功地編碼正常蛋白。必須將所述基因以可將其攝入并編碼足夠蛋白以通過有效功能的形式傳遞到那些細胞中。因此,優(yōu)選將重組基因與強啟動子可操作相連以便提供可補償或out-compete突變體蛋白的高水平表達。如上所述,重組構建體可含有內源或外源調節(jié)元件、可誘導或可阻遏調節(jié)元件或組織特異性調節(jié)元件。
在另一系列的實施方案中,用重組構建體通過同源重組可用基因治療取代突變基因。重組構建體可含有正常拷貝的靶早衰素基因,其中在原位更正缺陷或可含有導入終止密碼子、錯義突變或可消除突變基因功能的缺失的“剔除”構建體。應注意在該方面,所述構建體在雜合個體中可同時剔除正常和突變拷貝的靶早衰素基因,但總的早衰素基因功能的失去對個體的不利影響比使所述疾病狀態(tài)繼續(xù)發(fā)展要小。
在另一系列的實施方案中,可以使用反義基因治療。反義治療的基礎是基因表述的序列特異性抑制可通過mRNA或DNA與互補反義鏈之間的細胞內雜交而達到。然后雜種螺旋的形成會影響基因的轉錄和/或加工、運輸、靶早衰素mRNA的翻譯和/或穩(wěn)定性。反義治療可利用各種方法,包括施用反義寡核苷酸或反義寡核苷酸類似物(如具有硫代磷酸骨架的類似物)或用反義RNA表達載體轉染。另外,所述載體可包括外源或內源調節(jié)區(qū)、可誘導或可阻遏調節(jié)元件、或組織特異性調節(jié)元件。
在另一系列的實施方案中,可以用基因治療導入編碼蛋白或肽的重組構建體,所述蛋白或肽可阻斷或更正因突變早衰素基因而引起的異常功能。在一實施方案中,所述重組基因編碼對應于早衰素突變結構域的肽,發(fā)現(xiàn)所述突變結構域與另一細胞蛋白或其它細胞配體有不正常的相互作用。因此,例如,如果發(fā)現(xiàn)突變體TM6→7結構域與特定細胞蛋白相互作用,但相應的正常TM6→7結構域沒有這種相互作用,則可用基因治療提供過量的與突變體蛋白競爭并抑制或阻斷所述異常相互作用的突變體TM6→7結構域。另外,用重組構建體可編碼并表達與突變體有相互作用,但與正常的早衰素沒有相互作用的部分蛋白以便競爭,并由此抑制或阻斷不正常的相互作用。最后,在另一實施方案中,通過基因治療,經插入第二突變體蛋白,可獲得相同的效果,所用的方法與在c.elegans中,通過插入突變體轉基因而更正“Degl(d)”和“Mec4(d)”突變的方法相似。
由于其可高效感染并可穩(wěn)定的整合和表達,所以可以將反轉錄病毒載體用于體細胞的基因治療。但靶基因必須能夠分裂,而且正常蛋白的表達水平應很高,因為這種疾病是顯性的。可將全長PS1或PS2基因,編碼早衰素的功能結構域或上述任何其它治療肽的亞序列克隆到反轉錄病毒載體中,從其內源啟動子、從反轉錄病毒的長末端重復或從靶細胞(如神經元)特異性的啟動子開始轉錄。可以使用的其它病毒載體包括腺相關病毒、牛痘病毒、牛乳頭瘤病毒或皰疹病毒如EB病毒。
C免疫治療免疫治療對于早老性癡呆病也是可行的。生產抗突變PS1或PS2(或其部分)的抗體,然后施用給患者以結合或阻斷突變體蛋白,并抑制其不利的影響。同時,應促進正常蛋白產物的表達。另外,生產抗突變體或野生型PS1或PS2與其相互作用配對物之間的特異性復合物的抗體。
另一種方法是刺激抗所需抗原的內源抗體的生產。給藥應是以一次免疫原制品或疫苗接種的形式??蓪⒚庖咴M合物制備成可注射制劑,制成溶液或乳液。可將PS1或PS2蛋白或其它抗原與可藥用與所述蛋白相容的賦形劑混合。所述賦形劑可包括水、鹽、右旋糖、甘油、乙醇和其組合。免疫原組合物和疫苗還可含有附加物質如乳化劑或佐劑以增強效力。可通過皮下或肌肉內注射胃腸道外施用免疫原組合物和疫苗。
以治療有效的、保護性和致免疫量施用所述免疫原制品或疫苗。劑量取決于給藥途徑,而且可隨宿主的大小而變化。
D小分子治療方法如本文所述和可得到的,本發(fā)明提供了許多鑒定小分子或其它化合物的方法,所述小分子或化合物可用于治療早老性癡呆病或因早衰素中突變而引起的其它疾病。因此,例如本發(fā)明提供了鑒定早衰素結合蛋白的方法,特別是鑒定結合或與突變早衰素但不與正常早衰素相互作用的蛋白或其它細胞組分的方法。本發(fā)明還提供了鑒定小分子的方法,可用所述小分子破壞突變早衰素與所述蛋白或其它細胞組分之間的異常相互作用。
所述相互作用,包括突變體但不包括正常早衰素,不僅提供了用于了解因早衰素中突變而擾亂的生物化學途徑的資料,以及早老性癡呆病病因,而且還為介入該病的病因提供了直接的治療靶。通過鑒定這些蛋白并分析這些相互作用,可以篩選或設計反作用或抑制所述相互作用的化合物,因此可治療這種不正常的相互作用。這些治療可改變早衰素與這些配對物之間的相互作用,改變相互作用蛋白的功能,改變相互作用配對物的量或組織分布或表達,或改變早衰素本身的相似特性。
可以設計治療方法以調節(jié)這些相互作用,并因此治療早老性癡呆病以及與PS1或PS2基因或其基因產物的獲得性或遺傳異常相關的其它疾病。在暴露于治療藥物后,用對應于PS1基因、PS2基因或其它早衰素同系物的合成肽或重組蛋白,通過標準藥物動力學測量親和性(Kd和Vmax等),分析親和性與這些相互作用的功能,就可以檢測這些治療方法的潛在效力。檢測涉及功能結構域如親水環(huán)的任何相互作用的另一種方法是通過原位雜交、免疫組織化學、Western印跡以及存在或不存在所述治療藥物條件下的代謝脈沖追蹤研究來監(jiān)測細胞內運輸和翻譯后修飾。另一種方法是監(jiān)測“下游”事件的影響包括(i)APP及其產物細胞內代謝、運輸和導向的變化;(ii)第二信使過程如cAMP細胞內Ca2+,蛋白激酶活性等的變化。
如上所述,早衰素可能涉及APP代謝,早衰素的磷酸化狀態(tài)對于α-secretase與APP加工的Aβ途徑之間的平衡是至關重要的。用本發(fā)明的轉化細胞和動物模型,人們可以更好地理解這些途徑和在早衰素突變體中發(fā)生的異常事件。然后用所述知識,人們可設計治療方法以逆轉早衰素突變體的不利影響。
為了治療早老性癡呆病,例如通過化學或生物化學試劑(如藥物、肽和其它化合物)可改變PS1和/或的磷酸化狀態(tài),所述試劑可改變蛋白激酶C和其它蛋白激酶的活性,或改變蛋白磷酸酶的活性,或將PS2可用性修飾成翻譯后被修飾的狀態(tài)。激酶`磷酸酶與早衰素蛋白之間的相互作用,以及早衰素與其它蛋白的相互作用涉及高爾基體網絡內的APP運輸,可對其進行調節(jié)以減少高爾基體小泡向核內體-脂質體途徑的運輸,由此抑制Aβ肽的生產。所進化合物將包括APP肽類似物、PS1、PS2和其它早衰素同系物,以及其它相互作用蛋白、類脂、糖和促進PS1、PS2和/或其它同系物進行差異糖基化的試劑;改變早衰素mRNA或蛋白生物半衰期的試劑,包括抗體和反義寡核苷酸;以及作用于PS1和/或PS2轉錄的試劑。
通過監(jiān)測PS1和/或PS2的轉錄、翻譯和翻譯后修飾(如磷酸化或糖基化),以及PS1和/或PS2通過各種細胞內和細胞外區(qū)室的細胞內運輸,可了解這些試劑在細胞系和整個動物中的作用。用于這些的研究方法包括Western和Northern印跡,用放射性標記的甲硫氨酸和ATP代謝標記(脈沖追蹤)后的免疫沉淀和免疫組織化學。用標準結合親和性試驗或利用抗蛋白激酶C、APP、PS1、PS2或其它早衰素同系物的抗體的共沉淀和Western印跡,通過檢測與蛋白激酶C和/或APP相互作用的PS1和/或PS2蛋白的相對結合親和性和相對量的研究,也可檢測這些試劑的作用。在暴露于推定的治療試劑之前和之后,通過用ELISA評估Aβ肽的生產,也可檢測這些試劑的作用(參見,如Huang等,1993)。在暴露于認為在早老性癡呆病中有神經毒性的鋁鹽和/或Aβ肽后,通過評估細胞系的生存力也可檢測這些試劑的作用。最后,通過評估動物的認知功能,可檢測這些試劑的作用,所述動物攜帶在APP和/或其早衰素同系物的正?;蛐?,攜帶人早衰素轉基因(帶有或不帶有突變)或攜帶任何這些組合。
相似的,如上所述,早衰素可能涉及Ca2+作為受體或離子通道的Ca2+的調節(jié)。用本發(fā)明的轉化細胞系和動物模型也可研究早衰素的所述作用。基于這些結果,可產生用于早老性癡呆病的試驗以檢測異常受體或異常離子通道功能,所述功能與早衰素基因和其產物或同系物基因之一和其產物中的獲得性或遺傳性異常有關。用膜片鉗、電壓鉗和細胞內鈣或跨膜電壓敏感性的熒光染料,通過測量離子通道流量和/或跨膜電壓或電流流量,可在體內或體外完成所述試驗。通過測量第二信使如環(huán)AMP的激活、cGMP酪蛋白激酶、磷酸鹽、細胞內Ca2+水平的增加等,也可檢測離子通道或受體功能缺乏。在人工膜系統(tǒng)中,也可重建重組制備的蛋白以研究離子通道傳導。通過分析其修飾異常離子通道的能力或通過分析早衰素基因中突變而誘導的受體功能,可檢測影響早老性癡呆病(由于PS1基因和PS2基因中的獲得性/遺傳性缺陷;由于導致該疾病的其它途徑中的缺陷如APP突變;和由于環(huán)境因素)的治療方法。通過其修飾離子通道的正常功能或早衰素蛋白的受體能力,也可檢測治療方法??梢詫Ρ磉_內源正常或突變體PS1基因/基因產物或PS2基因/基因產物的培養(yǎng)的細胞完成所述檢測。所述研究還可對用能夠表達正?;蛲蛔凅w形式的早衰素之一、或早衰素之一的功能結構域的載體轉染的細胞完成所述研究??稍O計用于早老性癡呆病的治療方法以修飾PS1基因或PS2基因的異常的離子通道或受體功能。所述治療可以是常規(guī)藥物、肽、糖或類脂以及影響PS1或PS2基因產物的特性的抗體或其它配體。所述治療也可通過基因治療直接取代PS1基因和/或PS2基因來完成。在離子通道的情況下,用小基因(cDNA加啟動子)或基因組構建體可完成所述基因治療,所述構建體攜帶早衰素基因的部分或全部基因組DNA序列。也可用突變早衰素或同系物基因序列抵消早衰素基因的遺傳或獲得性異常的影響,如最近完成的在C.elegans中Mec 4和Deg 1的取代一樣(Huang and Chalfie,1994)。所述治療也可以涉及加強一種同系物如PS2的受體或離子通道功能,以便有效地取代另一同系物突變體形式的功能(如通過獲得性或遺傳缺陷而產生的PS1基因提供的缺陷性)。使用基因治療或蛋白取代治療的標準技術,也可通過用反義寡核苷酸阻斷突變體PS1基因或突變體PS2基因的表達并協(xié)同使用正常PS1或PS2基因取代進行治療。
實施例實施例1最小共分離區(qū)的遺傳、物理“重疊區(qū)”和轉錄圖譜的研究用寡核苷酸探針,檢索CEPHMegaYAC和RPCIPAC人總基因組DNA文庫,檢測其中含來自染色體14q24.3的AD3區(qū)的基因組DNA片段,所述探針是有關在遺傳連鎖研究中所用的12 SSR標記座位以及其它標記的每個標記(Albertsen等;Chumakov等,1992;loannu等,1994)。在重疊群上描述了各標記之間的遺傳圖距離,而且是得自公開的數(shù)據(jù)(NIH/CEPH Collaborative Mapping Group,1992;Wang,1992;Weissenbach等,1992;Gyapay等,1994)。用4種不同的方法,將各起始標記座位的回收克隆排列成有序的部分重疊的克隆系列(“重疊群”)。首先,用反向PCR(Riley等,1990)分離表示YAC插入片段的末端的序列,然后與含DNA限制消化片段的Southern印跡組雜交以鑒定攜帶重疊序列的其它YAC克隆,所述DNA來自從所有開始座位回收的YAC克隆。第二,對各YAC進行Alu間PCR,在回收的YAC克隆池之間比較所得的帶圖譜以鑒定攜帶重疊序列的其它克隆(Bellamne-Chartelot等,1992;Chumakov等,1992)。第三,為了提高Alu PCR指紋法的特異性,用HaeIII或RsaI限制酶切YAC DNA,用Alu和LIH共有序列引物擴增限制酶切產物,用聚丙烯酰胺凝膠電泳分辨所述產物。最后,在研究被轉錄序列的過程中,會產生其它的STS,也可用這些STS鑒定重疊序列。除在攜帶D14S52的YAC932C7和含D14S61的YAC746B4之間有單個不連續(xù)點外,所得的重疊群是完整的。在所述重疊群中STS的物理圖譜順序與該區(qū)域的遺傳連鎖圖非常一致(NH/CEPH Collaborative Mapping Group,1992;Wang and Weber,1992;Weissenbach等,1992;Gyapay等,1994)。但正如遺傳圖譜一樣,它不可能清楚地分辨D14S43/D14S71簇和D14S76/D14S273簇中座位的相對順序。PAC1克隆表明D14S277是D14S268的端粒,而遺傳圖譜說明的順序正好相反。此外,至少在一個YAC克隆中,有些STS探針不能檢測雜交圖譜,而以最節(jié)儉的共有序列物理圖譜和遺傳圖譜為基礎,已經認為所述克隆中含有所述STS。例如在YAC788H12中沒有D14S268(AFM265)和RSCAT7 STS。由于這些結果是可再現(xiàn)的,而且數(shù)個不同的STS標記都會發(fā)生這種情況,因此,這些結果很可能表明在YAC克隆之一中存在小的中間缺失。
實施例2染色體14q24.3標記的累計性兩點優(yōu)勢分數(shù)用100ng的基因組DNA,通過PCR確定各多態(tài)性微衛(wèi)星標記座位的基因型,所述DNA來自前述所有患和未患病系譜的成員(Weissenbach等,1992;Gyapay等,1994)。用來自相同人種的spouses和其它神經正常受試者確定各等位基因的正常種群頻率,但顯著不同于混合的高加索種群的頻率(Weissenbach等,1992;Gyapay等,1994)。最大置信度計算值確認發(fā)作年齡的校正值,推測了來自公開的混合高加索受試者系列的標記等位基因頻率,以及估計的如前所述的AD3突變的等位基因頻率為1∶1000(St.George-Hyslop等,1992)。用相同標記等位基因頻率,以及僅從如前所述的患病系譜所得到的表型資料來重復所述分析,以確保在最大置信度計算值中所用的估計的參數(shù)不會誤導所述分析(St.George-Hyslop等,1992)。這些補充分析不會顯著改變明顯的支持連鎖或所發(fā)現(xiàn)的重組事件。
實施例3側標記之間的單元型與FAD中的AD3一起分離在14個早期發(fā)作的FAD系譜(系譜NIH2、MGH1、Torl.1、FAD4、MEX1和FAD2)中,與AD3分離的染色體14的親本拷貝上,著絲粒和端粒側標記之間延伸的單元型表明系譜特異性優(yōu)勢分數(shù)>3.00,D14S258和D14S53之間的至少一個標記是這樣。在相似人種的數(shù)個系譜中,帶病的分離染色體的兩個區(qū)域中觀察到部分相同的單元型。在A區(qū),在D14S268可見到共有的等位基因(“B”等位基因大?。?26bp,在普通高加索人中的等位基因頻率=0.04;“C”大小=124bp,頻率=0.38);D14S277(“B”大?。?56bp,頻率=0.19;“C”大?。?54bp,頻率=0.33);RSCAT6(“D”大小=111bp,頻率0.25;“E”大?。?09bp,頻率=0.20;“F”大?。?07bp,頻率=0.47)。在B區(qū),在D14S43觀察到相同大小的等位基因(“A”大?。?93bp,頻率=0.01;“D”大小=187bp,頻率0.12;“E”大小=185bp,頻率=0.26;“I”大小=160bp,頻率=0.38);D14S273(“3”大?。?93bp,頻率=0.38;“4”大?。?91bp,頻率0.16;“5”大?。?89bp,頻率=0.34;“6”大?。?87bp,頻率=0.02)和D14S76(“1”大?。絙p,頻率=0.01;“5”大?。絙p,頻率0.38;“6”大小=bp,頻率=0.07;“9”大小=bp,頻率=0.38)。參見Sherrington等(1995)的詳細描述。
實施例4從AD3間隔回收轉錄的序列用直接雜交方法,回收在AD3間隔中編碼的推定的轉錄序列,在所述方法中將從人腦mRNA產生的短cDNA片段與固定的克隆基因組片段(Rommens等,1993)雜交。以所得的短的推定轉錄序列作為探針以便從人腦cDNA文庫(Stratagene,La Jolla)中回收更長的轉錄本。通過分析雜交圖譜來確定源短克隆和所得的長cDNA克隆的物理位置,所述雜交圖譜是通過將探針與含一組EcoRI消化的總DNA樣品的Southern印跡雜交而產生的,所述DNA樣品是從重疊群內的個體YAC克隆分離的。用自動循環(huán)測序儀(Applied Biosystems Inc.,CA)確定各長cDNA克隆的核苷酸序列,然后用blast算法(Altschul等,1990)與核苷酸和蛋白數(shù)據(jù)庫中的其它序列進行比較。轉錄序列的登記號為L40391,L40392,L40393,L40394,L40395,L40396,L40397,L40398,L40399,L40400,L40401,L40402和40403。
買施例5用限制酶確定PS1基因中突變的位置用PCR在基因組DNA中檢測是否存在A246E突變(產生DdeI限制位點),所述PCR利用基本上對應于SEQ ID NO1的bp907-925的末端標記引物和對應于SEQ ID NO1的bp1010-990補體的未標記引物,以便用100ng基因組DNA模板,2mM MgCl2,各10 pmol的引物,0.5UT聚合酶,250uM dNTP進行30個循環(huán)擴增84bp的基因組外顯子片段,每循環(huán)含95℃×20秒,60℃×20秒,72℃×5秒。按照制造商的說明,將產物與過量DdeI保溫2小時,然后在6%非變性聚丙烯酰胺凝膠上分辨并通過放射自顯影肉眼觀察。由于存在DdeI限制位點,所以從84bp片段的裂解說明存在突變。所有FAD1系譜的患病成員和數(shù)個有危險的成員中均攜帶有DdeI位點。應患而未患病者(年齡在70歲以上而未患病的個體)及正常對照均不帶有DdeI突變。
實施例6用等位基因特異性寡核苷酸確定PS1基因中突變的位置用等位基因特異性寡核苷酸檢測C410Y突變的存在。用對應于SEQ IDNO1的bp 1451-1468的外顯子序列引物和與SEQ ID NO14的bp719-699互補的反內含子序列引物,用上述條件,不同的是用2.5mMMgCl2,94℃×20秒,58℃×20秒和72℃×10秒的循環(huán)條件,來擴增100ng的基因組DNA。用0.4M NaOH,25 mM EDTA稀釋10倍來變性所得的216bp的基因組片段,然后真空狹線印跡到復制尼龍膜上。48℃在5×SSC,5×Denhardt’s,0.5%SDS中,將末端標記的“野生型”引物(對應于SEQ ID NO1的bp1468-1486)和末端標記的“突變體”引物(對應于相同序列但在位置1477有G→A的取代)與不同拷貝的狹線印跡濾紙雜交1小時,然后在23℃,用2×SSC,在50℃用2×SSC連續(xù)洗滌,接著暴露于X射線膠片。所有AD3和NIH2系譜的可檢測患病成員以及有危險的成員均有C410Y突變。用SSCP檢測C410Y突變的努力表明共同的內含子序列多態(tài)性有相同的SSCP遷移圖譜。
實施例7Northern雜交表明在不同組織中PS1蛋白mRNA的表達用標準方法如CsCl純化,從外科手術得到的不同組織樣品(包括心、腦和胎盤的不同區(qū)域、肺、肝、骨骼肌、腎和胰腺)中分離總胞質RNA。然后在甲醛凝膠上電泳RNA以便進行大小分級分離。制備硝酸纖維素膜,然后將RNA轉移到所述膜上。制備32P-標記的cDNA探針,然后加到膜中以便使探針和RNA直接發(fā)生雜交。洗滌后,用塑料膠片纏繞膜,并放到含X射線膠片的成像盒中。然后進行放射自顯影以顯影一到數(shù)天。通過與標準RNA標記比較來確定大小。放射自顯影的分析表明在3.0kb有一明顯的帶(參見Sherrington等,1995的圖2)。這些Northern印跡表明在所有檢測的組織中均有PS1基因的表達。
實施例8真核和原核表達載體系統(tǒng)用不同類型的PS1核苷酸cDNA插入序列已得到適用于真核和原核表達系統(tǒng)的構建體。第一種稱為全長構建體,將完整的PS1 cDNA序列以正確的方向插入到表達質粒中,并包括天然5’UTR和3’UTR序列以及完整的開放閱讀框架。所述開放閱讀框架含有一核苷酸序列盒,所述盒可使野生型開放閱讀框架包含在表達系統(tǒng)中,或另外將單或組合的雙突變插入到所述開放閱讀框架中。通過用酶NarI和PflmI從野生型開放閱讀框架中除去一限制酶切片段,然后用通過反轉錄酶PCR產生的相似片段取代之,所述相似片段含有編碼M146L突變或H163R突變的核苷酸序列。通過用酶PflmI和NcoI裂解,可從開放閱讀框架的野生型正常核苷酸序列中除去第二個限制酶切片段,并用攜帶編碼A246E突變、A260V突變、A285V突變、L286V突變、L392V突變或C410Y突變的核苷酸序列的限制酶切片段取代。通過將帶有一個前種突變的NarI-PflmI片段與攜帶一個后種突變的PflmI-NcoI片段相連可制備第三個變體,該變體帶有M146L或H163R突變與剩余突變之一串聯(lián)的組合。
第二種cDNA插入片段,稱為截斷的構建體,是通過從全長野生型或突變體cDNA序列中除去5’UTR和部分3’UTR而構建的。用含KpnI限制位點(GGTAC/C)和小序列(GCCACC )的合成寡核苷酸取代5’UTR序列以在PS1 ORF開始的ATG(SEQ ID NO1的bp 249-267)產生Kozak起始位點。用對應于SEQ IDNO1的bp2568-2586的補體的寡核苷酸取代3’UTR,所述寡核苷酸在5’末端有一人工EcoRI位點。然后通過將上述突變序列插入到上述NarI-PflmI和PsImI-NcoI位點而制備該構建體的突變變體。
第三種構建體包括衍生于克隆cc44的序列,其中外顯子4的可變剪接是得自于N-末端的4個殘基(SEQ ID NO3)的去除。
對于真核表達來說,將上述帶有野生型和突變序列的這些不同cDNA構建體克隆到表達載體pZeoSV中,其中通過限制消化已除去了SV60啟動子,并用pcDNA3(Invitrogen)CMV啟動子元件取代。對于原核表達來說,用谷胱甘肽S-轉移酶(GST)融合載體pGEX-kg制備構建體。已粘附到GST融合核苷酸序列上的插入片段是與上述攜帶正常開放閱讀框架核苷酸序列或上述單和雙突變組合相同的核苷酸序列。這些GST構建體可在原核系統(tǒng)中將部分或全長蛋白表達為突變體或野生型GST融合蛋白,因此通過用凝血酶消化就可除去GST融合產物,從而純化全長蛋白。用GST融合載體可制備另一cDNA構建體,以便將對應于全長蛋白TM6和TM7之間親水酸性環(huán)的氨基酸序列生產為衍生物核苷酸序列或作為攜帶A285V突變、L285V突變或L392V突變的突變序列。用對應于SEQ IDNO1的bp1044-1061的、含有5’BamHI限制位點(G/GATCC)的5’寡核苷酸引物,和對應于SEQ ID NO1的bp1476-1458的補體的、含有5’EcoRI限制位點(G/AATTC)的3’引物,通過從適宜來源的RNA中回收野生型或突變序列來完成。這樣可將對應于在BamHI和EcoRI親水酸性環(huán)結構域的適宜突變或野生型核苷酸序列克隆在pGEX-KG載體中。
實施例9定位PS1基因中的其它突變用表示成熟mRNA/cDNA序列或基因組DNA的RT-PCR產物,通過各種方法(直接核苷酸測序、等位基因特異性寡核苷酸、連接聚合酶鏈反應、SSCP、RFLPs)可檢測PS1基因中的突變。對于A260V和A285V突變,用相同的PCR引物和用于L286V突變的方法,可擴增攜帶外顯子的基因組DNA。
然后將PCR產物變性,并用上述用于C410Y突變的狹線印跡方法狹線印跡復制到尼龍膜上。
在48℃,通過用對應于野生型序列(SEQ ID NO1的bp1017-1036)或突變序列(SEQ ID NO1的bp1017-1036,在bp1027有C→T的突變)的末端標記的等位基因特異性寡核苷酸雜交,然后在52℃用含O.1%SDS的3×SSC緩沖液洗滌,將A260V突變記錄在這些印跡上。按上述將A285V突變記錄在這些狹線印跡上,但在48℃用另外的野生型序列(SEQ ID NO1的bp1093-1111)或突變引物(SEQ ID NO1的bp1093-1111,在bp 1102有C→T的突變)的等位基因特異性寡核苷酸,然后在52℃按上述洗滌,但洗滌溶液是2×SSC。
用調整PCR緩沖條件,除鎂濃度是2mM,和循環(huán)體條件94℃×10秒,56℃×20秒,和72℃×10秒,用引物(5’對應于SEQ ID NO14的bp439-456,而3’與SEQ ID NO14的bp719-699互補)從基因組DNA的外顯子擴增來記錄L392V突變。按對于C410Y所述,將所得的200個堿基對的基因組片段變性,用狹線印跡復制到尼龍膜上。通過與野生型末端標記的寡核苷酸(SEQ ID NO1的bp1413-1431)或末端標記的突變引物(SEQ ID NO1的bp1413-1431,在bp 1422有C→G的突變)在45℃示差雜交,然后用2×SSC在23℃,接著在68℃連續(xù)洗滌來表明是否存在突變。
實施例10抗體生產通過固相技術合成對應于部分PS1蛋白的肽抗原,然后通過反相高效液壓層析來純化。經二硫鍵,將肽與匙孔_藍蛋白(KLH)相連,所述二硫鍵可能是通過在早衰素片段的C-末端加入半胱氨酸殘基而制備的。在該蛋白序列中,正常不會出現(xiàn)該附加的殘基,而包含該殘基僅僅是為了便于與KLH分子相連??贵w所抗的特異性早衰素序列如下多克隆抗體# hPS1抗原(SEQ ID NO2)1142 30-44519 109-123520 304-3181143 346-360這些序列被包含在PS1蛋白的特異性結構域內。例如殘基30-44在N-末端內,殘基109-123在TM1→2環(huán)內,304-318和346-360在大TM6→7環(huán)內。將這些結構域均暴露在含水介質內,而且這些結構域可能與其它發(fā)展疾病表型至關重要的蛋白的結合。肽的選擇是基于用IBIPustell抗原性預測算法分析蛋白序列。
在弗氏佐劑中用各種肽抗原的肽-KLH復合物共免疫3種新西蘭白兔,隔7天進行加強注射。收集各肽的抗血清,合并,用硫酸銨IgG沉淀。然后用與適宜肽結合的Sulfo-link瓊脂糖(Pierce)親和純化抗體。要進行這步最后的純化以除去在免疫前或免疫后血清中存在的非特異性相互作用的其它抗體。
用三種試驗確定各抗體的特異性。首先,在腦勻漿物的Western印跡上,檢測與預測在早衰素-1近似大小的單顯著帶。第二,與攜帶適宜序列的重組融合蛋白進行交叉反應。第三,用重組PS1或免疫肽預吸附,可特異性阻斷。
另外,已用兩種不同的PS1肽谷胱甘肽S-轉移酶(GST)融合蛋白生產PS1抗體。第一種融合蛋白包括與GST融合的PS1的氨基酸1-81(N-末端)。第二種融合蛋白包括與GST融合的PS1的氨基酸266-410(TM6→7環(huán)結構域)。通過將適宜的核苷酸序列插入到pGEX-2T表達質粒(Amrad)中,可生產編碼這些融合蛋白的構建體。所得的構建體包括編碼GST的序列和位于GST和PS1肽之間的凝血酶敏感性裂解位點。將表達構建體轉染到DH5α大腸桿菌中,用IPTG誘導融合蛋白的表達。溶解細菌沉淀,通過在谷胱甘肽瓊脂糖珠(Boehringer-Mannheim,Montreal)上進行一步親和層析來純化可溶性的GST-融合蛋白。用標準方法,用GST-融合蛋白免疫小鼠以產生單克隆抗體。用純化的早衰素片段篩選從這些小鼠中得到的克隆。
另外,用凝血酶裂解GST-融合蛋白以釋放PS1肽。用大小排阻層析純化釋放的肽,然后用于免疫兔以產生多克隆抗血清。
用相似的方法,用包含早衰素-2的氨基酸1到87(N末端)或272到390(TM6→TM7環(huán))的核苷酸序列的構建體來制備GST融合蛋白,然后用來產生抗那種蛋白的單克隆抗體。用凝血酶裂解PS2-GST融合蛋白,用釋放并純化的肽免疫兔以制備多克隆抗血清。
實施例11鑒定PS2基因中的突變用第一引物對和第二引物對從成淋巴細胞或冷凍尸檢后腦組織的RNA生產對應于PS2 ORF的RT-PCR產物,所述第一引物對的5’引物對應于SEQ ID NO18的bp478-496,3’引物與SEQ ID NO18的bp1366-1348互補,是一888bp的產物,第二引物對的5’引物對應于SEQ ID NO18的bp1083-1102,3’引物與SEQ ID NO18的bp 1909-1892互補,是一826bp的產物。用在10ml中250 mMol dNTPs,2.5 mM MgCl2,10pMol寡核苷酸,94℃×20秒,58℃×20秒,72℃×45秒,經40個循環(huán)完成PCR。用自動循環(huán)測序儀(ABI,F(xiàn)oster City,CA)確定PCR產物的序列,通過直接觀察和Factura(ver 1.2.0)和Sequence Navigator(ver1.0.1b15)軟件包掃描熒光層析譜中的雜合核苷酸取代(數(shù)據(jù)未列出)。
N141I突變的檢測在核苷酸787A→T取代產生BclI限制位點。用各10pMol的寡核苷酸,從100ng基因組DNA擴增攜帶該突變的外顯子,所述寡核苷酸對應于SEQ ID NO18的bp 733-751(末端標記的)和SEQ IDNO18的bp846-829的補體(未標記的),PCR反應條件與下列用于M239V突變的條件相似。按照制造商的方法,在10ml反應體積中用BclI(NEBL,Beverly,MA)限制酶切2ml的PCR產物,用非變性聚丙烯酰胺凝膠電泳分辨所述產物。在帶有野生型序列的受試者中,將114bp的PCR產物裂解成68bp和46bp片段。突變序列裂解成53bp、46bp和15bp的產物。
M239V突變的檢測在核苷酸1080A→G取代缺失了NlaIII限制位點,使得可通過用各10 pMol的寡核苷酸,從100 ng基因組DNA擴增可檢測是否M239V突變,所述寡核苷酸對應于SEQ ID NO18的bp1009-1026和SEQ ID NO18的bp1118-1101的補體。PCR條件是0.5U Taq聚合酶,250 mM dNTP,1mCi α32P-dCTP,1.5 mM MgCl2,10m1體積;30個循環(huán)的94℃×30秒,58℃×20秒,72℃×20秒,以產生一110bp產物。將2ml PCR產物稀釋到10ml,用3 U NlaIII(NEBL,Beverly,MA)限制酶切3小時。用非變性聚丙烯酰胺凝膠電泳分辨所述產物,然后通過放射自顯影肉眼觀察。正常受試者的裂解產物為55、35、15和6bp,而突變體序列得到55、50和6bp的片段。
I420T突變的檢測與上述方法相似,用對應于SEQ ID NO18的bp1576-1593和SEQ ID NO18的bp1721-1701的補體的引物對,通過PCR擴增基因組DNA,可篩選I420T突變以產生一146堿基對的產物。然后用野生型(如SEQ ID NO18的bp1616-1632)和突變體(如SEQ IDNO18 bp1616-1632,在bp1624有T→C的突變)序列等位基因特異性的寡核苷酸檢測該產物。
實施例12轉基因小鼠構建系列的野生型和突變體PS1和PS2基因以用于制備轉基因小鼠。用標準技術,通過克隆的cDNA cc33(PS1)和cc32(PS2)的定點誘變來產生突變PS1和PS2基因。
用cDNA cc33和cc32及其突變體制備如實施例8所述的兩種突變體和野生型PS1和PS2 cDNA。第一種稱為“全長”cDNA,通過EcoRI(PS1)或PvuII(PS2)消化,從polyA前除去3’非翻譯區(qū)的約200bp來制備。第二種稱為“截斷的”cDNA,通過用ATG啟始密碼子5’的核糖體結合位點(Kozak共有序列)取代5’非翻譯區(qū)來制備。
將按上述制備的各種全長和截斷的野生型和突變體PS1和PS2 cDNA導入到一種或多種下列載體中,用所得的構建體作為生產轉基因小鼠的基因來源。
cos.TET表達載體該載體衍生于含Syrian倉鼠PrP基因的粘粒克隆。已經由Scott等(1992)和Hsiao等(1995)作了詳細描述。將PS1和PS2 cDNA(全長或截斷的)插入到該載體中的SalI位點。最終構建體含有插入cDNA側的20kb的5’序列。該5’側序列包含PrP基因啟動子,50bp的PrP基因5’非翻譯區(qū)外顯子,剪接供體位點,1kb內含子,剪接受體位點,該位點鄰接于PS1或PS2基因要插入的SalI位點。插入的cDNA 3’側序列包含約8kb的含多聚腺苷酸化信號的PrP3’非翻譯區(qū)片段。用NotI(PS1)或FseI(PS2)消化該構建體釋放出位于PrP啟動子控制下的突變體或野生型PS基因。將釋放的片段進行凝膠純化,然后用Hsiao等(1995)的方法注射到受精小鼠卵的前核中。
血小板延生的生長因子受體β-亞單位構建體來自人血小板的生長因子受體β-亞單位啟動子的3’末端的SalI(全長PS1 cDNA)或HindIII(截斷的PS1 cDNA、全長PS2 cDNA和截斷的PS2 cDNA)與SV40 poly序列5’末端的EcoRI位點之間導入PS cDNA,然后將完整的盒克隆到pZeoSV載體(Invitrogen,San Diego,CA.)中。凝膠純化通過ScaI/BamHI消化釋放的片段,然后用用Hsiao等(1995)的方法注射到受精小鼠卵的前核中。
人β-肌動蛋白構建體將PS1和PS2 cDNA插入到pBAcGH的SalI位點。通過所述插入而產生的構建體包含3.4Kb人β-肌動蛋白5’側序列(人β-肌動蛋白啟動子、剪接的78bp人β-肌動蛋白5’非翻譯外顯子和內含子)和PS1或PS2插入片段,其后為含數(shù)個內含子和外顯子的2.2kb的人生長因子激素基因組序列以及多聚腺苷酸化信號。用SfiI釋放含PS的片段,凝膠純化,然后用用Hsiao等(1995)的方法注射到受精小鼠卵的前核中。
磷酸甘油酸激酶構建體將PS1和PS2 cDNA導入到pKJ90載體中。將該cDNA插入到人磷酸甘油酸激酶啟動子下游的KpnI位點和磷酸甘油酸激酶基因3’非翻譯區(qū)上游的XbaI位點。用PvuII/HindII(PS1 cDNA)或PvuII(PS2 cDNA)消化片段釋放含PS的片段,然后凝膠純化所述片段,如上所述,注射到受精小鼠卵的前核中。
實施例13在真核細胞中表達重組PS1和PS2用pcDNA3載體(Invitrogen,San Diego,CA.),在各種細胞類型(如PC12、成神經細胞瘤、中國倉鼠卵巢和人胚胎腎293細胞)中表達重組PS1和PS2。插入到該載體中的PS1和PS2 cDNA是與實施例8相同的全長和截斷的cDNA。
將這些cDNA插入到pcDNA 3的CMV啟動子和牛生長因子激素多聚腺苷酸化位點之間。高水平表達轉基因。
另外,用pCMX載體在COS細胞中表達PS1和PX2。為了便于標記并示蹤早衰素蛋白的細胞內位置,將編碼衍生于人c-myc抗體的11個氨基酸的寡核苷酸(參見例如Evan等,1985)和由單克隆抗c-myc抗體MYC1-9E10.2(Product CRL 1729,ATCC,Rockville,Md)作框內連接,緊接在PS1和PS2開放閱讀框架cDNA之前或之后。并制備了未標記的pCMX構建體。將c-myc標記的構建體導入到pcDNA3,以轉染CHO細胞。
用制造商的方法,用Lipofectamine(Gibco/BRL)瞬時和穩(wěn)定轉染這些構建體。在48小時后,檢測培養(yǎng)物的瞬時表達。用0.5mg/mlGeneticin(Gibco/BRL)篩選穩(wěn)定轉染的細胞系。
用上述抗早衰素抗體1142、519和520,通過Westem印跡檢測轉染的PS蛋白的表達??傊芙馀囵B(yǎng)的轉染細胞(2%SDS,5mM EDTA,1mg/ml亮抑蛋白酶肽和抑蛋白酶肽),通過Lowry法確定蛋白濃度。在SDS-PAGE梯度凝膠(4-20%Novex )上分離蛋白,然后在恒定電壓(50伏),經2小時轉移到PVDF(10mM CAPS)上。用脫脂奶(5%)經1小時阻斷非特異性結合。然后用兩種兔多克隆抗體(在TBS中~1mg/ml,pH7.4)將蛋白檢測12小時。用生物素化的山羊抗兔二級抗體鑒定早衰素的交叉反應種類,用辣根過氧化物酶結合的三級鏈霉抗生物素蛋白、4-氯-萘酚和過氧化氫可肉眼觀察所述二級抗體。用上述抗早衰素抗體(以檢測早衰素肽抗原)和培養(yǎng)上清液(以檢測myc-表位),通過Western印跡檢測c-myc標記的早衰素肽,所述上清液來自雜交瘤MYC1-9E10.2,以1∶10稀釋用于Western印跡,以1∶3稀釋用于免疫細胞化學。用不同的早衰素抗體并通過myc-表位抗體(用于用含myc的質粒轉染的細胞系)鑒定50-60kDa的免疫反應主帶。用一些早衰素抗體檢測~10-19kDa和~70kDa的小帶。
對于免疫細胞化學,用在Tris緩沖鹽(TBS)中的4%甲醛固定轉染的細胞,用TBS加0.1%Triton充分洗滌,然后用3%阻斷BSA非特異性結合。用早衰素抗體(如上述抗體520和1142;通常為5-10mg/ml)檢測固定的細胞,洗滌并用FITC-或若丹明結合的山羊抗兔二級抗體進行肉眼觀察。對于c-myc-標記的早衰素構建體,將1∶3稀釋的雜交瘤MYC1-9E10.2上清液與抗小鼠二級抗體一起使用。用0.1%苯二胺(ICN)在90%甘油中固定載玻片以保持熒光。用抗BIP(或抗鈣聯(lián)接蛋白)(StressGen,Victoria,B.C.)和麥胚凝集素(EY Labs,San Mateo,CA)分別作為內質網和高爾基體的標記。用抗肌動蛋白(Sigma,St.Louis,Mo.)、抗淀粉樣前體蛋白(22C11,Boehringer Mannheim)和抗神經絲(NF-M特異性,Sigrna)在神經元細胞系NSC34中完成雙免疫標記。這些免疫熒光研究表明所述轉染產物廣泛分布在細胞內,特別是在核周圍多是內質網和高爾基體的特征,這與在非轉染細胞中觀察到的相似,但更密度更高,有時溢到核膜內。在用myc標記的早衰素構建體瞬時轉染的CHO和COS細胞中觀察到c-myc和PS表位的共免疫定位。
因此用免疫細胞化學、Northern印跡、Western印跡(用上述抗早衰素抗體,用抗構建體中myc標記與3’或5’c-myc標記的單克隆抗體MYC1-9E10.2)證實轉染細胞中轉染早衰素基因的Robust表達。
實施例14用親和層析分離早衰素結合的蛋白為了鑒定與早衰素生物化學功能有關的蛋白,用親和層析分離PS1結合的蛋白。用按照實施例8所述制備的含PS1 TM6→7環(huán)的GST-融合蛋白檢測人腦提取物,所述提取物是通過在生理鹽水中用Polytron勻漿腦組織而制備的。與谷胱甘肽-瓊脂糖珠保溫,通過預清除內源GST結合組分的腦勻漿物來消除非特異性結合。然后將這些無GST勻漿物與GST-PS融合蛋白一起保溫以生產具有功能結合蛋白的所需復合物。用磷酸緩沖鹽充分洗滌后,用SDS-聚丙烯酰胺凝膠電泳(SDS-PAGE;Tris-tricine梯度凝膠4-20%)分別分離蛋白。除在50-60kDa有數(shù)個弱帶外,在~14和20kDa還觀察到兩個主帶。
這些蛋白與TM6→7環(huán)之間相互作用的藥理學修飾可用于治療早老性癡呆病。另外,在早衰素生物化學途徑中可能起作用的這些蛋白可能是引起早老性癡呆病的新交變位點。
實施例15用雙雜交酵母系統(tǒng)分離早衰素結合的蛋白為了鑒定與早衰素蛋白相互作用的蛋白,通過將編碼PS1蛋白殘基266-409或PS2蛋白殘基272-390的框內部分cDNA序列連接到載體的EcoRI和BamHI位點而產生酵母表達質粒載體(pAS2-1,Clontech)。所得的融合蛋白含有與PS1蛋白的TM6→7環(huán)或PS2蛋白的TM6→7環(huán)框內相連的GAL4 DNA結合結構域。用Clontech Matchmaker酵母雙雜交試劑盒(Clontech)將這些表達載體與來自人腦cDNApACT文庫的純化質粒DNA共轉化到酵母中。用HIS抗性和βgal+活性來篩選與TM6→7環(huán)相互作用的攜帶人腦cDNA的酵母克隆。再用環(huán)己酰胺(cyclohexamide)敏感性篩選克隆,用PCR分離人腦cDNA插入片段,然后測序。按照制造商說明的方法篩選陽性克隆,在6百萬個起始轉化體中,在HIS篩選后,得到200個陽性克隆,在經βgal+顏色篩選后,得到42個克隆。這42個克隆中,有數(shù)個(5-8個)代表相同基因的不同克隆。這表明這些相互作用是生物學真實的而且是可重復的。
實施例16轉基因C.elegans通過微注射卵母細胞來得到轉基因C.elegans。用載體pPD49.3 hsp16-41和pPD49.3 hsp 16-2來達到此目的。先用前一種載體,生產其中導入了正常hPS1基因或突變體(L392V)的轉基因C.elegans。用上述人cDNA探針cc32和抗體519、520和1142,通過在Northern印跡或Western印跡上檢測人cDNA的表達來檢測轉化的動物。制備載體和/或注射cis雙突變體hPS1基因(M146L和L392V)、正常hPS2基因和突變體(N141I)基因。
實施例17克隆果蠅早衰素同系物,DmPS根據(jù)公開的核苷酸序列數(shù)據(jù),即以Trp為終止/開始的(如在PS1中的殘基Trp247和Trp404;在PS2中的Trp253和Trp385)早衰素/sel-12蛋白的高度保守區(qū)設計豐余的寡核苷酸5’ctn ccn gar tgg acn gyc tgg(SEQ IDNO22和5’rca ngc(agt)at ngt ngt rtt cca(SEQ ID NO23)。從成年和胚胎黑尾果蠅的mRNA,用這些引物進行RT-PCR(50ml體積,2mM MgCl,30個循環(huán)的94℃×30秒,57℃×20秒,72℃×20秒)。然后94℃×1秒,59℃×0.5秒和72℃×1秒的條件以及內部保守的豐余引物5’ttt tttctc gag acn gcn car gar aga aay ga(SEQ ID NO24)和5’ttt ttt gga tcc tar aa(agt)atr aar tcn cc(SEQ ID NO25)再擴增所述產物。將~600bp產物克隆到pBS的BamHI和XhoI位點。將這些產物測序,并表明含有與人早衰素高度同源的具有推定氨基酸序列的開放閱讀框架。用該片段篩選常規(guī)的黑尾果蠅cDNA/Zap文庫(Stratagene,CA)以回收大小為~2-2.5kb的待測序的6個獨立cDNA克隆(克隆pds8,pds13,pds1,pds3,pds7和pds14)。最長的ORF編碼有541個氨基酸的多肽,該肽與人早衰素有52%的一致性。
實施例18 Aβ肽的長異構體的檢測從組織病理學已確定有PS1或βAPP71突變的FAD;已知沒有家族史的零星AD;其它成年發(fā)作的神經變性性疾病(HD=遺傳行慢性舞蹈?。籄LS=肌萎縮性側索硬化癥);先天愚型(DS);和沒有神經病征狀的對照的冷凍大腦皮質中,用99%甲酸,經69分鐘(20℃)提取Aβ肽。200000×g離心20分鐘后,將上清液與沉淀分離,然后稀釋、中和并通過ELISA檢測。為了確定Aβ肽的量,使用了4種單克隆抗體。先用抗體BNT-77(檢測來自Aβ中心的表位)和抗體BAN-50(檢測N-末端殘基)結合所有類型的Aβ,包括含有或不含有N-末端截短(BNT-77)或僅沒有N-末端截短(BAN-50)的雜合形式。然后用另兩種單克隆抗體區(qū)別Aβ的不同C-末端形式,所述單克隆抗體檢測終止于殘基40的短尾Aβ(抗體βA-27)或終止于殘基42/43的長尾Aβ(抗體BC-05)。按前述(Tamaoka等,1994;Suzuki等,1994)完成兩位點ELISA。總之,將100μg的標準肽或來自腦組織的上清液應用到用BNT-77抗體包被的微滴定板上,然后在4℃保溫24小時,用磷酸緩沖鹽洗滌,然后與HRP-標記的BA-27和BC-05抗體,在4℃保溫24小時。用前述TNB微孔過氧化物酶系統(tǒng),通過顏色顯色來檢測HRP活性。用配對的學生氏t試驗,比較診斷組之間的皮質Aβ水平。用Student-Newman-Keuls多重比較試驗,結合評估所有Aβ異構體的數(shù)據(jù)表明來自βAPP717和零星AD的受試者的Aβ1-42水平與PS1突變情況的不同,但與對照相似。相反,當考慮Aβx-42水平時,3組有顯著不同高(PS1和βAPP717AD),中等(零星AD)和低(對照)。
具體地說,測量14個對照受試者(包括5個在40-50歲發(fā)作的患其它神經變性性疾病的受試者)大腦皮質中不同Aβ異構體的濃度,表明只有低濃度的短尾Aβ(Aβ1-400.06±0.02nmol/g濕組織±SEM;Aβx-40=0.17±0.40)和長尾A β(Aβ1-42/430.35±0.17;Aβx-42/431.17±0.80)這兩種。相反,在有PS1突變的所有4個受試者的大腦皮質中,長尾Aβ肽均有上升(Aβ1-42/436.54±2.0,p=0.05;Aβx-42/4323.91±4.00,p<0.01)。在有βAPP717突變的受試者(Aβ1-42/432.03±1.04;Aβx-42/4325.15±5.74)和有零星AD的受試者(Aβ1-42/431.20±0.40,p=0.008;Aβx-42/4314.45±2.81)的皮質中均檢測到長尾Aβ肽有相似的增加。在有PS1或βAPP717突變的受試者中,在Aβ肽長尾異構體增加的同時,短尾Aβ肽異構體也有少量但不顯著的增加(如,Aβx-42/43在PS1突變體中是3.08±1.31;在βAPP717突變體中是1.56±0.07)。因此,長與短異構體的比率也顯著增加。但是,在典型零星AD的病例中,長尾Aβ肽異構體增加的同時,短尾Aβ肽異構體的增加比前者要大得多(Aβ1-403.92±1.42;Aβx-42/4316.60±5.88)。與對照相比,短尾Aβ肽的這種增加在統(tǒng)計學上是顯著的(對于Aβ1-40和Aβx-42/43,p<0.03),但與PS1和βAPP717的情況相比,是邊界統(tǒng)計學顯著的(p_0.05)。分析來自先天愚型成年患者的皮質樣品表明,其圖譜與在零星AD中觀察到的相似。
盡管本文詳細描述了本發(fā)明的優(yōu)選實施方案,但本領域專業(yè)人員應理解,在未偏離本發(fā)明精神或權利要求范圍內可進行各種改變。表1
表2PS1結構域近似位置N-末端 1-81TM1 82-100TM1→2 101-132TM2 133-154TM2→3 155-163TM3 164-183TM3→4 184-194TM4 195-212TM4→5 213-220TM5 221-238TM5→6 239-243TM6 244-262TM6→7 263-407TM7 408-428C-末端 429-467
表3PS2結構域 近似位置N-末端 1-87TM1 88-106TM1→2 107-134TM2 135-160TM2→3 161-169TM3 170-189TM3→4 190-200TM4 201-218TM4→5 219-224TM5 225-244TM5→6 245-249TM6 250-268TM6→7 269-387TM7 388-409C-末端 410-448
表4在SEQ ID NO1 核苷酸變化 氨基酸變化 功能結構域 FAD的發(fā)作年齡中的位置1. NA NA A79? N-末端 642. 492 G→CV82LTM1 553. NA NA V96FTM1 NA45 591 T→CY115H TM1→2 375. 664 T→CM139T TM2 496. NA NA M139V TM2 407. 676 T→CI143T TM2 358. 684 A→CM146L TM2 459. NA NA M146V TM2 3810. 736 A→GH163R TM2→3 5011. NA NA H163Y TM2→3 4712. NA NA L171P TM3 3513. NA NA G209V TM4 NA14. NA NA I211T TM4 NA15. 939 G→AA231T TM5 5216. 985 C→AA246E TM6 5517. 1027C→TA260V TM6 4018. NA NA C263R TM6→7 4719. 1039C→TP264L TM6→7 4520. NA NA P267S TM6→7 3521. NA NA E280A TM6→7 4722. NA NA E280G TM6→7 4223. 1102C→TA285V TM6→7 5024. 1104C→GL286V TM6→7 5025. NA 缺失Δ291-319 TM6→7 NA26. 1399G→CG384A TM6→7 3527. 1422C→GL392V TM6→7 25-4028. 1477C→A2410y TM7 43
表5在SEQ ID NO18 核苷酸變化 氨基酸變化 功能結構域 FAD的發(fā)作年齡中的位置1. 787 A→T N141ITM2 50-652. 1080 A→G M239VTM5 50-703. 1624 T→C IA20TCC-末端 45表628-61 302-31065-71 311-325109-112 332-342120-122 346-359218-221 372-382241-243 400-410267-269表725-45 282-29050-63 310-31470-75 321-338114-120 345-352127-132 380-390162-167 430-435221-226
參考文獻Albertsen et al.(1990)Proc.Natl.Acad.Sci.(USA)874256-4260.Altschul et al.(1990)J.Mol.Biol.215403-410.Bellamme-Chartelot et al.(1992)cell 701059-1068.Bergamini et al.(1991)Acta Neurol.13534-538.Brand and Perrimon(1993)Development 118401-415.Bueler et al.(1996)Nature 356577-582.Campion et al.,(1995)Hum.Molec.Genet. 42373-2377.Campos-Ortega and Jan(1991)Ann.Rev.Neurosci.14399.Canadian Patent Application No.2,096,911Canadian Patent Application No.2,071,105Chartier-Harlin et al.(1991)Nature 353844-846.Chumakov et al.(1992)Nature 359380-387.Cruts et al.(1995)Hum.Molec.Genet..42363-2371.Davis(1996)Phvsiol.Reviews(in press).Evan et al.(1985)Mol.Cell Biol.53610-3616.Fischer and Lerman(1983)Proc.Natl.Acad.Sci.(USA)801579-1583.Foncin et al.(1985)Rev.Neurol.(Paris)141194-202.Frommelt et al.(1991) Alzheimer Dis.Assoc.Disorders 536-43.Games et al.(1995)Nature 373523-527.Gandy et al.(1993)Gavrieli et al.(1992)J.Cell Biol.119493-501.Goate et al.(1991)Nature 349704-706.Goudsmit et al.(1981)J.Neurol.Sci.4979-87.Gravina et al.(1995)J.Biol.Chem.2707013-7016.Gyapay et al.(1994)Nature Genetics7246-339.Hilbich et al.(1991)J.Mol.Biol.218149-163.Hogan et al.(1986)Manipulating the Mouse Embrvo,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York.Hsiao et al.(1995)Neuron.(in press).Huang and Chalfie(1994)Huang et al.(1993)Ince and Scotto(1995)J.Biol.Chem.27030249-30252.International Patent Applicaticn No.WO 94/23049International Patent Application No.WO 94/00569Ioannu et al.(1994)Nature Genetics684-89.Iwatsubo et al.(1995)Ann.Neurol.37294-299.Jacobson et al.(1993)Nature 361365.Kahn(1995)Science270369-370.Karlinsky et al.(1992)Neurology 421445-1453.Katzman(1986)N.Eng.J.Med.314964-973.Kollmar and Farnham(1993) Proc.Soc. Expt.Biol.Med.203127-137.Krause and Aaronson(1991)Methods in Enzvmologv,200546-556.Kyte and Doolittle(1982)J.Mol.Biol.157105Lamb et al.(1993)Nature Genetics522-29Lassmann et al.(1995)Acta Neuropathol.8935.Levesque et al.(1996)in press.Levitan and Greenwald(1995)Nature 377351-3S4.Liu and Sommer(1995)Biotechnigues18470-477.Martin et al.(1995) NeuroReoort(in press).Mullan et al.(1992)Nature Genetics1345-347.Murrell et al.(1991)Science 25497-99.Nee et al.(1983) Arc.Neurol.40203-208.NIH/CEPH Collaborative Mapping Group(1992)Science 25867-86.Nowak(1995)Science270363.71.Obermeir et al.(1994)Embo J.71585-1590.Pericak-Vance et al.(1988)Exp.Neurol.102271-279.Phizicky and Fields(1994)Microbiol.Reviews 5994-123.Pike et al.(1993)J.Neurosci.131676-1678.Podlisny et al.(1995)J.Biol.Chem.2709564-9570.Pollen(1993)Hannah′s HeirsThe Ouest for the Genetic Originsof Alzheimer′sDisease.Oxford University Press,Oxford.Querfurth et al.(1995)Molec.Brain Res.28319-337.Riley et al.(1990)Nucl.Acid Res.182887-2890.Rogaev et al.(1993)Meurology432275-2279.Rogaev et al.(1995)Nature376775-778.Rommens et al.(1993)Hum.Molec.Genet.2901-907.Saieeba and Cetton(1993)Methods in Enzvmolccy217286-295.Saunders et al.(1993)Neurology431467-1472/Schellenberg et al.(1993)Am.J.Hum.Genet.53619-628.Schellenberg et al.(1992)Science258668-670.Scheuner et al.(1995)Soc.Neurosci.Abstr.211500.Schindler and Darnell(1995)Annu.Rev.Biochem.64621-651.Scott et al.(1992)Selkoe et al.(1995)Selkoe et al.(1994)Sherrington et al.(1995) Nature375754-760.St.George-Hyslop et al.(1990)Nature347194-197.St.George-Hyslop et al.(1994)Science263537.Strittmatter et al.(1993)Proc.Matl.Acad.Sci.(USA)901977-1981.Suzuki et al.(1994)Science 2641336-1340.Tamaoka et al.(1994)J.Biol.Chem.26932721-32724.Tamaoka et al.(1995) Brain Res.679151-156.United States Patent No.5,297,562Van Broeckhoyen et al.(1992) Nature Genetics 2335-339.Vito et al.(1996)Science 271521-525.Wang(1992)Genomics13532-536.Weissenbach et al.(1992) Nature359794-798.Wong et al.(1993)Neurosci.Lett.15296-98.Zheng et al.(1995)Cell 81525-531
序列表(1)一般資料(i)申請人(A)名稱HSC研究和開發(fā)有限公司(B)街道555University Avenue(C)城市Toronto(D)州 Ontario(E)國家加拿大(F)郵政編碼(ZIP)M5G1X8(G)電話(416)813-5982(H)電傳(416)813-5085(A)名稱THE GOVERNING COUNCIL OF THE UNIVERSITY OF TORONTO(B)街道106,Simcoe Hall,27King’s College Circle(C)城市Toronto(D)州Ontario(E)國家加拿大(F)郵政編碼(ZIP)M5S1A1(G)電話(416)978-7461(H)電傳(416)978-1878(A)名稱ST.GEORGE-HYSLOP,Peter H.
(B)街道210Richview Avenue(C)城市Toronto(D)州Ontario(E)國家加拿大(F)郵政編碼(ZIP)M5P3G3(A)名稱FRASER,Paul E.
(B)街道611 Windermere Avenue(C)城市Toronto(D)州Ontario(E)國家加拿大(F)郵政編碼(ZIP)M6S3L9(A)名稱ROMMENS,Johanna M.
(B)街道105McCaul Street(C)城市Toronto(D)州Ontario(E)國家加拿大(F)郵政編碼(ZIP)M5T 2XT(ii)發(fā)明題目與早老性癡呆病有關的基因序列和蛋白及其用途(iii)序列數(shù)25(iv)相關地址(A)收件人Sim & McBurney(B)街道330Universitv Avenue,6th Floor(C)城市Toronto(D)州Ontario(E)國家加拿大(F)ZIPM5G1R7(v)計算機可讀形式(A)介質類型軟盤(B)計算機lBM PC兼容(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release#1.0,Version#1.30(vi)目前的申請資料(A)申請?zhí)朠CT/CA96/00263
(B)申請日1996年4月29日(C)分類號(vii)在先申請資料(A)申請?zhí)朥S08/509359(B)申請日1995年7月31日(vii)在先申請資料(A)申請?zhí)朥S08/496841(B)申請日1995年6月28日(vii)在先申請資料(A)申請?zhí)朥S08/431048(B)申請日1995年4月28日(viii)代理人/代理資料(A)姓名RAE,Patricia A.
(B)文獻/文檔號7425-16(ix)通信資料(A)電話(416)595-1155(B)電傳(416)595-1163(2)SEQ ID NO1的資料(i)序列特征(A)長度2765個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字CDS(B)位置249…1649(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…2675(D)其它資料/注=“hPSI-1”(xi)序列描述SEQ ID NO1TGGGACAGGC AGCTCCGGGG TCCGCGGTTT CACATCGGAA ACAAAACAGC GGCTGGTCTG60GAAGGAACCT GAGCTACGAG CCGCGGCGGC AGCGGGGCGG CGGGGAAGCG TATACCTAAT 120CTGGGAGCCT GCAAGTGACA ACAGCCTTTG CGGTCCTTAG ACAGCTTGGC CTGGAGGAGA 180ACACATGAAA GAAAGAACCT CAAGAGGCTT TGTTTTCTGT GAAACAGTAT TTCTATACAG 240TTGCTCCA ATG ACA GAG TTA CCT GCA CCG TTG TCC TAC TTC CAG AAT GCA290Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala1 5 10CAG ATG TCT GAG GAC AAC CAC CTG AGC AAT ACT GTA CGT AGC CAG AAT 338Gln Met Ser Glu Asp Asn His Leu Ser Asn Thr Val Arg Ser Gln Asn15 20 25 30GAC AAT AGA GAA CGG CAG GAG CAC AAC GAC AGA CGG AGC CTT GGC CAC 386Asp Asn Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His35 40 45CCT GAG CCA TTA TCT AAT GGA CGA CCC CAG GGT AAC TCC CGG CAG GTG 434Pro Glu Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val50 55 60GTG GAG CAA GAT GAG GAA GAA GAT GAG GAG CTG ACA TTG AAA TAT GGC 482Val Glu Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly65 70 75GCC AAG CAT GTG ATC ATG CTC TTT GTC CCT GTG ACT CTC TGC ATG GTG 530Ala Lys His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val80 85 90GTG GTC GTG GCT ACC ATT AAG TCA GTC AGC TTT TAT ACC CGG AAG GAT 578Val Val Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp95 100 105 110GGG CAG CTA ATC TAT ACC CCA TTC ACA GAA GAT ACC GAG ACT GTG GGC 626Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly115 120 125CAG AGA GCC CTG CAC TCA ATT CTG AAT GCT GCC ATC ATG ATC AGT GTC 674Gln Arg Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val130 135 140ATT GTT GTC ATG ACT ATC CTC CTG GTG GTT CTG TAT AAA TAC AGG TGC 722Ile Val Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys145 150 155TAT AAG GTC ATC CAT GCC TGG CTT ATT ATA TCA TCT CTA TTG TTG CTG 770Tyr Lys Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu160 165 170TTC TTT TTT TCA TTC ATT TAC TTG GGG GAA GTG TTT AAA ACC TAT AAC 818Phe Phe Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn175 180 185 190GTT GCT GTG GAC TAC ATT ACT GTT GCA CTC CTG ATC TGG AAT TTT GGT 866Val Ala Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Phe Gly195 200 205GTG GTG GGA ATG ATT TCC ATT CAC TGG AAA GGT CCA CTT CGA CTC CAG 914Val Val Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln210 215 220CAG GCA TAT CTC ATT ATG ATT AGT GCC CTC ATG GCC CTG GTG TTT ATC 962Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile225 230 235AAG TAC CTC CCT GAA TGG ACT GCG TGG CTC ATC TTG GCT GTG ATT TCA 1010Lys Tyr Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser240 245 250GTA TAT GAT TTA GTG GCT GTT TTG TGT CCG AAA GGT CCA CTT CGT ATG 1058Val Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met255 260 265 270CTG GTT GAA ACA GCT CAG GAG AGA AAT GAA ACG CTT TTT CCA GCT CTC 1106Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu275 280 285ATT TAC TCC TCA ACA ATG GTG TGG TTG GTG AAT ATG GCA GAA GGA GAC 1154Ile Tyr Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp290 295 300CCG GAA GCT CAA AGG AGA GTA TCC AAA AAT TCC AAG TAT AAT GCA GAA 1202Pro Glu Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu305 310 315AGC ACA GAAAGG GAG TCA CAA GAC ACT GTT GCA GAG AAT GAT GAT GGC 1250Ser Thr Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly320 325 330GGG TTC AGT GAG GAA TGG GAA GCC CAG AGG GAC AGT CAT CTA GGG CCT 1298Gly Phe Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro335 340 345 350CAT CGC TCT ACA CCT GAG TCA CGA GCT GCT GTC CAG GAA CTT TCC AGC 1346His Arg Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser355 360 365AGT ATC CTC GCT GGT GAA GAC CCA GAG GAA AGG GGA GTA AAA CTT GGA 1394Ser Ile Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly370 375 380Met Thr Glu Leu Pro Ala Pro Leu Sar Tyr Phe Gln Asn Ala Gln Met1 5 10 15Ser Glu Asp Asn His Leu Ser Asn Thr Val Arg Ser Gln Asn Asp Asn20 25 30Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His Pro Glu35 40 45Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val GluS0 55 60Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys65 70 75 80His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val85 90 95Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln100 105 110Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg115 120 125Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile Val130 135 140Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys145 150 155 160Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe165 170 175Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala180 185 190Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Phe Gly Val Val195 200 205Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala210 215 220Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr225 230 235 240Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr245 250 255Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val260 265 270Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu Ile Tyr275 280 285Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro Glu290 295 300Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr ASh Ala Glu Ser Thr305 310 315 320Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly Gly Phe325 330 335Ser Glu Glu Trp Glu Ala Cln Arg Asp Ser His Leu Gly Pro His Arg340 345 350Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser Ile355 360 365Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu Gly370 375 380TTG GGA GAT TTC ATT TTC TAC AGT GTT CTG GTT GGT AAA GCC TCA GCA1442Leu Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala385 390 395ACA GCC AGT GGA GAC TGG AAC ACA ACC ATA GCC TGT TTC GTA GCC ATA1490Thr Ala Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile400 405 410TTA ATT GGT TTG TGC CTT ACA TTA TTA CTC CTT GCC ATT TTC AAG AAA1538Leu Ile Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys415 420 425 430GCA TTG CCA GCT CTT CCA ATC TCC ATC ACC TTT GGG CTT GTT TTC TAC1586Ala Leu Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr435 440 445TTT GCC ACA GAT TAT CTT GTA CAG CCT TTT ATG GAC CAA TTA GCA TTC1634Phe Ala Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe450 455 460CAT CAA TTT TAT ATC TAGCATATTT GCGGTTAGAA TCCCATGGAT GTTTCTTCTT1689His Gln Phe Tyr Ile465TGACTATAAC CAAATCTGGG GAGGACAAAG GTGATTTTCC TGTGTCCACA TCTAACAAAG 1749TCAAGATTCC CGGCTGGACT TTTGCAGCTT CCTTCCAAGT CTTCCTGACC ACCTTGCACT 1809ATTGGACTTT GGAAGGAGGT GCCTATAGAA AACGATTTTG AACATACTTC ATCGCAGTGG 1869ACTGTGTCCC TCGGTGCAGA AACTACCAGA TTTGAGGGAC GAGGTCAAGG AGATATGATA 1929GGCCCGGAAG TTGCTGTGCC CCATCAGCAG CTTGACGCGT GGTCACAGGA CGATTTCACT 1989GACACTGCGA ACTCTCAGGA CTACCGGTTA CCAAGAGGTT AGGTGAAGTG GTTTAAACCA 2049AACGGAACTC TTCATCTTAA ACTACACGTT GAAAATCAAC CCAATAATTC TGTATTAACT 2109GAATTCTGAA CTTTTCAGGA GGTACTGTGA GGAAGAGCAG GCACCAGCAG CAGAATGGGG 2169AATGGAGAGG TGGGCAGGGG TTCCAGCTTC CCTTTGATTT TTTGCTGCAG ACTCATCCTT 2229TTTAAATGAG ACTTGTTTTC CCCTCTCTTT GAGTCAAGTC AAATATGTAG ATTGCCTTTG 2289GCAATTCTTC TTCTCAAGCA CTGACACTCA TTACCGTCTG TGATTGCCAT TTCTTCCCAA 2349GGCCAGTCTG AACCTGAGGT TGCTTTATCC TAAAAGTTTT AACCTCAGGT TCCAAATTCA 2409GTAAATTTTG GAAACAGTAC AGCTATTTCT CATCAATTCT CTATCATGTT GAAGTCAAAT 2469TTGGATTTTC CACCAAATTC TGAATTTGTA GACATACTTG TACGCTCACT TGCCCCCAGA 2529TGCCTCCTCT GTCCTCATTC TTCTCTCCCA CACAAGCAGT CTTTTTCTAC AGCCAGTAAG 2589GCAGCTCTGT CRTGGTAGCA GATGGTCCCA TTATTCTAGG GTCTTACTCT TTGTATGATG 2649AAAAGAATGT GTTATGAATC GGTGCTGTCA GCCCTGCTGT CAGACCTTCT TCCACAGCAA 2709ATGAGATGTA TGCCCAAAGC GGTAGAATTA AAGAAGAGTA AAATGGCTGT TGAAGC 2765(2)SEQ ID NO2的資料(i)序列特征(A)長度467個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白(xi)序列描述SEQ ID NO2Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala385 390 395 400Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile405 410 415Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu420 425 430Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala435 440 445Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln450 455 460Phe Tyr Ile465(2)SEQ ID NO3的資料(i)序列特征(A)長度3086個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字CDS(B)位置557…1945(ix)特征(A)名稱/關鍵字misc特征(B)位置1…3086(D)其它資料/注=“hPS1-2”(xi)序列描述SEQ ID NO3GAATTCGGCA CGAGGGAAAT GCTGTTTGCT CGAAGACGTC TCAGGGCGCA GGTGCCTTGG60GCCGGGATTA GTAGCCGTCT GAACTGGAGT GGAGTAGGAG AAAGAGGAAG CGTCTTGGGC120TGGGTCTGCT TGAGCAACTG GTGAAACTCC GCGCCTCACG CCCCGGGTGT GTCCTTGTCC180AGGGGCGACG AGCATTCTGG GCGAAGTCCG CACSCCTCTT GTTCGAGGCG GAAGACGGGG240TCTGATSCTT TCTCCTTGGT CGGGMCTGTC TCGAGGCATG CATGTCCAGT GACTCTTGTG300TTTGCTGCTG CTTCCCTCTC AGATTCTTCT CACCGTTGTG GTCAGCTCTG CTTTAGGCAT360ATTAATCCAT AGTGGAGGCT GGGATGGGTG AGAGAATTGA GGTGACTTTT CCATAATTCA420GACCTAATCT GGGAGCCTGC AAGTGACAAC AGCCTTTGCG GTCCTTAGAC AGCTTGGCCT480GGAGGAGAAC ACATGAAAGA AAGAACCTCA AGAGGCTTTG TTTTCTGTGA AACAGTATTT540CTATACAGTT GCTCCA ATG ACA GAG TTA CCT GCA CCG TTG TCC TAC TTC589Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe1 5 10CAG AAT GCA CAG ATG TCT GAC GAC AAC CAC CTG AGC AAT ACT AAT GAC 637Gln Asn Ala Gln Met Ser Glu Asp Asn His Leu Ser Asn Thr Asn Asp15 20 25AAT AGA GAA CGG CAG GAG CAC AAC GAC AGA CGG AGC CTT GGC CAC CCT 685Asn Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His Pro30 35 40GAG CCA TTA TCT AAT GGA CGA CCC CAG GGT AAC TCC CGG CAG GTG GTG 733Glu Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val45 50 55GAG CAA GAT GAG GAA GAA GAT GAG GAG CTG ACA TTG AAA TAT GGC GCC 781Glu Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala60 65 70 75AAG CAT GTG ATC ATG CTC TTT GTC CCT GTG ACT CTC TGC ATG GTG GTG 829Lys His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val80 85 90GTC GTG GCT ACC ATT AAG TCA GTC AGC TTT TAT ACC CGG AAG GAT GGG 877Val Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly95 100 105CAG CTA ATC TAT ACC CCA TTC ACA GAA GAT ACC GAG ACT GTG GGC CAG 925Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln110 115 120AGA GCC CTG CAC TCA ATT CTG AAT GCT GCC ATC ATG ATC AGT GTC ATT 973Arg Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile125 130 135GTT GTC ATG ACT ATC CTC CTG GTG GTT CTG TAT AAA TAC AGG TGC TAT 1021Val Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr140 145 150 155AAG GTC ATC CAT GCC TGG CTT ATT ATA TCA TCT CTA TTG TTG CTG TTC 1069Lys Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe160 165 170TTT TTT TCA TTC ATT TAC TTG GGG GAA GTG TTT AAA ACC TAT AAC GTT 1117Phe Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val175 180 185GCT GTG GAC TAC ATT ACT GTT GCA CTC CTG ATC TGG AAT TTG GGT GTG 1165Ala Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Leu Gly Val190 195 200GTG GGA ATG ATT TCC ATT CAC TGG AAA GGT CCA CTT CGA CTC CAG CAG 1213Val Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln205 210 215GCA TAT CTC ATT ATG ATT AGT GCC CTC ATG GCC CTG GTG TTT ATC AAG 1261Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys220 225 230 235TAC CTC CCT GAA TGG ACT GCG TGG CTC ATC TTG GCT GTG ATT TCA GTA 1309Tyr Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val240 245 250TAT GAT TTA GTG GCT GTT TTG TGT CCG AAA GGT CCA CTT CGT ATG CTG 1357Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu255 260 265GTT GAA ACA GCT CAG GAG AGA AAT GAA ACG CTT TTT CCA GCT CTC ATT 1405Val Glu Thr Ala Gln Glu Arg Ash Glu Thr Leu Phe Pro Ala Leu Ile270 275 280TAC TCC TCA ACA ATG GTG TGG TTG GTG AAT ATG GCA GAA GGA GAC CCG 1453Tyr Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro285 290 295GAA GCT CAA AGG AGA GTA TCC AAA AAT TCC AAG TAT AAT GCA GAA AGC 1501Glu Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu Ser300 305 310 315ACA GAA AGG GAG TCA CAA GAC ACT GTT GCA GAG AAT GAT GAT GGC GGG 1549Thr Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly Gly320 325 330TTC AGT GAG GAA TGG GAA GCC CAG AGG GAC AGT CAT CTA GGG CCT CAT 1597Phe Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro His335 340 345CGC TCT ACA CCT GAG TCA CGA GCT GCT GTC CAG GAA CTT TCC AGC AGT1645Arg Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser350 355 360ATC CTC GCT GGT GAA GAC CCA GAG GAA AGG GGA GTA AAA CTT GGA TTG1693Ile Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu365 370 375GGA GAT TTC ATT TTC TAC AGT GTT CTG GTT GGT AAA GCC TCA GCA ACA1741Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr380 385 390 395GCC AGT GGA GAC TGG AAC ACA ACC ATA GCC TGT TTC GTA GCC ATA TTA1789Ala Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu400 405 410ATT GGT TTG TGC CTT ACA TTA TTA CTC CTT GCC ATT TTC AAG AAA GCA1837Ile Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala415 420 425TTG CCA GCT CTT CCA ATC TCC ATC ACC TTT GGG CTT GTT TTC TAC TTT1885Leu Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe430 435 440GCC ACA GAT TAT CTT GTA CAG CCT TTT ATG GAC CAA TTA GCA TTC CAT1933Ala Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His445 450 455CAA TTT TAT ATC TAGCATATTT GCGGTTAGAA TCCCATGGAT GTTTCTTCTT1985Gln Phe Tyr Ile460TGACTATAAC CAAATCTGGG GAGGACAAAG GTGATTTTCC TGTGTCCACA TCTAACAAAG 2045TCAAGATTCC CGGCTGGACT TTTGCAGCTT CCTTCCAAGT CTTCCTGACC ACCTTGCACT 2105ATTGGACTTT GGAAGGAGGT GCCTATAGAA AACGATTTTG AACATACTTC ATCGCAGTGG 2165ACTGTGTCCT CGGTGCAGAA ACTACCAGAT TTGAGGGACG AGGTCAAGGA GATATGATAG 2225GCCCGGAAGT TGCTGTGCCC CATCAGCAGC TTGACGCGTG GTCACAGGAC GATTTCACTG 2285ACACTGCGAA CTCTCAGGAC TACCGGTTAC CAAGAGGTTA GGTGAAGTGG TTTAAACCAA 2345ACGGAACTCT TCATCTTAAA CTACACGTTG AAAATCAACC CAATAATTCT GTATTAACTG 2405AATTCTGAAC TTTTCAGGAG GTACTGTGAG GAAGAGCAGG CACCAGCAGC AGAATGGGGA 2465ATGGAGAGGT GGGCAGGGGT TCCAGCTTCC CTTTGATTTT TTGCTGCAGA CTCATCCTTT 2525TTAAATGAGA CTTGTTTTCC CCTCTCTTTG AGTCAAGTCA AATATGTAGA TGCCTTTGGC 2585AATTCTTCTT CTCAAGCACT GACACTCATT ACCGTCTGTG ATTGCCATTT CTTCCCAAGG 2645CCAGTCTGAA CCTGAGGTTG CTTTATCCTA AAAGTTTTAA CCTCAGGTTC CAAATTCAGT 2705AAATTTTGGA AACAGTACAG CTATTTCTCA TCAATTCTCT ATCATGTTGA AGTCAAATTT 2765GGATTTTCCA CCAAATTCTG AATTTGTAGA CATACTTGTA CGCTCACTTG CCCCAGATGC 2825CTCCTCTGTC CTCATTCTTC TCTCCCACAC AAGCAGTCTT TTTCTACAGC CAGTAAGGCA 2885GCTCTGTCGT GGTAGCAGAT GGTCCCACTT ATTCTAGGGT CTTACTCTTT GTATGATGAA 2945AAGAATGTGT TATGAATCGG TGCTGTCAGC CCTGCTGTCA GACCTTCTTC CACAGCAAAT 3005GAGATGTATG CCCAAAGCGG TAGAATTAAA GAAGAGTAAA ATGGCTGTTG AAGCAAAAAA 3065AAAAAAAAAA AAAAAAAAAA A3086(2)SEQ ID NO4的資料(i)序列特征(A)長度463個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白(xi)序列描述SEQ ID NO4Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala Gln Met1 5 l0 15Ser Glu Asp Asn His Leu Ser Asn Thr Asn Asp Asn Arg Glu Arg Gln20 25 30Glu His Asn Asp Arg Arg Ser Leu Gly His Pro Glu Pro Leu Ser Asn35 40 45Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val Glu Gln Asp Glu Glu50 55 60Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys His Val Ile Met65 70 75 80Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val Val Ala Thr Ile85 90 95Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln Leu Ile Tyr Thr100 105 110Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg Ala Leu His Ser115 120 125Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile Val Val Met Thr Ile130 135 140Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys Val Ile His Ala145 150 155 160Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe Phe Ser Phe Ile165 170 175Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala Val Asp Tyr Ile180 185 190Thr Val Ala Leu Leu Ile Trp Asn Leu Gly Val Val Gly Met Ile Ser195 200 205Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala Tyr Leu Ile Met210 215 220Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp225 230 235 240Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr Asp Leu Val Ala245 250 255Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val Glu Thr Ala Gln260 265 270Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu Ile Tyr Ser Ser Thr Met275 280 285Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro Glu Ala Gln Arg Arg290 295 300Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu Ser Thr Glu Arg Glu Ser305 310 315 320Gln Asp Thr Val Ala Glu Ash Asp Asp Gly Gly Phe Ser Glu Glu Trp325 330 335Glu Ala Gln Arg Asp Ser His Leu Gly Pro His Arg Ser Thr Pro Glu340 345 350Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser Ile Leu Ala Gly Glu355 360 365Asp Pro Glu Glu Arg GLy Val Lys Leu Gly Leu Gly Asp Phe Ile Phe370 375 380Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala Ser Gly Asp Trp385 390 395 400Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile Gly Leu Cys Leu405 410 415Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu Pro Ala Leu Pro420 425 430Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala Thr Asp Tyr Leu435 440 445Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln Phe Tyr Ile450 455 460(2)SEQ ID NO5的資料(i)序列特征(A)長度2494個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…2494(D)其它資料/注=“1Ex1n2”(xi)序列描述SEQ ID NO5AAGCTTTTGT GTGTAAAAAG TATTAGAATC TCATGTTTTT GAACAAGGTT GGCAGTGGGT 60TGGGAGGAGG GATTGGAGAT TGATGCGATA GGAATGTGAA GGGATAGCTT GGGGTGGATT 120TTATTTTTTA ATTTTAATTT TTATTTKTTG AGATGGAGTC TTGCTCTGTC TCCCAGGCTG 180GAGTGCAGTG GTGTGATCTC AGCTCACGGG TTCAAGCGAT TCTCCTGCTG CAGCCTCCCG 240AGTAGCTGGG ATTACAGGAG CGCGCCACCA CACCCGGNTA ATTTNNTTGT ATTTTTAGTA 300GAGACGGGGT TTCACCATGT TGGGTTAGGC TGGTCTAGAA CTCCCAACCT CATGATCCGC 360CTGCTTCGGC CTCCCAAAGT GCCGGAATTA CAGGCGTGAG CGACTGCACC CGGCCGCTTG 420GGGGTGGATT TTTAAAGAAA CTTTAGAAGA ATGTAACTTG SCCAGATACC ATGTACCGTT 480AATTTCATTT TCGGTTTTTK GAATACCCAT GTTTGACATT TMTCCGTTCA CCTTGATTAA 540ATAAGGTAGT ATTCATTTTT TAGTTTTAGC TTTTGGATAT ATGTGTAAGT GTGGTATGCT 600GTCTAATGAA TTAAGACAAT TGGTNCTKTC TTTACCCMAM ANCTGGACMA AGAGCAGGCA 660AGATGCAAAA ATCAAGTGAC CCAGCAAACC AGACACATTT TCTGCTCTCA GCTAGCTTGC 720CACCTAGAAA GACTGGTTGT CAAAGTTGGA GTCCAAGAAT CGCGGAGGAT GTTTAAAATG 780CAGTTTCTCA GGTTCTCNCC ACCCACCAGA AGTTTTGATT CATTGAGTGG TGGGAGAGGG 840CAGAGATATT TGCGATTTTA ACAGCATTCT CTTGATTGTG ATGCAGCTGG TTCSCAAATA 900GGTACCCTAA AGAAATGACA GGTGTTAAAT TTAGGATGGC CATCGCTTGT ATGCCGGGAG 960AAGCACACGC TGGGCCCAAT TTATATAGGG GCTTTCGTCC TCAGCTCGAG CARCCTCAGA1020ACCCCGACAA CCYACGCCAG CKCTCTGGCC GGATTCCTTC AGKTGGGGAA GSCCAGGTGG1080AGCTCTGGKT TCTCCCCGCA ATCGTTTCTC CAGGCCGGAG GCCCCGCCCC CTTCCTCCTG1140GCTCCTCCCC TCCTCCGTGG GCCGNCCGCC AACGACGCCA GAGCCGGAAA TGACGACAAC1200GGTGAGGGTT CTCGGGCGGG GCCTGGGACA GGCAGCTCCG GGGTCCGCGG TTTTCACATC1260GGAAACAAAA CAGCGGCTGG TCTGGAAGGA ACCTGAGCTA CGACCCGCGG CGGCAGCGGG1320GCGGCGGGGA AGCGTATGTG CGTGATGGGG AGTCCGGGCA AGCCAGGAAG GCACCGCGGA1380CATGGGCGGC CGCGGGCAGG GNCCGGNCCT TTGTGGCCGC CCGGGCCGCG AAGCCGGTGT1440CCTAAAAGAT GAGGGGCGGG GCGCGGCCGG TTGGGGCTGG GGAACCCCGT GTGGGAAACC1500AGGAGGGGCG GCCCGTTTCT CGGGCTTCGG GCGCGGCCGG GTGGAGAGAG ATTCCGGGGA1560GCCTTGGTCC GGAAATGCTG TTTGCTCGAA GACGTCTCAG GGCGCAGGTG CCTTGGGCCG1620GGATTAGTAG CCGTCTGAAC TGGAGTGGAG TAGGAGAAAG AGGAAGCGTC TTGGGCTGGG1680TCTGCTTGAG CAACTGGTGA AACTCCGCGC CTCACGCCCC GGGTGTGTCC TTGTCCAGGG1740GCGACGAGCA TTCTGGGCGA AGTCCGCACG CCTCTTGTTC GAGGCGGAAG ACGGGGTCTT1800GATGCTTTCT CCTTGGTCGG GACTGTCTCG AGGCATGCAT GTCCAGTGAC TCTTGTGTTT1860GCTGCTGCTT CCCTCTCAGA TTCTTCTCAC CGTTGTGGTC AGCTCTGCTT TAGGCATATT1920AATCCATAGT GGAGGCTGGG ATGGGTGAGA GAATTGAGGT GACTTTTCCA TAATTCAGGT1980GAGATGTGAT TAGAGTYCGG ATCCTNCGGT GGTGGCAGAG GCTTACCAAG AAACACTAAC2040GGGACATGGG AACCAATTGA GGATCCAGGG AATAAAGTGT GAAGTTGACT AGGAGGTTTT2100CAGTTTAAGA ACATGGCAGA GACATTCTCA GAAATAAGGA AGTTAGGAAG AAAGACCTGG2160TTTAGAGAGG AGGGCGAGGA AGTGGTTTGG AAGTGTCACT TTGGAAGTGC CAGCAGGTGA2220AAATGCCCTG TGAACAGGAC TGGAGCTGAA AACAGGAATC AATTCCATAG ATTTCCAGTT2280GATGTTGGAG CAGTGGAGAA GTCTAANCTA AGGAAGGGGA AGAGGAGGCC AAGCCAAACA2340CTTAGGAACA CTTNCNACGA GGGGGTGGAA GAAGAGCAAG GAGCCAGCTG AGGAGAATGA2400GTGTGGTTGG AGAACCACCA CAGCNCAGGG TCGCCAGANC TGAGGAAGGG GAGGGAAGCT2460TATCGAGKAM SGWCRACMKC GAGTTGGCAG GGAT2494(2)SEQ ID NO6的資料(i)序列特征(A)長度1117個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1117(D)其它資料/注=“1Ex3n4”(xi)序列描述SEQ ID NO6GGATCCGCCC GCCTTGGCCT CCCAAAGTGC TGGGATTACA GGCATGAGCC ACCGCTCCTG 60GCTGAGTCTG CGATTTCTTG CCAGCTCTAC CCAGTTGTGT CATCTTAAGC AAGTCACTGA120ACTTCTCTGG ATTCCCTTCT CCTNNWGTAA AATAAGNATG TTATCTGNCC NNCCTGCCTT180GGGCATTGTG ATAAGGATAA GATGACATTA TAGAATNTNG VAAAATTAAA AGCGCTAGAC 240AAATGTTTTA ATGAAAATAT AAAGATTAGN TTGAGTTTGG GCCAGCATAG AAAAAGGAAT 300GTTGAGAACA TTCCNTTAAG GATTACTCAA GCYCCCCTTT TGSTGKNWAA TCAGANNGTC 360ATNNAMNTAT CNTNTGTGGG YTGAAAATGT TTGGTTGCCT CAGGCGGTTC CTACTTATTG 420CTAAAGAGTC CTACCTTGAG CTTATAGTAA ATTTGTCAGT TAGTTGAAAG TCGTGACAAA 480TTAATACATT CCTGGTTTAC AAATTGGTCT TATAAGTATT TGATTGGTNT AAATGNATTT 540ACTAGGATTT AACTAACAAT GGATGACCTG GTGAAATCCT ATTTCAGACC TAATCTGGGA 600GCCTGCAAGT GACAACAGCC TTTGCGGTCC TTAGACAGCT TGGCCTGGAG GAGAACACAT 660GAAAGAAAGG TTTGWNTCTG NTTAWTGTAA TCTATGRAAG TGTTTTTWAT MACAGTATAA 720TTGTMTGMAC AAAGTTCTGT TTTTCTTTCC CTTTNCAGAA CCTCAAGAGG CTTTGTTTTC 780TGTGAAACAG TATTTCTATA CAGTTGCTCC AATGACAGAG TTACCTGCAC CGTTGTCCTA 840CTTCCAGAAT GCACAGATGT CTGAGGACAA CCACCTGAGC AATACTGTAC GTAGCCAGGT 900ACAGCGTCAG TYTTCNAAAC TGCCTYYGNC AGACTGGATT CACTTATCAT CTCCCCTCAC 960CTCTGAGAAA TGCTGAGGGG GSTAGGNAGG GCTTTCTCTA CTTNACCACA TTTNATAATT 1020ATTTTTGGGT GACCTTCAGC TGATCGCTGG GAGGGACACA GGGCTTNTTT AACACATAGG 1080GTGTTGGATA CAGNCCCTCC CTAATTCACA TTTCANC 1117(2)SEQ ID NO7的資料(i)序列特征(A)長度1727個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1727(D)其它資料/注=“1Ex5”(xi)序列描述SEQ ID NO7GGATCCCTCC CCTTTTTAGA CCATACAAGG TAACTTCCGG ACGTTGCCAT GGCATCTGTA 60AACTGTCATG GTGTTGGCGG GGAGTGTCTT TTAGCATGCT AATGTATTAT AATTAGCGTA 120TAGTGAGCAG TGAGGATAAC CAGAGGTCAC TCTCCTCACC ATCTTGGTTT TGGTGGGTTT 180TGGCCAGCTT CTTTATTGCA ACCAGTTTTA TCAGCAAGAT CTTTATGAGC TGTATCTTGT 240GCTGACTTCC TATCTCATCC CGNAACTAAG AGTACCTAAC CTCCTGCAAA TTGMAGNCCA 300GNAGGTCTTG GNCTTATTTN ACCCAGCCCC TATTCAARAT AGAGTNGYTC TTGGNCCAAA 360CGCCYCTGAC ACAAGGATTT TAAAGTCTTA TTAATTAAGG TAAGATAGKT CCTTGSATAT 420GTGGTCTGAA ATCACAGAAA GCTGAATTTG GAAAAAGGTG CTTGGASCTG CAGCCAGTAA 480ACAAGTTTTC ATGCAGGTGT CAGTATTTAA GGTACATCTC AAAGGATAAG TACAATTGTG 540TATGTTGGGA TGAACAGAGA GAATGGAGCA ANCCAAGACC CAGGTAAAAG AGAGGACCTG 600AATGCCTTCA GTGAACAATG ATAGATAATC TAGACTTTTA AACTGCATAC TTCCTGTACA 660TTGTTTTTTC TTGCTTCAGG TTTTTAGAAC TCATAGTGAC GGGTCTGTTG TTAATCCCAG 720GTCTAACCGT TACCTTGATT CTGCTGAGAA TCTGATTTAC TGAAAATGTT TTTCTTGTGC 780TTATAGAATG ACAATAGAGA ACGGCAGGAG CACAACGACA GACGGAGCCT TGGCCACCCT 840GAGCCATTAT CTAATGGACG ACCCCAGGGT AACTCCCGGC AGGTGGTGGA GCAAGATGAG 900GAAGAAGATG AGGAGCTGAC ATTGAAATAT GGCGCCAAGC ATGTGATCAT GCTCTTTGTC 960CCTGTGACTC TCTGCATGGT GGTGGTCGTG GCTACCATTA AGTCAGTCAG CTTTTATACC 1020CGGAAGGATG GGCAGCTGTA CGTATGAGTT TKGTTTTATT ATTCTCAAAS CCAGTGTGGC 1080TTTTCTTTAC AGCATGTCAT CATCACCTTG AAGGCCTCTN CATTCAAGGG GCATGACTTA 1140GCTGGAGAGC CCATCCTCTG TGATGGTCAG GAGCAGTTGA GAGANCGAGG GGTTATTACT 1200TCATGTTTTA AGTGGAGAAA AGGAACACTG CAGAAGTATG TTTCCTGTAT GGTATTACTG 1260GATAGGGCTG AAGTTATGCT GAATTGAACA CATAAATTCT TTTCCACCTC AGGGNCATTG 1320GGCGCCCATT GNTCTTCTGC CTAGAATATT CTTTCCTTTN CTNACTTKGG NGGATTAAAT 1380TCCTGTCATC CCCCTCCTCT TGGTGTTATA TATAAAGTNT TGGTGCCGCA AAAGAAGTAG 1440CACTCGAATA TAAAATTTTC CTTTTAATTC TCAGCAAGGN AAGTTACTTC TATATAGAAG 1500GGTGCACCCN TACAGATGGA ACAATGGCAA GCGCACATTT GGGACAAGGG AGGGGAAAGG 1560GTTCTTATCC CTGACACACG TGGTCCCNGC TGNTGTGTNC TNCCCCCACT GANTAGGGTT 1620AGACTGGACA GGCTTAAACT AATTCCAATT GGNTAATTTA AAGAGAATNA TGGGGTGAAT 1680GCTTTGGGAG GAGTCAAGGA AGAGNAGGTA GNAGGTAACT TGAATGA 1727(2)SEQ ID NO8的資料(i)序列特征(A)長度1883個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1883(D)其它資料/注=“1Ex6”(xi)序列描述SEQ ID NO8CNCGTATAAA AGACCAACAT TGCCANCNAC AACCACAGGC AAGATCTTCT CCTACCTTCC 60CCCNNGGTGT AATACCAAGT ATTCNCCAAT TTGTGATAAA CTTTCATTGG AAAGTGACCA 120CCCTCCTTGG TTAATACATT GTCTGTGCCT GCTTTCACAC TACAGTAGCA CAGTTGAGTG 180TTTGCCCTGG AGACCATATG ACCCATAGAG CTTAAAATAT TCAGTCTGGC TTTTTACAGA 240GATGTTTCTG ACTTTGTTAA TAGAAAATCA ACCCAACTGG TTTAAATAAT GCACATACTT 300TCTCTCTCAT AGAGTAGTGC AGAGGTAGNC AGTCCAGATT AGTASGGTGG CTTCACGTTC 360ATCCAAGGAC TCAATCTCCT TCTTTCTTCT TTAGCTTCTA ACCTCTAGCT TACTTCAGGG 420TCCAGGCTGG AGCCCTASCC TTCATTTCTG ACAGTAGGAA GGAGTAGGGG AGAAAAGAAC 480ATAGGACATG TCAGCAGAAT TCTCTCCTTA GAAGTTCCAT ACACAACACA TCTCCCTAGA 540AGTCATTGCC CTTACTTGTT CTCATAGCCA TCCTAAATAT AAGGGAGTCA GAAGTAAAGT 600CTKKNTGGCT GGGAATATTG GCACCTGGAA TAAAAATGTT TTTCTGTGAA TGAGAAACAA 660GGGGAAGATG GATATGTGAC ATTATCTTAA GACAACTCCA GTTGCAATTA CTCTGCAGAT 720GAGAGGCACT AATTATAAGC CATATTACCT TTCTTCTGAC AACCACTTGT CAGCCCNCGT 780GGTTTCTGTG GCAGAATCTG GTTCYATAMC AAGTTCCTAA TAANCTGTAS CCNAAAAAAT 840TTGATGAGGT ATTATAATTA TTTCAATATA AAGCACCCAC TAGATGGAGC CAGTGTCTGC 900TTCACATGTT AAGTCCTTCT TTCCATATGT TAGACATTTT CTTTGAAGCA ATTTTAGAGT 960GTAGCTGTTT TTCTCAGGTT AAAAATTCTT AGCTAGGATT GGTGAGTTGG GGAAAAGTGA 1020CTTATAAGAT NCGAATTGAA TTAAGAAAAA GAAAATTCTG TGTTGGAGGT GGTAATGTGG 1080KTGGTGATCT YCATTAACAC TGANCTAGGG CTTTKGKGTT TGCTTTATTG TACAATCTAT 1140ACCCCATTCA CAGAAGATAC CGAGACTGTG GGCCAGAGAG CCCTGCACTC AATTCTGAAT 1200GCTGCCATCA TGATCAGTGT CATTGTTGTC ATGACTATCC TCCTGGTGGT TCTGTATAAA 1260TACAGGTGCT ATAAGGTGAG CATGAGACAC AGATCTTTGN TTTCCACCCT GTTCTTCTTA 1320TGGTTGGGTA TTCTTGTCAC AGTAACTTAA CTGATCTAGG AAAGAAAAAA TCTTTTGTCT 1330TCTAGAGATA AGTTAATTTT TAGTTTTCTT CCTCCTCACT GTGGAACATT CAAAAAATAC 1440AAAAAGGAAG CCAGGTGCAT GTGTAATGCC AGGCTCAGAG GCTGAGGCAG GAGGATCGCT 1500TGGGCCCAGG AGTTCACAAG CAGCTTGGGC AACGTAGCAA GACCCTGCCT CTATTAAAGA 1560AAACAAAAAA CAAATATTGG AAGTATTTTA TATGCATGGA ATCTATATGT CATGAAAAAA 1620TTAGTGTAAA ATATATATAT TATGATTAGN TATCAAGATT TAGTGATAAT TTATGTTATT 1680TTTGGATTTC AATGCCTTTT TAGGCCATTG TCTCAAMAAA TAAAAGCAGA AAACAAAAAA 1740AGTTGTAACT GAAAAATAAA CATTTCCATA TAATAGCACA ATCTAAGTGG GTTTTTGNTT 1800GTTTGTTTGN TTGTTGAAGC AGGGCCTTGC CCTNYCACCC AGGNTGGAGT GAAGTGCAGT 1860GGCACGATTT TGGCTCACTG CAG 1883(2)SEQ ID NO9的資料(i)序列特征(A)長度823個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…823(D)其它資料/注=“1Ex7”(xi)序列描述SEQ ID NO9CAGGAGTGGA CTAGGTAAAT GNAAGNTGTT TTAAAGAGAG ATGNGGNCNG GGACATAGTG 60GTACACANCT GTAATGCTCA NCACTKATGG GGAGTACTGA AGGNGGNSGG ATCACTTGNG 120GGTCNGGAAT NTGAGANCAG CCTGGGCAAN ATGGCGAAAC CCTGTCTCTA CTAAAAATAG 180CCANAAWNWA GCCTAGCGTG GTGGCGCRCA CGCGTGGTTC CACCTACTCA GGAGGCNTAA 240GCACGAGNAN TNCTTGAACC CAGGAGGCAG AGGNTGTGGT GARCTGAGAT CGTGCCACTG 300CACTCCAGTC TGGGCGACMA AGTGAGACCC TGTCTCCNNN AAGAAAAAAA AAATCTGTAC 360TTTTTAAGGG TTGTGGGACC TGTTAATTAT ATTGAAATGC TTCTYTTCTA GGTCATCCAT 420GCCTGGCTTA TTATATCATC TCTATTGTTG CTGTTCTTTT TTTCATTCAT TTACTTGGGG 480TAAGTTGTGA AATTTGGGGT CTGTCTTTCA GAATTAACTA CCTNNGTGCT GTGTAGCTAT 540CATTTAAAGC CATGTACTTT GNTGATGAAT TACTCTGAAG TTTTAATTGT NTCCACATAT 600AGGTCATACT TGGTATATAA AAGACTAGNC AGTATTACTA ATTGAGACAT TCTTCTGTNG 660CTCCTNGCTT ATAATAAGTA GAACTGAAAG NAACTTAAGA CTACAGTTAA TTCTAAGCCT 720TTGGGGAAGG ATTATATAGC CTTCTAGTAG GAAGTCTTGT GCNATCAGAA TGTTTNTAAA 780GAAAGGGTNT CAAGGAATNG TATAAANACC AAAAATAATT GAT 823(2) SEQ ID NO10的資料(i)序列特征(A)長度945個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…945(D)其它資料/注=“1 Ex8”(xi)序列描述SEQ ID NO10GTTNTCCNAA CCAACTTAGG AGNTTGGACC TGGGRAAGAC CNACNTGATC TCCGGGAGGN 60AAAGACTNCA GTTGAGCCGT GATTGCACCC ACTTTACTCC AAGCCTGGGC AACCAAAATG 120AGACACTGGC TCCAAACACA AAAACAAAAA CAAAAAAAGA GTAAATTAAT TTANAGGGAA 180GNATTAAATA AATAATAGCA CAGTTGATAT AGGTTATGGT AAAATTATAA AGGTGGGANA 240TTAATATCTA ATGTTTGGGA GCCATCACAT TATTCTAAAT AATGTTTTGG TGGAAATTAT 300TGTACATCTT TTAAAATCTG TGTAATTTTT TTTCAGGGAA GTGTTTAAAA CCTATAACGT 360TGCTGTGGAC TACATTACTG TTGCACTCCT GATCTGGAAT TTTGGTGTGG TGGGAATGAT 420TTCCATTCAC TGGAAAGGTC CACTTCGACT CCAGCAGGCA TATCTCATTA TGATTAGTGC 480CCTCATGGCC CTGGTGTTTA TCAAGTACCT CCCTGAATGG ACTGCGTGGC TCATCTTGGC 540TGTGATTTCA GTATATGGTA AAACCCAAGA CTGATAATTT GTTTGTCACA GGAATGCCCC 600ACTGGAGTGT TTTCTTTCCT CATCTCTTTA TCTTGATTTA GAGAAAATGG TAACGTGTAC 660ATCCCATAAC TCTTCAGTAA ATCATTAATT AGCTATAGTA ACTTTTTCAT TTGAAGATTT 720CGGCTGGGCA TGGTAGCTCA TGCCTGTAAT CTTAGCACTT TGGGAGGCTG AGGCGGGCAG 780ATCACCTAAG CCCAGAGTTC AAGACCAGCC TGGGCAACAT GGCAAAACCT CGTATCTACA 840GAAAATACAA AAATTAGCCG GGCATGGTGG TGCACACCTG TAGTTCCAGC TACTTAGGAG 900GCTGAGGTGG GAGGATCGAT TGATCCCAGG AGGTCAAGNC TGCAG 945(2)SEQ ID NO11的資料(i)序列特征(A)長度540個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO11CTGCAGCTTT CCTTTAAACT AGGAAGACTT GTTCCTATAC CCCAGTAACG ATACACTGTA 60CACTAAGCAA ATAGCAGTCA AACCCAAATG AAATTTNTAC AGATGTTCTG TGTCATTTTA 120TNTTGTTTAT GTTGTCTCCC CCACCCCCAC CAGTTCACCT GCCATTTATT TCATATTCAT 180TCAACGTCTN NNTGTGTAAA AAGAGACAAA AAACATTAAA CTTTTTTCCT TCGTTAATTC 240CTCCCTACCA CCCATTTACA AGTTTAGCCC ATACATTTTA TTAGATGTCT TTTATGTTTT 300TCTTTTNCTA GATTTAGTGG CTGTTTTGTG TCCGAAAGGT CCACTTCGTA TGCTGGTTGA 360AACAGCTCAG GAGAGAAATG AAACGCTTTT TCCAGCTCTC ATTTACTCCT GTAAGTATTT 420GGAGAATGAT ATTGAATTAG TAATCAGNGT AGAATTTATC GGGAACTTGA AGANATGTNA 480CTATGGCAAT TTCANGGNAC TTGTCTCATC TTAAATGANA GNATCCCTGG ACTCCTGNAG 540(2)SEQ ID NO12的資料(i)序列特征(A)長度509個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…509(D)其它資料/注=“1Ex10”(xi)序列描述SEQ ID NO12CCCCGTCNAT GCATACTTTG TGTGTCCAGT GCTTACCTGG AATCCNGTCT TTCCCAACAG 60CAACAATGGT GTGGTTGGTG AATATGGCAG AAGGAGACCC GGAAGCTCAA AGGAGAGTAT 120CCAAAAATTC CAAGTATAAT GCAGAAAGTA GGTAACTYYY NTTAGATAMN ATCTTGATTT 180TNCAGGGTCA CTGTTATAAG CTAACAGTAT AGNAATGTTT TTATCGTCTT TCTNKGGNCA 240TAGACTCCTN KGAGAATCTC TTGAGAACTA TGATAATGCC CAGTAAATAC NCAGATAAGT 300ATTTAAGGAG TNCAGATACT CAAANCCCAA CAATACNGTC AAAGCATCCT AGGTTAAGAC 360AMCNCCCATT AAATACAGAA TACCAGCATG GAAAGGTTCA GGCTGAGGTT ATGATTGGGT 420TTGGGTTTTG GGNNNGTTTT TTATAAGTCA TGATTTTAAA AAGAAAAAAT AAACTCTCTC 480CAAACATGTA AAAGTAAGAA TCTCCTAAA 509(2)SEQ ID NO13的資料(i)序列特征(A)長度1092個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1092(D)其它資料/注=“1Ex11”(xi)序列描述SEQ ID NO13GTCTAGATAA GNCAACATTC AGGGGTAGAA GGGGACTGTT TATTTTTTCC TTTAGTCTCT 60CTTAAAGAGT GAGAAAAATT TTCCCAGGAA TCCCGGTGGA CTTTGCTTCA CCACTCATAG 120GTTCATACCA AGTTACAACC CCACAACCTT AGAGCTTTTG TTAGGAAGAG GCTTGGTGGG 180ATTACCGTGC TTGGCTTGGC TTGGTCAGGA TTCACCACCA GAGTCATGTG GGAGGGGGTG 240GGAACCCAAA CAATTCAGGA TTCTGCCCTC AGGAAATAAA GGAGAAAATA GCTGTTGGAT 300AAACTACCAG CAGGCACTGC TACAGCCCAT GCTTTGTGGT TTAAGGGCCA GCTAGTTACA 360ATGACAGCTA GTTACTGTTT CCATGTAATT TTCTTAAAGG TATTAAATTT TTCTAAATAT 420TAGAGCTGTA ACTTCCACTT TCTCTTGAAG GCACAGAAAG GGAGTCACAA GACACTGTTG 480CAGAGAATGA TGATGGCGGG TTCAGTGAGG AATGGGAAGC CCAGAGGGAC AGTCATCTAG 540GGCCTCATCG CTCTACACCT GAGTCACGAG CTGCTGTCCA GGAACTTTCC AGCAGTATC 600TCGCTGGTGA AGACCCAGAG GAAAGTATGT TCANTTCTCC ATNTTTCAAA GTCATGGATT 660CCTTTAGGTA GCTACATTAT CAACCTTTTT GAGAATAAAA TGAATTGAGA GTGTTACAGT 720CTAATTCTAT ATCACATGTA ACTTTTATTT GGATATATCA GTAATAGTGC TTTTTYNTTT 780TTTTTTTTTT TTTTTTTTTT TTTTNGGNGA NAGAGTCTCG CTCTGTCGCC AGGTTGGAGT 840GCAATGGTGC GATCTTGGCT CACTGAAAGC TCCACCNCCC GGGTTCAAGT GATTCTCCTG 900CCTCAGCCNC CCAAGTAGNT GGGACTACAG GGGTGCGCCA CCACGCCTGG GATAATTTTG 960GGNTTTTTAG TAGAGATGGC GTTTCACCAN CTTGGNGCAG GCTGGTCTTG GAACTCCTGA 1020NATCATGATC TGCCTGCCTT AGCCTCCCCA AAGTGCTGGG ATTNCAGGGG TGAGCCACTG 1080TTCCTGGGCC TC 1092(2)SEQ ID NO14的資料(i)序列特征(A)長度1003個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1003(D)其它資料/注=“1Ex12”(xi)序列描述SEQ ID NO14CTGCAGTGAG CCGAGATCAT GCTGCTGTAC TCCAGCCTGG GCCACAGAGC CAAACTCCAT 60CTCCCAAAAA AAAAAAATAT TAATTAATAT GATNAAATGA TGCCTATCTC AGAATTCTTG 120TAAGGATTTC TTAGKACAAG TGCTGGGTAT AAACTATANA TTCRATAGAT GNCGATTATT 180ACTTAYTATT GTTATTGATA AATAACAGCA GCATCTACAG TTAAGACTCC AGAGTCAGTC 240ACATAGAATC TGGNACTCCT ATTGTAGNAA ACCCCNMMAG AAAGAAAACA CAGCTGAAGC 300CTAATTTTGT ATATCATTTA CTGACTTCTC TCATTCATTG TGGGGTTGAG TAGGGCAGTG 360ATATTTTTGA ATTGTGAAAT CATANCAAAG AGTGACCAAC TTTTTAATAT TTGTAACCTT 420TCCTTTTTAG GGGGAGTAAA ACTTGGATTG GGAGATTTCA TTTTCTACAG TGTTCTGGTT 480GGTAAAGCCT CAGCAACAGC CAGTGGAGAC TGGAACACAA CCATAGCCTG TTTCGTAGCC 540ATATTAATTG TMMSTATACA CTAATAAGAA TGTGTCAGAG CTCTTAATGT CMAAACTTTG 600ATTACACAGT CCCTTTAAGG CAGTTCTGTT TTAACCCCAG GTGGGTTAAA TATTCCAGCT 660ATCTGAGGAG CTTTTNGATA ATTGGACCTC ACCTTAGTAG TTCTCTACCC TGGCCACACA 720TTAGAATCAC TTGGGAGCTT TTAAAACTGT AAGCTCTGCC CTGAGATATT CTTACTCAAT 780TTAATTGTGT AGTTTTTAAA ATTCCCCAGG AAATTCTGGT ATTTCTGTTT AGGAACCGCT 840GCCTCAAGCC TAGCAGCACA GATATGTAGG AAATTAGCTC TGTAAGGTTG GTCTTACAGG 900GATAAACAGA TCCTTCCTTA GTCCCTGGAC TTAATCACTG AGAGTTTGGG TGGTGGTTTT 960GGATTTAATG ACACAACCTG TAGCATGCAG TGTTACTTAA GAC 1003(2)SEQ ID NO15的資料(i)序列特征(A)長度736個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…736(D)其它資料/注=“1Ex13”(xi)序列描述SEQ ID NO15GTCTTTCCCA TCTTCTCCAC AGGGTTTGTG CCTTACATTA TTACTCCTTG CCATTTTCAA 60GAAAGCATTG CCAGCTCTTC CAATCTCCAT CACCTTTGGG CTTGTTTTCT ACTTTGCCAC 120AGATTATCTT GTACAGCCTT TTATGGACCA ATTAGCATTC CATCAATTTT ATATCTAGCA 180TATTTGCGGT TAGAATCCCA TGGATGTTTC TTCTTTGACT ATAACAAAAT CTGGGGAGGA 240CAAAGGTGAT TTCCTGTGTC CACATCTAAC AAATCAAGAT CCCCGGCTGG ACTTTTGGAG 300GTTCCTTCCA AGTCTTCCTG ACCACCTTGC ACTATTGGAC TTTGGAAGGA GGTGCCTATA 360GAAAACGATT TTGAACATAC TTCATCGCAG TGGACTGTGT CCTCGGTGCA GAAACTACCA 420GATTTGAGGG ACGAGGTCAA GGAGATATGA TAGGCCCGGA AGTTGCTGTG CCCCATCAGC 480AGCTTGACGC GTGGTCACAG GACGATTTTC ACTGACACTG CGAACTCTCA GGACTACCGT 540TACCAAGAGG TTAGGTGAAG TGGTTTAAAC CAAACGGAAC TCTTCATCTT AAACTACACG 600TTGAAAATCA ACCCAATAAT TCTGTATTAA CTGAATTCTG AACTTTTCAG GAGGTACTGT 660GAGGAAGAGC AGGCACCACC AGCAGAATGG GGAATGGAGA GGTGGGCAGG GGTTCCAGCT 720TCCCTTTGAT TTTTTG 736(2)SEQ ID NO16的資料(i)序列特征(A)長度1964個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字CDS(B)位置188…1588(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1964(D)其它資料/注=“mPS1”(xi)序列描述SEQ ID NO16ACCANACANC GGCAGCTGAG GCGGAAACCT AGGCTGCGAG CCGGCCGCCC GGGCGCGGAG60AGAGAAGGAA CCAACACAAG ACAGCAGCCC TTCGAGGTCT TTAGGCAGCT TGGAGGAGAA120CACATGAGAG AAAGAATCCC AAGAGGTTTT GTTTTCTTTG AGAAGGTATT TCTGTCCAGC180TGCTCCA ATG ACA GAG ATA CCT GCA CCT TTG TCC TAC TTC CAG AAT GCC 229Met Thr Glu Ile Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala1 5 10CAG ATG TCT GAG GAC AGC CAC TCC AGC AGC GCC ATC CGG AGC CAG AAT 277Gln Met Ser Glu Asp Ser His Ser Ser Ser Ala Ile Arg Ser Gln Asn15 20 25 30GAC AGC CAA GAA CGG CAG CAG CAG CAT GAC AGG CAG AGA CTT GAC AAC 325Asp ser Gln Glu Arg Gln Gln Gln His Asp Arg Gln Arg Leu Asp Asn35 40 45CCT GAG CCA ATA TCT AAT GGG CGG CCC CAG AGT AAC TCA AGA CAG GTG 373Pro Glu Pro Ile Ser Asn Gly Arg Pro Gln Ser Asn Ser Arg Gln Val50 55 60GTG GAA CAA GAT GAG GAG GAA GAC GAA GAG CTG ACA TTG AAA TAT GGA 421Val Glu Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly65 70 75GCC AAG CAT GTC ATC ATG CTC TTT GTC CCC GTG ACC CTC TGC ATG GTC 469Ala Lys His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val80 85 90GTC GTC GTG GCC ACC ATC AAA TCA GTC AGC TTC TAT ACC CGG AAG GAC 517Val Val Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp95 100 105 110GGT CAG CTA ATC TAC ACC CCA TTC ACA GAA GAC ACT GAG ACT GTA GGC 565Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly115 120 125CAA AGA GCC CTG CAC TCG ATC CTG AAT GCG GCC ATC ATG ATC AGT GTC 613Gln Arg Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val130 135 140ATT GTC ATT ATG ACC ATC CTC CTG GTG GTC CTG TAT AAA TAC AGG TGC 661Ile Val Ile Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys145 150 155TAC AAG GTC ATC CAC GCC TGG CTT ATT ATT TCA TCT CTG TTG TTG CTG 709Tyr Lys Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu160 165 170TTC TTT TTT TCG TTC ATT TAC TTA GGG GAA GTA TTT AAG ACC TAC AAT 757Phe Phe Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn175 180 185 190GTC GCC GTG GAC TAC GTT ACA GTA GCA CTC CTA ATC TGG AAT TTT GGT 805Val Ala Val Asp Tyr Val Thr Val Ala Leu Leu Ile Trp Asn Phe Gly195 200 205GTG GTC GGG ATG ATT GCC ATC CAC TGG AAA GGC CCC CTT CGA CTG CAG 853Val Val Gly Met Ile Ala Ile His Trp Lys Gly Pro Leu Arg Leu Gln210 215 220CAG GCG TAT CTC ATT ATG ATC AGT GCC CTC ATG GCC CTG GTA TTT ATC 901Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile225 230 235AAG TAC CTC CCC GAA TGG ACC GCA TGG CTC ATC TTG GCT GTG ATT TCA 949Lys Tyr Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser240 245 250GTA TAT GAT TTG GTG GCT GTT TTA TGT CCC AAA GGC CCA CTT CGT ATG 997Val Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met255 260 265 270CTG GTT GAA ACA GCT CAG GAA AGA AAT GAG ACT CTC TTT CCA GCT CTT 1045Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu275 280 285ATC TAT TCC TCA ACA ATG GTG TGG TTG GTG AAT ATG GCT GAA GGA GAC 1093Ile Tyr Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp290 295 300CCA GAA GCC CAA AGG AGG GTA CCC AAG AAC CCC AAG TAT AAC ACA CAA 1141Pro Glu Ala Gln Arg Arg Val Pro Lys Asn Pro Lys Tyr Asn Thr Gln305 310 315AGA GCG GAG AGA GAG ACA CAG GAC AGT GGT TCT GGG AAC GAT GAT GGT l189Arg Ala Glu Arg Glu Thr Gln Asp Ser Gly Ser Gly Asn Asp Asp Gly320 325 330GGC TTC AGT GAG GAG TGG GAG GCC CAA AGA GAC AGT CAC CTG GGG CCT 1237Gly Phe Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro335 340 345 350CAT CGC TCC ACT CCC GAG TCA AGA GCT GCT GTC CAG GAA CTT TCT GGG 1285His Arg Ser Thr Prc Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Gly355 360 365AGC ATT CTA ACG AGT GAA GAC CCG GAG GAA AGA GGA GTA AAA CTT GGA 1333Ser Ile Leu Thr Ser Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly370 375 380CTG GGA GAT TTC ATT TTC TAC AGT GTT CTG GTT GGT AAG GCC TCA GCA 1381Leu Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala385 390 395ACC GCC AGT GGA GAC TGG AAC ACA ACC ATA GCC TGC TTT GTA GCC ATA 1429Thr Ala Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile400 405 410CTG ATC GGC CTG TGC CTT ACA TTA CTC CTG CTC GCC ATT TTC AAG AAA 1477Leu Ile Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys415 420 425 430GCG TTG CCA GCC CTC CCC ATC TCC ATC ACC TTC GGG CTC GTG TTC TAC 1525Ala Leu Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr435 440 445TTC GCC ACG GAT TAC CTT GTG CAG CCC TTC ATG GAC CAA CTT GCA TTC 1573Phe Ala Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe450 455 460CAT CAG TTT TAT ATC TAGCCTTTCT GCAGTTAGAA CATGGATGTT TCTTCTTTGA 1628His Gln Phe Tyr Ile465TTATCAAAAA CACAAAAACA GAGAGCAAGC CCGAGGAGGA GACTGGTGAC TTTCCTGTGT 1688CCTCAGCTAA CAAAGGCAGG ACTCCAGCTG GACTTCTGCA GCTTCCTTCC GAGTCTCCCT 1748AGCCACCCGC ACTACTGGAC TGTGGAAGGA AGCGTCTACA GAGGAACGGT TTCCAACATC 1808CATCGCTGCA GCAGACGGTG TCCCTCAGTG ACTTGAGAGA CAAGGACAAG GAAATGTGCT 1868GGGCCAAGGA GCTGCCGTGC TCTGCTAGCT TTGACCGTGG GCATGGAGAT TTACCCGCAC 1928TGTGAACTCT CTAAGGTAAA CAAAGTGAGG TGAACC 1964(2)SEQ ID NO17資料(i)序列特征(A)長度467個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白(xi)序列描述SEQ ID NO17Met Thr Glu Ile Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala Gln Met1 5 10 15Ser Glu Asp Ser His Ser Ser Ser Ala Ile Arg Ser Gln Asn Asp Ser20 25 30Gln Glu Arg Gln Gln Gln His Asp Arg Gln Arg Leu Asp Asn Pro Glu35 40 45Pro Ile Ser Asn Gly Arg Pro Gln Ser Asn Ser Arg Gln Val Val Glu50 55 60Gln AsP Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys65 70 75 90His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val85 90 95Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln100 105 110Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg115 120 125Ala Leu His Ser Ile Leu Ash Ala Ala Ile Met Ile Ser Val Ile Val130 135 140Ile Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys145 150155 160Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe165 170 175Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala180 185 190Val Asp Tyr Val Thr Val Ala Leu Leu Ile Trp Asn Phe Gly Val Val195 200 205Gly Met Ile Ala Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala210 215 220Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr225 230 235 240Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr245 250 255Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val260 265 270Glu Thr Ala Gln Glu Arg Asn GLu Thr Leu Phe Pro Ala Leu Ile Tyr275 280 285Ser Ser Thr Met Val Trp Leu Val Ash Met Ala Glu Gly Asp Pro Glu290 295 300Ala Gln Arg Arg Val Pro Lys Asn Pro Lys Tyr Asn Thr Gln Arg Ala305 310 315 320Glu Arg Glu Thr Gln Asp Ser Gly Ser Gly Asn Asp Asp Gly Gly Phe325 330 335Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro His Arg340 345 350Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Gly Ser Ile355 360 365Leu Thr Ser Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu Gly370 375 360Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala385 390 395 400Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile405 410 415Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu420 425 430Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala435 440 445Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln450 455 460Phe Tyr Ile465(2)SEQ ID NO18的資料(i)序列特征(A)長度2229個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字CDS(B)位置366…1712(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…2226(D)其它資料/注=“hPS2”(xi)序列描述SEQ ID NO18GAATTCGGCA CGAGGGCATT TCCAGCAGTG AGGAGACAGC CAGAAGCAAG CTTTTGGAGC 60TGAAGGAACC TGAGACAGAA GCTAGTCCCC CCTCTGAATT TTACTGATGA AGAAACTGAG 120GCCACAGAGC TAAAGTGACT TTTCCCAAGG TCGCCCAGCG AGGACGTGGG ACTTCTCAGA 180CGTCAGGAGA GTGATGTGAG GGAGCTGTGT GACCATAGAA AGTGACGTGT TAAAAACCAG 240CGCTGCCCTC TTTGAAAGCC AGGGAGCATC ATTCATTTAG CCTGCTGAGA AGAAGAAACC 300AAGTGTCCGG GATTCAAGAC CTCTCTGCGG CCCCAAGTGT TCGTGGTGCT TCCAGAGGCA 360GGGCT ATG CTC ACA TTC ATG GCC TCT GAC AGC GAG GAA GAA GTG TGT 407Met Leu Thr Phe Met Ala Ser Asp Ser Glu Glu Glu Val Cys1 5 10GAT GAG CGG ACG TCC CTA ATG TCG GCC GAG AGC CCC ACG CCG CGC TCC455Asp Glu Arg Thr Ser Leu Met Ser Ala Glu Ser Pro Thr Pro Arg Ser15 20 25 30TGC CAG GAG GGC AGG CAG GGC CCA GAG GAT GGA GAG AAT ACT GCC CAG503Cys Gln Glu Gly Arg Gln Gly Pro Glu Asp Gly Glu Asn Thr Ala Gln35 40 45TGG AGA AGC CAG GAG AAC GAG GAG GAC GGT GAG GAG GAC CCT GAC CGC 551Trp Arg Ser Gln Glu Asn Glu Glu Asp Gly Glu Glu Asp Pro Asp Arg50 55 60TAT GTC TGT AGT GGG GTT CCC GGG CGG CCG CCA GGC CTG GAG GAA GAG 599Tyr Val Cys Ser Gly Val Pro Gly Arg Pro Pro Gly Leu Glu Glu Glu65 70 75CTG ACC CTC AAA TAC GGA GCG AAG CAT GTG ATC ATG CTG TTT GTG CCT 647Leu Thr Lau Lys Tyr Gly Ala Lys His Val Ile Met Leu Phe Val Pro80 85 90GTC ACT CTG TGC ATG ATC GTG GTG GTA GCC ACC ATC AAG TCT GTG CGC 695Val Thr Leu Cys Met Ile Val Val Val Ala Thr Ile Lys Ser Val Arg95 100 105 110TTC TAC ACA GAG AAG AAT GGA CAG CTC ATC TAC ACG CCA TTC ACT GAG 743Phe Tyr Thr Glu Lys Asn Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu115 120 125GAC ACA CCC TCG GTG GGC CAG CGC CTC CTC AAC TCC GTG CTG AAC ACC 791Asp Thr Pro Ser Val Gly Gln Arg Leu Leu Asn Ser Val Leu Asn Thr130 135 140CTC ATC ATG ATC AGC GTC ATC GTG GTT ATG ACC ATC TTC TTG GTG GTG 839Leu Ile Met Ile Ser Val Ile Val Val Met Thr Ile Phe Leu Val Val145 150 155CTC TAC AAG TAC CGC TGC TAC AAC TTC ATC CAT GGC TGG TTG ATC ATG 887Leu Tyr Lys Tyr Arg Cys Tyr Lys Phe Ile His Gly Trp Leu Ile Met160 165 170TCT TCA CTG ATG CTG CTG TTC CTC TTC ACC TAT ATC TAC CTT GGG GAA 935Ser Ser Leu Met Leu Leu Phe Leu Phe Thr Tyr Ile Tyr Leu Gly Glu175 180 185 190GTG CTC AAG ACC TAC AAT GTG GCC ATG GAC TAC CCC ACC CTC TTG CTG 983Val Leu Lys Thr Tyr ASn Val Ala Met Asp Tyr Pro Thr Leu Leu Leu195 200 205ACT GTC TGG AAC TTC GGG GCA GTG GGC ATG GTG TGC ATC CAC TGG AAG 1031Thr Val Trp Asn Phe Gly Ala Val Gly MetVal Cys Ile His Trp Lys210 215220GGC CCT CTG GTG CTG CAG CAG GCC TAC CTC ATC ATG ATC AGT GCG CTC 1079Gly Pro Leu Val Leu Gln Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu225 230 235ATG GCC CTA GTG TTC ATC AAG TAC CTC CCA GAG TGG TCC GCG TGG GTC 1127Met Ala Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Ser Ala Trp Val240 245 250ATC CTG GGC GCC ATC TCT GTG TAT GAT CTC GTG GCT GTG CTG TGT CCC 1175Ile Leu Gly Ala Ile Ser Val Tyr Asp Leu Val Ala Val Leu Cys Pro255 260 265 270AAA GGG CCT CTG AGA ATG CTG GTA GAA ACT GCC CAG GAG AGA AAT GAG 1223Lys Gly Pro Leu Arg Met Leu Val Glu Thr Ala Gln Glu Arg Asn Glu275 280 285CCC ATA TTC CCT GCC CTG ATA TAC TCA TCT GCC ATG GTG TGG ACG GTT 1271Pro Ile Phe Pro Ala Leu Ile Tyr Ser Ser Ala Met Val Trp Thr Val290 295 300GGC ATG GCG AAG CTG GAC CCC TCC TCT CAG GGT GCC CTC CAG CTC CCC 1319Gly Met Ala Lys Leu Asp Pro Ser Ser Gln Gly Ala Leu Gln Leu Pro305 310 315TAC GAC CCG GAG ATG GAA GAA GAC TCC TAT GAC AGT TTT GGG GAG CCT 1367Tyr Asp Pro Glu Met Glu Glu Asp Ser Tyr Asp Ser Phe Gly Glu Pro320 325 330TCA TAC CCC GAA GTC TTT GAG CCT CCC TTG ACT GGC TAC CCA GGG GAG 1415Ser Tyr Pro Glu Val Phe Glu Pro Pro Leu Thr Gly Tyr Pro Gly Glu335 340 345 350GAG CTG GAG GAA GAG GAG GAA AGG GGC GTG AAG CTT GGC CTC GGG GAC 1463Glu Leu Glu Glu Glu Glu Glu Arg Gly Val Lys Leu Gly Leu Gly Asp355 360 365TTC ATC TTC TAC AGT GTG CTG GTG GGC AAG GCG GCT GCC ACG GGC AGC 1511Phe Tle Phe Tyr Ser Val Leu Val Gly Lys Ala Ala Ala Thr Gly Ser370 375 380GGG GAC TGG AAT ACC ACG CTG GCC TGC TTC GTG GCC ATC CTC ATT GGC 1559Gly Asp Trp Asn Thr Thr Leu Ala Cys Phe Val Ala Ile Leu Ile Gly385 390 395TTG TGT CTG ACC CTC CTG CTG CTT GCT GTG TTC AAG AAG GCG CTG CCC 1607Leu Cys Leu Thr Leu Leu Leu Leu Ala Val Phe Lys Lys Ala Leu Pro400 405 410GCC CTC CCC ATC TCC ATC ACG TTC GGG CTC ATC TTT TAC TTC TCC ACG 1655Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Ile Phe Tyr Phe Ser Thr415 420 425 430GAC AAC CTG GTG CGG CCG TTC ATG GAC ACC CTG GCC TCC CAT CAG CTC 1703Asp Asn Leu Val Arg Pro Phe Met Asp Thr Leu Ala Ser His Gln Leu435 440 445TAC ATC TGA GGGACATGGT GTGCCACAGG CTGCAAGCTG CAGGGAATTT 1752Tyr Ile *TCATTGGATG CAGTTGTATA GTTTTACACT CTAGTGCCAT ATATTTTTAA GACTTTTCTT 1812TCCTTAAAAA ATAAAGTACG TGTTTACTTG GTGAGGAGGA GGCAGAACCA GCTCTTTGGT 1872GCCAGCTGTT TCATCACCAG ACTTTGGCTC CCGCTTTGGG GAGCGCCTCG CTTCACGGAC 1932AGGAAGCACA GCAGGTTTAT CCAGATGAAC TGAGAAGGTC AGATTAGGGT GGGGAGAAGA 1992GCATCCGGCA TGAGGGCTGA GATGCCCAAA GAGTGTGCTC GGGAGTGGCC CCTGGCACCT 2052GGGTGCTCTG GCTGGAGAGG AAAAGCCAGT TCCCTACGAG GAGTGTTCCC AATGCTTTGT 2112CCATGATGTC CTTGTTATTT TATTNCCYTT ANAAACTGAN TCCTNTTNTT NTTDCGGCAG 2172TCACMCTNCT GGGRAGTGGC TTAATAGTAA NATCAATAAA NAGNTGAGTC CTNTTAG2229(2)SEQ ID NO19資料(i)序列特征(A)長度449個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白(xi)序列描述SEQ ID NO19Met Leu Thr Phe Met Ala Ser Asp Ser Glu Glu Glu Val Cys Asp Glu1 5 10 15Arg Thr Ser Leu Met Ser Ala Glu Ser Pro Thr Pro Arg Ser Cys Gln20 25 30Glu Gly Arg Gln Gly Pro Glu Asp Gly Glu Asn Thr Ala Gln Trp Arg35 40 45Ser Gln Glu Asn Glu Glu Asp Gly Glu Glu Asp Pro Asp Arg Tyr Val5O 55 60Cys Ser G1y Val Pro Gly Arg Pro Pro Gly Leu Glu Glu Glu Leu Thr65 70 75 80Leu Lys Tyr Gly Ala Lys His Val Ile Met Leu Phe Val Pro Val Thr85 90 95Leu Cys Met Ile Val Val Val Ala Thr Ile Lys Ser Val Arg Phe Tyr100 105 110Thr Glu Lys Asn Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr115 120 125Pro Ser Val Gly Gln Arg Leu Leu Asn Ser Val Leu Asn Thr Leu Ile130 135140Met Ile Ser Val Ile Val Val Met Thr Ile Phe Leu Val Val Leu Tyr145 150 155 160Lys Tyr Arg Cys Tyr Lys Phe Ile His Gly Trp Leu Ile Met Ser Ser165 170 175Leu Met Leu Leu Phe Leu Phe Thr Tyr Ile Tyr Leu Gly Glu Val Leu180 185 190Lys Thr Tyr Asn Val Ala Met Asp Tyr Pro Thr Leu Leu Leu Thr Val195 200 205Trp Ash Phe Gly Ala Val Gly Met Val Cys Ile His Trp Lys Gly Pro210 215 220Leu Val Leu Gln Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala225 230 235 240Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Ser Ala Trp Val Ile Leu245 250 255Gly Ala Ile Ser Val Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly260 265 270Pro Leu Arg Met Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Pro Ile275 280 285Phe Pro Ala Leu Ile Tyr Ser Ser Ala Met Val Trp Thr Val Gly Met290 295 300Ala Lys Leu Asp Pro Ser Ser Gln Gly Ala Leu Gln Leu Pro Tyr Asp305 310 315 320Pro Glu Met Glu Glu Asp Ser Tyr Asp Ser Phe Gly Glu Pro Ser Tyr325 330 335Pro Glu Val Phe Glu Pro Pro Leu Thr Gly Tyr Pro Gly Glu Glu Leu340 345 350Glu Glu Glu Glu Glu Arg Gly Val Lys Leu Gly Leu Gly Asp Phe Ile355 360 365Phe Tyr Ser Val Leu Val Gly Lys Ala Ala Ala Thr Gly Ser Gly Asp370 375 380Trp Asn Thr Thr Leu Ala Cys Phe Val Ala Ile Leu Ile Gly Leu Cys385 390 395 400Leu Thr Leu Leu Leu Leu Ala Val Phe Lys Lys Ala Leu Pro Ala Leu405 410 415Pro Ile Ser Ile Thr Phe Gly Leu Ile Phe Tyr Phe Ser Thr Asp Asn420 425 430Leu Val Arg Pro Phe Met Asp Thr Leu Ala Ser His Gln Leu Tyr Ile435 440 445(2)SEQ ID NO20的資料(i)序列特征(A)長度1895個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ix)特征(A)名稱/關鍵字CDS(B)位置140…1762(ix)特征(A)名稱/關鍵字misc_特征(B)位置1…1895(D)其它資料/注=“DmPS”(xi)序列描述SEQ ID NO20TATATGAGTC GCTTTAAAAC AAAAGAAAGT TTTTACCAGC TACATTCCTT TGGTTTCCTT 60AACTAAATCC CATCACACAA CTACGGCTTC GCAGGGGGAG GCGTCCAGCG CTACGGAGGC 120GAACGAACGC ACACCACTG ATG GCT GCT GTC AAT CTC CAG GCT TCG TGC TCC172Met Ala Ala Val Asn Leu Gln Ala Ser Cys Ser1 5 10TCC GGG CTC GCC TCT GAG GAT GAC GCC AAT GTG GGC AGC CAG ATA GGC 220Ser Gly Leu Ala Ser Glu Asp Asp Ala Asn Val Gly Ser Gln Ile Gly15 20 25GCG GCG GAG CGT TTG GAA CGA CCT CCA AGG CGG CAA CAG CAG CGG AAC 268Ala Ala Glu Arg Leu Glu Arg Pro Pro Arg Arg Gln Gln Gln Arg Asn30 35 40AAC TAC GGC TCC AGC AAT CAG GAT CAA CCG GAT GCT GCC ATA CTT GCT 316Asn Tyr Gly Ser Sar Asn Gln Asp Gln Pro Asp Ala Ala Ile Leu Ala45 50 55GTG CCC AAT GTG GTG ATG CGT GAA CCT TGT GGC TCG CGC CCT TCA AGA 364Val Pro Asn Val Val Met Arg Glu Pro Cys Gly Ser Arg Pro Ser Arg60 65 70 75CTG ACC GGT GGA GGA GGC GGC AGT GGT GGT CCG CCC ACA AAT GAA ATG 412Leu Thr Gly Gly Gly Gly Gly Ser Gly Gly Pro Pro Thr Asn Glu Met80 85 90GAG GAA GAG CAG GGC CTG AAA TAC GGG GCC CAG CAT GTG ATC AAG TTA 460Glu Glu Glu Gln Gly Leu Lys Tyr Gly Ala Gln His Val Ile Lys Leu95 100 105TTC GTC CCC GTC TCC CTT TGC ATG CIG GTA GTG GTG GCT ACC ATC AAC 508Phe Val Pro Val Ser Leu Cys Met Leu Val Val Val Ala Thr Ile Asn110 115 120TCC ATC AGC TTC TAC AAC AGC ACG GAT GTC TAT CTC CTC TAC ACA CCT 556Ser Ile Ser Phe Tyr Asn Ser Thr Asp Val Tyr Leu Leu Tyr Thr Pro125 130 135TTC CAT GAA CAA TCG CCC GAG CCT AGT GTT AAG TTC TGG AGT GCC TTG 604Phe His Glu Gln Ser Pro Glu Pro Ser Val Lys Phe Trp Ser Ala Leu140 145 150 155GCG AAC TCC CTG ATC CTG ATG AGC GTG GTG GTG GTG ATG ACC TTT TTG 652Ala Asn Ser Leu Ile Leu Met Ser Val Val Val Val Met Thr Phe Leu160 165 170CTG ATT GTT TTG TAC AAG AAG CGT TGC TAT CGC ATC ATT CAC GGC TGG 700Leu Ile Val Leu Tyr Lys Lys Arg Cys Tyr Arg Ile Ile His Gly Trp175 180 185CTG ATT CTC TCC TCC TTC ATG TTG TTG TTC ATT TTT ACG TAC TTA TAT 748Leu Ile Leu Ser Ser Phe Met Leu Leu Phe Ile Pha Thr Tyr Leu Tyr190 195 200TTG GAA GAG CTT CTT CGC GCC TAT AAC ATA CCG ATG GAC TAC CCT ACT 796Leu Glu Glu Leu Leu Arg Ala Tyr Asn Ile Pro Met Asp Tyr Pro Thr205 210 215GCA CTA CTG ATT ATG TGG AAC TTT GGA GTG GTC GGA ATG ATG TCC ATC 844Ala Leu Leu Ile Met Trp Asn Phe Gly Val Val Gly Met Met Ser Ile220 225 230 235CAT TGG CAG GGA CCT CTG CGG TTG CAG CAA GGA TAT CTC ATT TTC GTG 892His Trp Gln Gly Pro Leu Arg Leu Gln Gln Gly Tyr Leu Ile Phe Val240 245 250GCA GCC TTG ATG GCC TTG GTG TTC ATT AAA TAC CTG CCT GAA TGG ACT 940Ala Ala Leu Met Ala Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Thr255 260 265GCC TGG GCT GTA TTG GCT GCC ATT TCT ATT TGG GAT CTT ATT GCT GTC 988Ala Trp Ala Val Leu Ala Ala Ile Ger Ile Trp Asp Leu Ile Ala Val270 275 280CTT TCG CCA AGA GGA CCC CTC CGC ATT CTG GTG GAA ACG GCT CAG GAG 1036Leu Ser Pro Arg Gly Pro Leu Arg Ile Leu Val Glu Thr Ala Gln Glu285 290 295CGA AAT GAG CAA ATC TTC CCC GCT CTG ATT TAT TCA TCC ACT GTC GTT 1084Arg Asn Glu Gln Ile Phe Pro Ala Leu Ile Tyr Ser Ser Thr Val Val300 305 310 315TAC GCA CTT GTA AAC ACT GTT ACG CCG GAG CAA TCG CAG GCC ACA GCT 1132Tyr Ala Leu Val Asn Thr Val Thr Pro Gln Gln Ser Gln Ala Thr Ala320 325 330TCC TCC TCG CCG TCG TCC AGC AAC TCC ACC ACA ACC ACG AGG GCC ACG 1180Ser Ser Ser Pro Ser Ser Ser Asn Ser Thr Thr Thr Thr Arg Ala Thr335 340 345CAG AAC TCG CTG GCT TCG CCA GAG GCA GCA GCG GCT AGT GGC CAA CGC 1228Gln Asn Ser Leu Ala Ser Pro Glu Ala Ala Ala Ala Ser Gly Gln Arg350 355 360ACA GGT AAC TCC CAT CCT CGA CAG AAT CAG CGG GAT GAC GGC AGT GTA 1276Thr Gly Asn Ser His Pro Arg Gln Asn Gln Arg Asp Asp Gly Ser Val365 370 375CTG GCA ACT GAA GGT ATG CCA CTT GTG ACT TTT AAA AGC AAT TTG CGC 1324Leu Ala Thr Glu Gly Met Pro Leu Val Thr Phe Lys Ser Asn Leu Arg380 385 390 395GGA AAC GCT GAG GCT GCG GGT TTC ACG CAA GAG TGG TCA GCT AAC TTG 1372Gly Asn Ala Glu Ala Ala Gly Phe Thr Gln Glu Trp Ser Ala Asn Leu400 405 410AGC GAA CGT GTG GCT CGT CGC CAG ATT GAA GTT CAA AGT ACT CAG AGT 14205er Glu Arg Val Ala Arg Arg Gln Ile Glu Val Gln Ser Thr Gln Ser415 420 425GGA AAC GCT CAG CGC TCC AAC GAG TAT AGG ACA GTA ACA GCT CCG GAT 1468Gly Asn Ala Gln Arg Ser Asn Glu Tyr Arg Thr Val Thr Ala Pro Asp430 435 440CAG AAT CAT CCG GAT GGG CAA GAA GAA CGT GGC ATA AAG CTT GGC CTC 1516Gln Asn His Pro Asp Gly Gln Glu Glu Arg Gly Ile Lys Leu Gly Leu445 450 455GGC GAC TTC ATC TTC TAC TCG GTA TTA GTG GGC AAG GCC TCC AGC TAC 1564Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ser Tyr460 465 470 475GGC GAC TGG ACG ACC ACA ATC GCT TGC TTT GTG GCC ATC CTC ATT GGA 1612Gly Asp Trp Thr Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile Gly480 485 490CTC TGC CTC ACT CTT CTG CTT CTG GCC ATT TGG CGC AAG GCG CTA CCC 1660Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Trp Arg Lys Ala Leu Pro495 500 S05GCC CTG CCC ATC TCA ATA ACG TTC GGA TTG ATA TTT TGC TTC GCC ACT 1708Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Ile Phe Cys Phe Ala Thr510 515 520AGT GCG GTG GTC AAG CCG TTC ATG GAG GAT CTA TCG GCC AAG CAG GTG 1756Ser Ala Val Val Lys Pro Phe Met Glu Asp Leu Ser Ala Lys Gln Val525 530 535TTT ATA TAAACTTGAA AAGACAAGGA CACATCAAGT GTCTTACAGT ATCATAGTCT 1812Phe Ile540AACAAAGCTT TTTGTAATCC AATTCTTTAT TTAACCAAAT GCATAGTAAC AACCTCGACT1872AAAAAAAAAA AAAAAAAAAA AAA1895(2)SEQ ID NO21資料(i)序列特征(A)長度541個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白(xi)序列描述SEQ ID NO21Met Ala Ala Val Asn Leu Gln Ala Ser Cys Ser Ser Gly Leu Ala Ser1 5 10 15Glu Asp Asp Ala Asn Val Gly Ser Gln Ile Gly Ala Ala Glu Arg Leu20 25 30Glu Arg Pro Pro Arg Arg Gln Gln Gln Arg Asn Asn Tyr Gly Ser Ser35 40 45Asn Gln Asp Gln Pro Asp Ala Ala Ile Leu Ala Val Pro Asn Val Val50 55 60Met Arg Glu Pro Cys Gly Ser Arg Pro Ser Arg Lau Thr Gly Gly Gly65 70 75 80Gly Gly Ser Gly Gly Pro Pro Thr Asn Glu Met Glu Glu Glu Gln Gly85 90 95Leu Lys Tyr Gly Ala Gln His Val Ile Lys Leu Phe Val Pro Val Ser100 105 110Leu Cys Met Leu Val Val Val Ala Thr Ile Asn Ser Ile Ser Phe Tyr115 120 125Asn Ser Thr Asp Val Tyr Leu Leu Tyr Thr Pro Phe His Glu Gln Ser130 135 140Pro Glu Pro Ser Val Lys Phe Trp Ser Ala Leu Ala Asn Ser Leu Ile145 150 155 160Leu Met Ser Val Val Val Val Met Thr Phe Leu Leu Ile Val Leu Tyr165 170 175Lys Lys Arg Cys Tyr Arg Ile Ile His Gly Trp Leu Ile Leu Ser Ser180 185 190Phe Met Leu Leu Phe Ile Phe Thr Tyr Leu Tyr Leu Glu Glu Leu Leu195 200 205Arg Ala Tyr Asn Ile Pro Met Asp Tyr Pro Thr Ala Leu Leu Ile Met210 215 220Trp Asn Phe Gly Val Val Gly Met Met Ser Ile His Trp Gln Gly Pro225 230 235 240Leu Arg Leu Gln Gln Gly Tyr Leu Ile Phe Val Ala Ala Leu Met Ala245250 255Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Thr Ala Trp Ala Val Leu260 265 270Ala Ala Ile Ser Ile Trp Asp Leu Ile Ala Val Leu Ser Pro Arg Gly275 280 285Pro Leu Arg Ile Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Gln Ile290 295 300Phe Pro Ala Leu Ile Tyr Ser Ser Thr Val Val Tyr Ala Leu Val Asn305 310 315 320Thr Val Thr Pro Gln Gln Ser Gln Ala Thr Ala Ser Ser Ser Pro Ser325 330 335Ser Ser Asn Ser Thr Thr Thr Thr Arg Ala Thr Gln Asn Ser Leu Ala340 345 350Ser Pro Glu Ala Ala Ala Ala Ser Gly Gln Arg Thr Gly Asn Ser His355 360 365Pro Arg Gln Asn Gln Arg Asp Asp Gly Ser Val Leu Ala Thr Glu Gly370 375 380Met Pro Leu Val Thr Phe Lys Ser Asn Leu Arg Gly Asn Ala Glu Ala385 390 395 400Ala Gly Phe Thr Gln Glu Trp Ser Ala Asn Leu Ser Glu Arg Val Ala405 410 415Arg Arg Gln Ile GIu Val Gln Ser Thr Gln Ser Gly Asn Ala Gln Arg420 425 430Ser Asn Glu Tyr Arg Thr Val Thr Ala Pro Asp Gln Asn His Pro Asp435 440 445Gly Gln Glu Glu Arg Gly Ile Lys Leu Gly Leu Gly Asp Phe Ile Phe450 455 460Tyr Ser Val Leu Val Gly Lys Ala Ser Ser Tyr Gly Asp Trp Thr Thr465 470 475 480Thr Ile Ala Cys Phe Val Ala Ile Leu Ile Gly Leu Cys Leu Thr Leu485 490 495Leu Leu Leu Ala Ile Trp Arg Lys Ala Leu Pro Ala Leu Pro Ile Ser500 505 510Ile Thr Phe Gly Leu Ile Phe Cys Phe Ala Thr Ser Ala Val Val Lys515 520 525Pro Phe Met Glu Asp Leu Ser Ala Lys Gln Val Phe Ile530 535 540(2)SEQ ID NO22的資料(i)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO22CTNCCNGART GGACNGYCTG G 21(2)SEQ ID NO23的資料(i)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO23RCANGCDATN GTNGTRTTCC A 21(2)SEQ ID NO24的資料(i)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO24TTTTTTCTCG AGACNGCNCA RGARAGAAAY GA 32(2)SEQ ID NO25的資料(i)序列特征(A)長度29個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO25TTTTTTGGAT CCTARAADAT RAARTCNCC 29
權利要求
1.含有一段核苷酸序列的分離的核酸,所述核苷酸序列編碼選自正常早衰素-1蛋白、突變早衰素-1蛋白、正常早衰素-2蛋白、突變早衰素-2蛋白的蛋白。
2.權利要求1的分離的核酸,其中所述核酸編碼正常早衰素-1蛋白,其中所述核苷酸序列選自(1)編碼含有SEQ ID NO2的人早衰素-1氨基酸序列的蛋白的序列;(2)編碼含有SEQ ID NO4的人早衰素-1氨基酸序列的蛋白的序列;(3)編碼含有SEQ ID NO17的鼠早衰素-1氨基酸序列的蛋白的序列;(4)編碼含有SEQ ID NO2的氨基酸序列的蛋白的序列,其中用丙氨酸取代殘基257,并略除殘基258-290;(5)編碼含有SEQ ID NO4的氨基酸序列的蛋白的序列,其中用丙氨酸取代殘基253,并略除殘基254-286;和(6)編碼正常早衰素-1蛋白并在嚴謹雜交條件下能夠與(1)-(5)的任何序列的互補序列雜交的序列。
3.權利要求1的分離的核酸,其中所述核酸編碼突變早衰素-1蛋白,其中所述核苷酸序列編碼至少一種突變,該突變對應于選自下列的SEQID NO2的突變A79?、V82L、V96F、Y115H、M139T、M139V、I143T、M146L、M146V、H163R、H163Y、L171P、G209V、I211T、A231T、A246E、A260V、C263R、P264L、P267S、E280A、E280G、A285V、L286V、Δ291-319、G384A、L392V和C410Y;并且其中所述核苷酸序列還對應于選自下列的核苷酸序列(1)編碼含有SEQ ID NO2的人早衰素-1氨基酸序列的蛋白的序列;(2)編碼含有SEQ ID NO4的人早衰素-1氨基酸序列的蛋白的序列;(3)編碼含有SEQ ID NO17的鼠早衰素-1氨基酸序列的蛋白的序列;(4)編碼含有SEQ ID NO2的氨基酸序列的蛋白的序列,其中用丙氨酸取代殘基257,并略除殘基258-290;(5)編碼含有SEQ ID NO4的氨基酸序列的蛋白的序列,其中用丙氨酸取代殘基253,并略除殘基254-286;和(6)編碼正常早衰素-1蛋白并在嚴謹雜交條件下能夠與(1)-(5)的任何序列的互補序列雜交的序列。
4.權利要求1的分離的核酸,其中所述核酸編碼突變早衰素-1蛋白,其中所述核苷酸序列編碼至少一種突變,該突變對應于選自M239V、N141I和I420T的SEQ ID NO19的突變;和其中所述核苷酸序列還對應于選自下列的核苷酸序列(1)編碼含有SEQ ID NO2的人早衰素-1氨基酸序列的蛋白的序列;(2)編碼含有SEQ ID NO4的人早衰素-1氨基酸序列的蛋白的序列;(3)編碼含有SEQ ID NO17的鼠早衰素-1氨基酸序列的蛋白的序列;(4)編碼含有SEQ ID NO2的氨基酸序列的蛋白的序列,其中用丙氨酸取代殘基257,并略除殘基258-290;(5)編碼含有SEQ ID NO4的氨基酸序列的蛋白的序列,其中用丙氨酸取代殘基253,并略除殘基254-286;和(6)編碼正常早衰素-1蛋白并在嚴謹雜交條件下能夠與(1)-(5)的任何序列的互補序列雜交的序列。
5.權利要求1的分離的核酸,其中所述核酸編碼正常早衰素-2蛋白,而且其中所述核苷酸序列選自(1)編碼含有SEQ ID NO19的人早衰素-2氨基酸序列的蛋白的序列;(2)編碼含有SEQ ID NO19的人早衰素-2氨基酸序列的蛋白的序列,其中略除了殘基263-296;(3)編碼正常早衰素-2蛋白并在嚴謹雜交條件下能夠與(1)-(2)的任一序列的互補序列雜交的序列。
6.權利要求1的分離的核酸,其中所述核酸編碼突變早衰素-2蛋白,其中所述核苷酸序列編碼至少一種突變,該突變對應于選自M239V、N141I和I420T的SEQ ID NO19的突變;并且其中所述核苷酸序列還對應于選自下列的核苷酸序列(1)編碼含有SEQ ID NO19的人早衰素-2氨基酸序列的蛋白的序列;(2)編碼含有SEQ ID NO19的人早衰素-2氨基酸序列的蛋白的序列,其中略除了殘基263-296;(3)編碼正常早衰素-2蛋白并在嚴謹雜交條件下能夠與(1)-(2)的任何序列的互補序列雜交的序列。
7.權利要求1的分離的核酸,其中所述核酸編碼突變早衰素-2蛋白,其中所述核苷酸序列編碼至少一種突變,該突變對應于SEQ ID NO2的選自下列突變的突變A79?、V82L、V96F、Y115H、M139T、M139V、I143T、M146L、M146V、H163R、H163Y、L171P、G209V、I211T、A231T、A246E、A260V、C263R、P264L、P267S、E280A、E280G、A285V、L286V、Δ291-319、G384A、L392V和C410Y;并且其中所述核苷酸序列還對應于選自下列的核苷酸序列(1)編碼含有SEQ ID NO19的人早衰素-2氨基酸序列的蛋白的序列;(2)編碼含有SEQ ID NO19的人早衰素-2氨基酸序列的蛋白的序列,其中略除殘基263-296;(3)編碼正常早衰素-2蛋白并在嚴謹雜交條件下能夠與(1)-(2)的任何序列的互補序列雜交的序列。
8.一段分離的核酸,其含有至少10個連續(xù)核苷酸的核苷酸序列,所述連續(xù)核苷酸選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO16、SEQ ID NO18、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ IDNO15和任何這些序列的互補序列。
9.一段分離的核酸,其含有至少15個連續(xù)核苷酸的核苷酸序列,所述連續(xù)核苷酸選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO16、SEQ ID NO18、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ IDNO15和任何這些序列的互補序列。
10.一段分離的核酸,其含有至少20個連續(xù)核苷酸的核苷酸序列,所述連續(xù)核苷酸選自SEQ ID NO1、SEQ ID NO3、SEQ ID NO16、SEQ ID NO18、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ IDNO15和任何這些序列的互補序列。
11.含有一段核苷酸序列的分離的核酸,所述核苷酸序列含有至少10個來自插入質粒的早衰素的連續(xù)核苷酸,所述質粒選自ATCC登記號97214、ATCC登記號97508、ATCC登記號97124和ATCC登記號97428。
12.含有一段核苷酸序列的分離的核酸,所述核苷酸序列編碼早衰素蛋白的至少一個功能結構域,所述早衰素蛋白選自正常早衰素-1蛋白、突變早衰素-1蛋白、正常早衰素-2蛋白、突變早衰素-2蛋白。
13.權利要求12的分離的核酸,其中所述功能結構域是對應于選自下列結構域的早衰素-1功能結構域早衰素-1的N-末端、TM1、TM1→2、TM2、TM2→3、TM3、TM3→4、TM4、TM4→5、TM5、TM5→6、TM6、TM6→7、TM7和C-末端結構域。
14.權利要求12的分離的核酸,其中所述功能結構域是對應于選自下列結構域的早衰素-2功能結構域早衰素-2的N-末端、TM1、TM1→2、TM2、TM2→3、TM3、TM3→4、 TM4、TM4→5、TM5、TM5→6TM6、TM6→7、TM7和C-末端結構域。
15.含有一段核苷酸序列的分離的核酸,所述核苷酸序列編碼早衰素蛋白的抗原決定基,所述早衰素蛋白選自正常早衰素-1蛋白、突變早衰素-1蛋白、正常早衰素-2蛋白、突變早衰素-2蛋白。
16.權利要求15的分離的核酸,其中所述序列編碼早衰素-1抗原決定基,該抗原決定基對應于選自下列的早衰素-1抗原決定基SEQ ID NO2的氨基酸殘基27-44、28-61、46-48、50-60、65-71、66-67、107-111、109-112、120-121、120-122、125-126、155-160、185-189、214-223、218-221、220-230、240-245、241-243、267-269、273-282、300-370、302-310、311-325、332-342、346-359、372-382、400-410和400-420。
17.權利要求15的分離的核酸,其中所述序列編碼早衰素-2抗原決定基,該抗原決定基對應于選自下列的早衰素-2抗原決定基SEQ ID NO19的氨基酸殘基25-45、50-63、70-75、114-120、127-132、162-167、221-226、282-290、310-314、321-338、345-352、380-390和430-435。
18.鑒定人早衰素基因的等位基因變體或異特異性同系物的方法,該方法包括在嚴謹雜交條件下,選擇能夠與人早衰素基因序列雜交的核酸探針或引物將所述探針或引物與核酸樣品混合,所述樣品含有對應于所述變體或同系物的核酸;檢測所述探針或引物與對應于所述變體或同系物的核酸的雜交。
19.權利要求18的方法,其中所述樣品含有選自人基因組DNA、人mRNA和人cDNA的核酸樣品。
20.權利要求18的方法,其中所述樣品含有選自哺乳動物基因組DNA、哺乳動物mRNA和哺乳動物cDNA的核酸樣品。
21.權利要求18的方法,其中所述樣品含有選自無脊椎動物基因組DNA、無脊椎動物mRNA和無脊椎動物cDNA的核酸樣品。
22.權利要求18的方法,其還包括分離對應于所述變體或同系物的核酸的步驟。
23.權利要求18的方法,其中所述核酸是通過雜交鑒定的。
24.權利要求18的方法,其中所述核酸是通過PCR擴增鑒定的。
25.鑒定人早衰素基因的等位基因變體或異特異性同系物的方法,其包括選擇能夠選擇性結合人早衰素蛋白的抗體;將所述抗體與蛋白樣品混合,所述樣品含有對應于所述變體或同系物的蛋白;檢測所述抗體與對應于所述變體或同系物的所述蛋白的結合。
26.權利要求25的方法,其中所述樣品含有選自人蛋白、人融合蛋白和其蛋白水解片段的蛋白樣品。
27.權利要求25的方法,其中所述樣品含有選自哺乳動物蛋白、哺乳動物融合蛋白和其蛋白水解片段的核酸樣品。
28.權利要求25的方法,其中所述樣品含有選自無脊椎動物蛋白、無脊椎動物融合蛋白和其蛋白水解片段的核酸樣品。
29.權利要求25的方法,其還包括基本上純化對應于變體或同系物的所述蛋白的步驟。
30.含有人早衰素基因的等位基因變體或異特異性同系物的分離的核酸。
31.編碼人早衰素蛋白的等位基因變體或異特異性同系物的分離的核酸。
32.權利要求31的分離的核酸,其中所述核酸編碼人早衰素基因的黑尾果蠅同系物。
33.權利要求32的分離的核酸,其中所述核酸含有選自下列的核苷酸序列(1)編碼含有SEQ ID NO21的DmPS氨基酸序列的蛋白的序列;(2)編碼早衰素同系物蛋白并在嚴謹雜交條件下能夠與(1)的互補序列雜交的序列。
34.一段分離的核酸,其含有至少10個連續(xù)核苷酸的核苷酸序列,所述連續(xù)核苷酸選自SEQ ID NO21和與SEQ ID NO21互補的序列。
35.含有包含權利要求1-34中任一權項的核苷酸序列的重組載體的分離的核酸。
36.權利要求35的分離的核酸,其中所述載體是表達載體、而且所述早衰素核苷酸序列與調節(jié)區(qū)可操作相連。
37.權利要求36的分離的核酸,其中所述表達載體可在哺乳動物細胞中表達所述早衰素序列。
38.權利要求37的分離的核酸,其中所述細胞選自成纖維細胞、肝、腎、脾、骨髓和神經細胞。
39.權利要求37的分離的核酸,其中所述載體選自牛痘病毒、腺病毒、反轉錄病毒、趨神經病毒和單純皰疹。
40.權利要求36的分離的核酸,其中所述表達載體編碼早衰素蛋白的至少一個功能結構域,所述早衰素蛋白選自正常早衰素-1、突變早衰素-1、正常早衰素-2和突變早衰素-2。
41.權利要求36的分離的核酸,其中所述載體還含有編碼與所述早衰素序列可操作相連的外源蛋白的序列,由此所述載體編碼早衰素融合蛋白。
42.權利要求41的分離的核酸,其中所述外源蛋白選自lacZ、trpE、麥芽糖結合蛋白、poly-His標記或谷胱甘肽-S-轉移酶。
43.含有重組表達載體的分離的核酸,所述重組表達載體包含對應于早衰素基因內源調節(jié)區(qū)的核苷酸序列。
44.權利要求43的分離的核酸,其中所述內源調節(jié)區(qū)與一標記基因可操作相連。
45.用權利要求36-44中任一權項的表達載體轉化的宿主細胞或其子代。
46.權利要求45的宿主細胞,其中所述宿主細胞選自細菌細胞和酵母細胞。
47.權利要求45的宿主細胞,其中所述宿主細胞選自胎細胞、胚胎干細胞、受精卵、配子和種系細胞。
48.權利要求45的宿主細胞,其中所述細胞選自成纖維細胞、肝、腎、脾、骨髓和神經細胞。
49.權利要求45的宿主細胞,其中所述細胞是無脊椎動物細胞
50.早老性癡呆病的一種非人動物模型,其中已用至少一種重組構建體修飾了所述動物的基因組或其祖代,并且已將下列修飾導入所述構建體(1)編碼異特異性正常早衰素基因的至少一個功能結構域的核苷酸序列的插入,(2)編碼異特異性突變早衰素基因的至少一個功能結構域的核苷酸序列的插入,(3)編碼異特異性突變早衰素基因同種同系物的至少一個功能結構域的核苷酸序列的插入,和(4)內源早衰素基因的失活。
51.權利要求50的動物,其中所述修飾是插入編碼正常的人早衰素-1基因的至少一個功能結構域的核苷酸序列。
52.權利要求50的動物,其中所述修飾是插入編碼突變的人早衰素-1基因的至少一個功能結構域的核苷酸序列。
53.權利要求50的動物,其中所述修飾是插入編碼正常的人早衰素-2基因的至少一個功能結構域的核苷酸序列。
54.權利要求50的動物,其中所述修飾是插入編碼突變的人早衰素-2基因的至少一個功能結構域的核苷酸序列。
55.權利要求50的動物,其中所述修飾是插入編碼正常的或突變的人早衰素蛋白的至少一個功能結構域的核苷酸序列。
56.權利要求50的動物,其中所述動物選自大鼠、小鼠、倉鼠、豚鼠、兔、狗、貓、山羊、綿羊、豬和非人靈長類。
57.權利要求50的動物,其中所述動物是無脊椎動物。
58.一種生產早衰素蛋白的至少一個功能結構域的方法,其包括在適宜的條件下培養(yǎng)權利要求45-49中任一權項的宿主細胞以通過表達所述核酸來生產早衰素。
59.一種基本上純的蛋白制品,所述蛋白選自正常早衰素-1蛋白、突變早衰素-1蛋白、正常早衰素-2蛋白、突變早衰素-2蛋白。
60.權利要求59的基本上純的制品,其中所述蛋白含有選自下列的正常早衰素-1蛋白(1)含有SEQ ID NO2的氨基酸序列的蛋白;(2)含有SEQ ID NO4的氨基酸序列的蛋白;(3)含有SEQ ID NO17的氨基酸序列的蛋白;(4)含有SEQ ID NO2的氨基酸序列的蛋白,其中用丙氨酸取代殘基257,并略除殘基258-290;和(5)含有SEQ ID NO4的氨基酸序列的蛋白,其中用丙氨酸取代殘基253,并略除殘基254-286。
61.權利要求59的基本上純的制品,其中所述蛋白含有包含至少一種突變的突變早衰素-1蛋白,所述突變對應于選自下列突變的SEQ ID NO2的突變A79?、V82L、V96F、Y115H、M139T、M139V、I143T、M146L、M146V、H163R、H163Y、L171P、G209V、I211T、A231T、A246E、A260V、C263R、P264L、P267S、E280A、E280G、A285V、L286V、Δ291-319、G384A、L392V和C410Y;并且其中所述蛋白還對應于選自下列的氨基酸序列(1)SEQ ID NO2的氨基酸序列;(2)SEQ ID NO4的氨基酸序列;(3)SEQ ID NO17的氨基酸序列;(4)SEQ ID NO2的氨基酸序列,其中用丙氨酸取代殘基257,并略除殘基258-290;和(5)SEQ ID NO4的氨基酸序列,其中用丙氨酸取代殘基253,并略除殘基254-286。
62.權利要求59的基本上純的制品,其中所述蛋白含有選自下列的正常早衰素-2蛋白(1)含有SEQ ID NO19的氨基酸序列的蛋白;和(2)含有SEQ ID NO19的氨基酸序列的蛋白,其中略除了殘基263-296。
63.權利要求59的基本上純的制品,其中所述蛋白含有包含至少一種突變的突變早衰素-2蛋白,所述突變對應于選自M239V、N141I和I420T的SEQ ID NO19的突變;并且其中所述蛋白還對應于選自下列的氨基酸序列(1)SEQ ID NO19的氨基酸序列;(2)SEQ ID NO19的氨基酸序列,其中略除了殘基263-296。
64.一種基本上純的多肽制品,其含有選自SEQ ID NO2、SEQ IDNO4、SEQ ID NO17、SEQ ID NO19和SEQ ID NO21的至少5個連續(xù)氨基酸殘基的氨基酸序列。
65.一種基本上純的多肽制品,其含有選自SEQ ID NO2、SEQ IDNO4、SEQ ID NO17、SEQ ID NO19和SEQ ID NO21的至少10個連續(xù)氨基酸殘基的氨基酸序列。
66.一種基本上純的多肽制品,其含有選自SEQ ID NO2、SEQ IDNO4、SEQ ID NO17、SEQ ID NO19和SEQ ID NO21的至少15個連續(xù)氨基酸殘基的氨基酸序列。
67.一種基本上純的多肽制品,其含有早衰素蛋白的至少一個功能結構域,所述早衰素蛋白選自正常早衰素-1蛋白、突變早衰素-1蛋白、正常早衰素-2蛋白、突變早衰素-2蛋白。
68.權利要求67的基本上純的制品,其中所述功能結構域是對應于選自下列結構域的早衰素-1功能結構域早衰素-1的N-末端、TM1、TM1→2、TM2、TM2→3、TM3、TM3→4、TM4、TM4→5、TM5、TM5→6、TM6、TM6→7、TM7和C-末端結構域。
69.權利要求67的基本上純的制品,其中所述功能結構域是對應于選自下列結構域的早衰素-2功能結構域早衰素-2的N-末端、TM1、TM1→2、TM2、TM2→3、TM3、TM3→4、TM4、TM4→5、TM5、TM5→6、TM6、TM6→7、TM7和C-末端結構域。
70.一種基本上純的多肽制品,其含有早衰素蛋白的抗原決定基,所述早衰素蛋白選自正常早衰素-1蛋白、突變早衰素-1蛋白、正常早衰素-2蛋白、突變早衰素-2蛋白。
71.權利要求70的基本上純的制品,其中所述多肽含有早衰素-1抗原決定基,該抗原決定基對應于選自下列的早衰素-1抗原決定基SEQ IDNO2的氨基酸殘基27-44、28-61、46-48、50-60、65-71、66-67、107-111、109-112、120-121、120-122、125-126、155-160、185-189、214-223、218-221、220-230、240-245、241-243、267-269、273-282、300-370、302-310、311-325、332-342、346-359、372-382、400-410和400-420。
72.權利要求70的基本上純的制品,其中所述多肽含有早衰素-1抗原決定基,該抗原決定基對應于選自下列的早衰素-1抗原決定基SEQ IDNO19的氨基酸殘基25-45、50-63、70-75、114-120、127-132、162-167、221-226、282-290、310-314、321-338、345-352、380-390和430-435。
73.生產與早衰素選擇性結合的抗體的方法,其包括如下步驟給動物施用致免疫有效量的早衰素免疫原;使所述動物生產抗所述免疫原的抗體;和從所述動物或其衍生的細胞培養(yǎng)物中得到所述抗體。
74.一種基本上純的抗體制品,其與早衰素蛋白的抗原決定基選擇性結合,所述早衰素蛋白選自正常早衰素-1、突變早衰素-1、正常早衰素-2、突變早衰素-2。
75.權利要求74的基本上純的抗體制品,其中所述抗體選擇性地結合突變早衰素-1的抗原決定基,但不能結合正常早衰素-1蛋白。
76.權利要求74的基本上純的抗體制品,其中所述抗體選擇性地結合突變早衰素-2的抗原決定基,但不能結合正常早衰素-2蛋白。
77.生產權利要求74-76中任一權項的抗體的細胞系。
78.鑒定可調節(jié)早衰素基因表達的化合物的方法,其包括將細胞與受試候選物接觸,其中所述細胞包含與編碼區(qū)可操作相連的早衰素基因的調節(jié)區(qū);和檢測所述編碼區(qū)表達方面的變化。
79.權利要求78的方法,其中所述變化包括由所述編碼區(qū)編碼的mRNA轉錄本水平的變化。
80.權利要求78的方法,其中所述變化包括由所述編碼區(qū)編碼的蛋白水平的變化。
81.權利要求78的方法,其中所述變化是由所述編碼區(qū)編碼的蛋白的活性的結果。
82.權利要求78的方法,其中所述編碼區(qū)編碼標記蛋白,所述標記蛋白選自β半乳糖苷酶、堿性磷酸酶、綠熒光蛋白和熒光素酶。
83.一種鑒定可選擇性結合早衰素蛋白的化合物的方法,其包括如下步驟提供含至少一種早衰素組分的制品;將所述制品與包含至少一種候選化合物的樣品接觸;和檢測所述早衰素組分與所述候選化合物的結合。
84.權利要求83的方法,其中與所述早衰素組分的結合是通過選自下列的試驗來檢測的親和層析、共免疫沉淀、生物分子相互作用試驗和酵母雙雜交系統(tǒng)。
85.鑒定可調節(jié)早衰素活性的化合物的方法,其包括如下步驟提供表達正?;蛲蛔冊缢ニ鼗虻募毎?;將所述細胞與至少一種候選化合物接觸;和檢測所述活性的標記的變化。
86.權利要求85的方法,其中所述標記的測量表明帶有表達的突變早衰素基因的細胞與其它不帶有表達的突變早衰素基因的相同細胞之間存在的差異。
87.權利要求85的方法,其中所述變化包括選自下列的細胞生理學非特異性標記的變化pH、胞內鈣、環(huán)AMP水平、GTP/GDP比率、磷脂酰肌醇活性和蛋白磷酸化。
88.權利要求85的方法,其中所述變化包括早衰素表達方面的變化。
89.權利要求85的方法,其中所述變化包括選自Ca2+、Na+和K+的離子的細胞內濃度或流量方面的變化。
90.權利要求85的方法,其中所述變化包括細胞凋亡或細胞死亡的出現(xiàn)或比率方面的變化。
91.權利要求85的方法,其中所述變化包括Aβ肽生產方面的變化。
92.權利要求85的方法,其中所述變化包括至少一種微管相關蛋白磷酸化的變化。
93.權利要求85的方法,其中所述細胞是體外培養(yǎng)的細胞。
94.權利要求93的方法,其中所述細胞是權利要求45-49中任一權項的轉化的宿主細胞。
95.權利要求93的方法,其中從攜帶至少一種突變早衰素基因的宿主中外植所述細胞。
96.權利要求93的方法,其中從權利要求50-57中任一權項的轉基因動物中外植所述細胞。
97.權利要求85的方法,其中所述細胞是活動物中的細胞。
98.權利要求97的方法,其中所述細胞是權利要求50-57中任一權項的轉基因動物的細胞。
99.權利要求85的方法,其中所述細胞是臨床試驗中的人類受試者的細胞。
100.確定受試者是否帶有突變早衰素基因的診斷方法,其包括如下步驟提供所述受試者的生物樣品;在所述樣品中檢測突變早衰素核酸、突變早衰素蛋白或突變早衰素活性。
101.權利要求100的方法,其中突變早衰素核酸是通過選自下列的試驗檢測的直接核苷酸測序、探針特異性雜交、限制酶消化和作圖、PCR作圖、連接酶介導的PCR檢測、RNase保護、電泳遷移率變動分析和化學錯配切割。
102.權利要求100的方法,其中突變早衰素蛋白是通過選自下列的試驗檢測的免疫試驗、蛋白酶試驗和電泳遷移率試驗。
103.含有基本上純的早衰素蛋白和可藥用載體的藥物制品。
104.含有可操作地編碼早衰素蛋白的表達載體和可藥用載體的藥物制品,其中所述表達載體可在人類受試者中表達所述早衰素蛋白。
105.含有可操作地編碼早衰素反義序列的表達載體和可藥用載體的藥物制品,其中所述表達載體可在人類受試者中表達所述早衰素反義序列。
106.含有基本上純的抗體和可藥用載體的藥物制品,其中所述抗體選擇性地結合突變早衰素蛋白。
107.權利要求106的藥物制品,其中所述制品基本上沒有選擇性結合正常早衰素蛋白的抗體。
108.含有突變早衰素蛋白的基本上純的抗原決定基制品的藥物制品。
109.權利要求108的藥物制品,其中所述制品基本上沒有正常早衰素蛋白的抗原決定基。
110.一種治療攜帶突變早衰素基因的患者的方法,其包括給所述患者施用治療有效量的權利要求103-109中任一權項的藥物制品。
111.權利要求110的方法,其中所述藥物制品靶向選自下列的細胞類型心、腦、肺、肝、骨骼肌、腎、胰腺和神經細胞。
全文摘要
本發(fā)明描述了兩種人早衰素基因(PS-1和PS-2)的導致家族性早老性癡呆病的突變的鑒定、分離、測序和表征。還鑒定了小鼠、C.elegans和黑尾果蠅中的早衰素基因同系物。含有或衍生于早衰素的核酸和蛋白可用于篩選并診斷早老性癡呆病,用于鑒定并發(fā)展治療早老性癡呆病的治療方法,以及用于生產作為早老性癡呆病的模型的細胞系和轉基因動物。
文檔編號C07K14/47GK1188508SQ96194902
公開日1998年7月22日 申請日期1996年4月29日 優(yōu)先權日1996年4月29日
發(fā)明者P·H·澤喬治-希斯洛普, P·E·弗雷澤, J·M·羅門斯 申請人:Hsc研究和發(fā)展合伙人有限公司, 多倫多大學董事局