專利名稱::細胞培養(yǎng)表型的差異表達譜分析及其用途的制作方法
技術領域:
:本發(fā)明涉及通過差異表達謙分析來鑒定參與賦予特定細胞表型的基因和蛋白質(zhì)的方法,以及所述基因和蛋白質(zhì)在優(yōu)化細胞系培養(yǎng)條件和轉(zhuǎn)基因表達中的用途。
背景技術:
:當今生物學研究的基礎在于最佳培養(yǎng)與維持細胞系的能力。細胞系不只提供了用于生物系統(tǒng)和疾病研究的體外模型,而且還被用于生產(chǎn)有機試劑。特別重要的是4吏用遺傳工程化原核或真核細胞系來產(chǎn)生大量的重組蛋白質(zhì)。重組蛋白質(zhì)可以用在生物學研究中,或者作為治療性化合物用于治療特定的不適或疾病。生產(chǎn)重組蛋白質(zhì)用于生物制藥學應用一般需要大量的細胞和/或影響細胞生長和/或表達的特定細胞培養(yǎng)條件。在某些情況下,重組蛋白質(zhì)生產(chǎn)得益于向細胞培養(yǎng)基中引入化學誘導劑(如丁酸鈉或戊酸)。鑒定響應培養(yǎng)條件(或特定試劑)增加轉(zhuǎn)基因表達的基因和有關的遺傳通路可能闡明潛在的能被操縱用于增加重組蛋白質(zhì)生產(chǎn)和/或影響細胞生長的把標。對于重組蛋白質(zhì)生產(chǎn)的研究一直主要是致力于研究基因調(diào)控、細胞反應、細胞代謝及響應未折疊蛋白質(zhì)而激活的通路。目前還沒有可行的方法,能允許同時監(jiān)測轉(zhuǎn)基因表達和鑒定參與轉(zhuǎn)基因表達的遺傳通路。例如,目前可行的用于檢測轉(zhuǎn)基因表達的方法包括僅測定已知蛋白質(zhì)的存在和量(如Western(蛋白質(zhì))印跡分析、酶聯(lián)免疫吸附試驗和熒光激活的細胞分選)、或是已知信使RNA(mRNA)轉(zhuǎn)錄物的存在和量(如Northern(RNA)印跡分析和反轉(zhuǎn)錄-聚合酶鏈式反應)的那些。這些及類似的方法不只局限于能夠一次檢測的已知蛋白質(zhì)和/或mRNA轉(zhuǎn)錄物的數(shù)目,而且它們還需要研究人員在實驗前知道或"猜測,,什么基因參與轉(zhuǎn)基因表達(因此使用適當?shù)目贵w或寡核苷酸探針)。印跡分析和類似方法另一固有的局限是同樣大小的蛋白質(zhì)或mRNA不能被區(qū)分開來??紤]到在單個基因組內(nèi)包含的大量的基因,即便使用上述方法鑒定參與遺傳通路的少數(shù)基因也是昂貴而費時的事情。此外,要求研究人員對于涉及哪些基因有些想法,就不能夠用于鑒定以前未發(fā)現(xiàn)的或未知的參與轉(zhuǎn)基因表達調(diào)控的基因和有關通路。因此,在細胞系工程領域中需要更系統(tǒng)的方法來鑒定(直接或間接)參與特定細胞培養(yǎng)表型[如增加的和有效的轉(zhuǎn)基因表達I的基因和蛋白質(zhì)(包括以前未發(fā)現(xiàn)的基因和蛋白質(zhì))和有關遺傳通路。發(fā)現(xiàn)這些基因和/或有關通路將提供能被操縱用來改善重組蛋白質(zhì)產(chǎn)率和質(zhì)量、影響細胞生長的新靼標。
發(fā)明內(nèi)容本發(fā)明通過^f吏用核酸微陣列和蛋白質(zhì)組學分析方法提供工業(yè)相關細胞系表型的差異表達i普分析而解決了這些問題。特別是,本發(fā)明提供了通過表達鐠分析而系統(tǒng)地鑒定最大化蛋白質(zhì)表達和分泌的基因和蛋白質(zhì)及有關通路的方法。本發(fā)明還提供了用于操縱鑒定的基因和蛋白質(zhì)來工程化改進細萬包系的方法。7因此,一方面,本發(fā)明提供了用于鑒定調(diào)控或指示細胞系的細胞培養(yǎng)表型的蛋白質(zhì)的方法。所述方法包括生成得自測試細胞系的樣品的蛋白質(zhì)表達譜;將所述蛋白質(zhì)表達譜與得自對照細胞系的對照謙比較;和基于比較[其中測試細胞系具有和對照細胞系不同的細胞培養(yǎng)表型l鑒定一個或多個差異表達的蛋白質(zhì),且所述一個或多個差異表達的蛋白質(zhì)能夠調(diào)控或指示細胞培養(yǎng)表型。在優(yōu)選的實施方案中,細胞系是中國倉鼠卵巢(CHO)細胞系。在另一實施方案中,通過熒光二維差異凝膠電泳生成蛋白質(zhì)表達i昝。在一些實施方案中,細胞培養(yǎng)表型是細胞生長速率、細胞生產(chǎn)力(例如最大細胞生產(chǎn)力或持續(xù)高細胞生產(chǎn)力)、峰值細胞密度、持續(xù)細胞活力、氨生產(chǎn)或消耗速率、或乳酸生產(chǎn)或消耗速率。在一個實施方案中,細胞培養(yǎng)表型是最大細胞生產(chǎn)力。在另一實施方案中,細胞培養(yǎng)表型是持續(xù)細胞活力。而在另一實施方案中,細胞培養(yǎng)表型是峰值細胞密度。又在另一實施方案中,細胞培養(yǎng)表型是細胞生長速率。本發(fā)明提供了通過調(diào)節(jié)即上調(diào)或下調(diào)依照上述方法鑒定的一個或多個蛋白質(zhì)改進細胞系的方法。在此所用的"上調(diào)"包括提供編碼目的蛋白質(zhì)或保留其活性的變體(例如,其哺乳動物同源物,例如靈長動物或嚙齒動物同源物)的外源核酸(例如過表達構建體),或提供間接增強蛋白質(zhì)或基因活性或表達水平的因子或分子。在此使用的"下調(diào)"包括敲除編碼目的蛋白質(zhì)的基因、提供RNA干擾構建體、或提供間接抑制蛋白質(zhì)或基因活性或表達水平的抑制劑或其他因子。在一個特定的實施方案中,本發(fā)明提供了通過RNA千擾下調(diào)依據(jù)上述方法鑒定的一個或多個蛋白質(zhì)來改進細胞系的方法。特別地,本發(fā)明提供了改進細胞系的細胞生產(chǎn)力的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)依據(jù)上述方法鑒定的一個或多個蛋白質(zhì)。在一個實施方案中,本發(fā)明提供了改進細胞系的細胞生產(chǎn)力的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)選自表2、3、9、10、11和12的一個或多個基因或蛋白質(zhì)。在一個實施方案中,本發(fā)明提供了改進細胞系的細胞生長速率的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)依據(jù)上述方法鑒定的一個或多個蛋白質(zhì)。特別地,本發(fā)明提供了改進細胞系的細胞生長速率的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)選自表4、5、6、13、14、27和28的一個或多個基因和蛋白質(zhì)。在另一實施方案中,本發(fā)明提供了用于增加細胞系的峰值細胞密度的方法,包括依據(jù)上述方法調(diào)節(jié)(即上調(diào)或下調(diào))一個或多個鑒定的蛋白質(zhì)。特別地,本發(fā)明提供了用于增加細胞系的峰值細胞密度的方法,包括調(diào)節(jié)(即上調(diào)或下調(diào))一個或多個選自表8、15、16和17的基因或蛋白質(zhì)。在另一實施方案中,本發(fā)明提供了增加細胞系的持續(xù)細胞活力的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)依據(jù)上述方法鑒定的一個或多個蛋白質(zhì)。特別地,本發(fā)明提供了增加細胞系的持續(xù)細胞活力的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)選自表7、18和19的一個或多個基因或蛋白質(zhì)。在另一實施方案中,本發(fā)明提供了調(diào)控細胞系的乳酸生產(chǎn)或消耗的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)依據(jù)上述方法鑒定的一個或多個蛋白質(zhì)。特別地,本發(fā)明提供了調(diào)控細胞系的乳酸生產(chǎn)或消耗的方法,包括調(diào)節(jié)即上調(diào)或下調(diào)選自表7、18和19的一個或多個基因或蛋白質(zhì)。而在另一實施方案中,本發(fā)明提供了通過調(diào)節(jié)即上調(diào)或下調(diào)依據(jù)上述方法鑒定的一個或多個基因或蛋白質(zhì)來改進細胞系的方法。特別地,本發(fā)明提供了通過調(diào)節(jié)即上調(diào)或下調(diào)選自表20、24、25和26的一個或多個基因或蛋白質(zhì)來改進細胞系的方法。另一方面,本發(fā)明提供了通過調(diào)節(jié)即上調(diào)或下調(diào)至少兩種基因或蛋白質(zhì)來改進細胞系的方法,其中第一基因或蛋白質(zhì)影響第一細胞培養(yǎng)表型,而第二基因或蛋白質(zhì)影響不同的第二細胞培養(yǎng)表型,其中細胞培養(yǎng)表型選自細胞生長速率、細胞生產(chǎn)力、峰值細胞密度、持續(xù)細胞活力、氨生產(chǎn)或消耗速率、或乳酸生產(chǎn)或消耗速率。在一個實施方案中,所述方法還包括上調(diào)或下調(diào)影響不同于第一和笫二細胞培養(yǎng)表型的第三細胞培養(yǎng)表型的第三種基因或蛋白質(zhì)。又另一個方面,本發(fā)明提供了評估細胞系的細胞培養(yǎng)表型的方法。所述方法包括檢測細胞培養(yǎng)物樣品中依照上述任一方法鑒定的蛋白質(zhì)的表達9水平,并將所述表達水平與參照水平相比較,其中比較指示細胞培養(yǎng)表型??蛇x的,本發(fā)明提供了評估細胞系的細胞培養(yǎng)表型的方法。所述方法包括檢測細胞培養(yǎng)物樣品中指示細胞培養(yǎng)表型的一個或多個標記,其中所述標記從由選自圖7-138的肽、或選自表1-20和表24-30的基因或蛋白質(zhì)組成的組中選擇。另一方面,本發(fā)明提供了具有改進的細胞培養(yǎng)表型的工程細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)依照上述不同方法所鑒定的一個或多個蛋白質(zhì)的工程構建體。特別地,本發(fā)明提供了具有改進的細胞生產(chǎn)力的工程細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表2、3和9-12的一個或多個基因或蛋白質(zhì)的工程構建體。在一些實施方案中,工程構建體是過表達構建體。在其他實施方案中,工程構建體是干擾RNA構建體。在其他實施方案中,本發(fā)明提供了具有改進的細胞生長速率的工程細胞系,其包括工程細胞群,各工程細胞包括上調(diào)或下調(diào)選自表4、5、6、13、14、27和28的一個或多個基因或蛋白質(zhì)的工程構建體。在一些實施方案中,工程構建體是過表達構建體。在其他實施方案中,工程構建體是干擾RNA構建體。在其他實施方案中,本發(fā)明提供了具有改進的峰值細胞密度的工程細胞系,其包含工程細胞群,各工程細胞包括上調(diào)或下調(diào)選自表8、15、16和17的一個或多個基因或蛋白質(zhì)的工程構建體。在一些實施方案中,工程構建體是過表達構建體。在其他實施方案中,工程構建體是干擾RNA構建體。在其他實施方案中,本發(fā)明提供了具有改進的持續(xù)細胞活力的工程細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表18和26的一個或多個基因或蛋白質(zhì)的工程構建體。在一些實施方案中,工程構建體是過表達構建體。在其他實施方案中,工程構建體是干擾RNA構建體。在其他實施方案中,本發(fā)明提供了具有調(diào)控的乳酸生產(chǎn)或消耗的工程細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表29和3010的一個或多個基因或蛋白質(zhì)的工程構建體。在一些實施方案中,工程構建體是過表達構建體。在其他實施方案中,工程構建體是干擾RNA構建體。在一些實施方案中,本發(fā)明提供了改進的工程細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表20、24、25和26的一個或多個基因或蛋白質(zhì)的工程構建體。在一些實施方案中,工程構建體是過表達構建體。在其他實施方案中,工程構建體是千擾RNA構建體。而在另一方面,本發(fā)明提供了使用如上所述工程細胞系表達目的蛋白質(zhì)的方法。所述方法包括向根據(jù)上述任一實施方案的工程細胞系中引入編碼目的蛋白質(zhì)的核酸和收獲目的蛋白質(zhì)的步驟。又在另一方面,本發(fā)明還提供了分離的基因或蛋白質(zhì)、或是以前未發(fā)現(xiàn)基因或蛋白質(zhì)的、和/或參與調(diào)控或指示目的細胞培養(yǎng)表型的多核苷酸或多肽。特別地,本發(fā)明提供了分離的或重組的核酸,其包含選自表9、13和15的序列、其互補物、其亞序列。本發(fā)明還提供了分離的或重組的蛋白質(zhì),其包含選自表2和3的序列或其片段。本發(fā)明還提供了包含本發(fā)明核酸分子或蛋白質(zhì)的遺傳工程表達載體、宿主細胞和轉(zhuǎn)基因動物。此外本發(fā)明提供了本發(fā)明的核酸分子或本發(fā)明蛋白質(zhì)編碼核酸的抑制性多核苷酸,如反義和RNA干擾(RNAi)分子。本發(fā)明的其他特征、目的和優(yōu)勢在下面的發(fā)明詳述中顯而易見。但是應當理解,雖然發(fā)明詳述指出了本發(fā)明的實施方案,但其僅作為舉例說明給出,而不作為限制?;诎l(fā)明詳述,在本發(fā)明范圍內(nèi)的多種改變和修改對于本領域技術人員而言是顯而易見的。附圖的簡短說明圖l是鑒定本發(fā)明基因和蛋白質(zhì)的例示性方法的流程圖。圖2圖解了CHO細胞系和細胞表型的例示性矩陣。圖3描述了測試細胞系和對照細胞系之間關于"高細胞生長速率"表型的例示性性表型比較。圖4圖解了蛋白質(zhì)表達譜分析方法。圖5及圖6描述了例示性凝膠上的Cy3和Cy5染色模式,并給出了所選擇蛋白質(zhì)的相對豐度的圖示。圖5顯示了在cy5標記的測試細胞提取物中顯示有5倍上調(diào)的蛋白質(zhì)。圖6顯示了在cy5標記的測試細胞提取物中顯示有4倍下調(diào)的蛋白質(zhì)。圖7-138圖解了差異表達的個體蛋白質(zhì)的序列數(shù)據(jù)和分析。圖139和140圖示了無監(jiān)督的皮爾森(Pearson)聚類分析。圖141描述了用成對差異進行數(shù)據(jù)分析的例示性方法。圖142描述了不依賴于成對差異進行數(shù)據(jù)分析的例示性方法。圖143-146描述了所鑒定的基因在3C7細胞系中的例示性評估。圖147和148圖解了評估過表達所鑒定的基因?qū)τ诩毎L和生產(chǎn)力的影響的24孔形式。圖149-151圖解了過表達所鑒定的基因?qū)τ诩毎L和生產(chǎn)力的例示性結果。發(fā)明詳述本發(fā)明提供了鑒定影響目的細胞培養(yǎng)表型的基因和蛋白質(zhì)的系統(tǒng)方法。本發(fā)明的方法基于工業(yè)相關細胞培養(yǎng)表型的差異表達譜分析,整合使用DNA^f效陣列和蛋白質(zhì)組學分析。特別地,所述方法包括生成測試細胞系樣品的基因或蛋白質(zhì)表達i普;將基因或蛋白質(zhì)表達語與細胞培養(yǎng)表型不同于測試細胞系的對照細胞系的對照鐠相比較;基于所述比較來鑒定一個或多個差異表達的基因或蛋白質(zhì)。此處使用的測試細胞系和對照細胞系可以是具不同遺傳背景的不同細胞系,或是在不同細胞培養(yǎng)條件下生長的相同細胞系。一個或多個差異表達的基因或蛋白質(zhì)是調(diào)控或指示目的細胞培養(yǎng)表型的候選基因或蛋白質(zhì)。所鑒定的基因或蛋白質(zhì)可以經(jīng)進一步確認和證實。還可以操縱所鑒定的基因或蛋白質(zhì)以改進目的細胞培養(yǎng)表型。因此,本發(fā)明為細胞工程領域理性設計改進細胞系和細胞培養(yǎng)條件方面的重大進展。本發(fā)明的種種方面在下面的分節(jié)中有進一步的詳述。分節(jié)的使用無意限制本發(fā)明。各分節(jié)可以應用到本發(fā)明的任何方面。在本申請中,除非另有聲明,"或"表示"和/或"。勿^屑型本發(fā)明設想對不同生物、包括但不限于細菌、植物、真菌和動物(后者包括但不限于昆蟲和哺乳動物)的細胞系進行差異表達鐠分析和優(yōu)化。例如,本發(fā)明可以應用于大腸桿菌OE^^WcW"co/0、草地夜蛾(S/wfe/7tem,Mg^7^Y/")、煙草屬物種(A^'cW""fl5/;.)、玉蜀黍(Zefl附fl")、浮萍屬物種(丄簡""夢)、酵母屬物種(5"flc由ra附戸"/;.)、畢赤酵母屬物種(戶/c/^Vi5p.)、裂殖酵母屬物種(5^/^zM"cc/i"/w^cesw.)、哺乳動物細胞、包括但不限于COS細胞、CHO細胞、293細胞、A431細胞、3T3細胞、CV-1細胞、HeLa細胞、L細胞、BHK21細胞、HL-60細胞、U937細胞、HEK細胞、PerC6細胞、Jurkat細胞、正常二倍體細胞、來自原代組織(primarytissue)體外培養(yǎng)和原代移植物(primaryexplant)的細胞林。所述生物和細胞系名錄僅意在提供非限制性的例子。特別地,本發(fā)明考慮對工業(yè)相關細胞系例如CHO細胞進行差異表達譜分析。CHO細胞是用于治療性蛋白質(zhì)生產(chǎn)例如單克隆抗體生產(chǎn)、受體生產(chǎn)及Fc融合蛋白生產(chǎn)的主要宿主,因為CHO細胞確保折疊、加工和糖基化的保真度。CHO細胞也適合于深層、無血清培養(yǎng)并具有很好的安全記錄。本發(fā)明使人們能夠理解影響期望細胞培養(yǎng)表型或特性[例如允許高生產(chǎn)力的分批補料過程的細胞表型的通路、基因和蛋白質(zhì)。這樣的期望細胞表型包括但不限于高細胞生長速率、高峰值細胞密度、持續(xù)的高細胞活力、高最大細胞生產(chǎn)力、持續(xù)高細胞生產(chǎn)力、低氨產(chǎn)量和低乳酸產(chǎn)量。期望的表型或特性可以是具有特定基因組背景的已建細胞系的固有特性。還可以通過在不同條件如溫度、細胞密度、使用試劑如丁酸鈉的情況下培養(yǎng)細胞,使其處于不同動力學生長期(例如停滯期、對數(shù)生長期、穩(wěn)定期或死亡期)和/或使其變?yōu)檠宸且蕾囆缘葋碣x予細胞期望的表型或特性。在誘導這些13表型的期間和/或在獲得這些表型之后,可以從細胞制備靼核酸或蛋白質(zhì)樣品庫并用寡核苷酸陣列分析,以確定和鑒定哪些基因響應于特定刺激物(如溫度、丁酸鈉)顯示出改變的表達,并因此有可能參與賦予期望的表型或特性。游/s裙鑀岸為了進行基因表達鐠分析,從來自細胞系的樣品中制備靶核酸庫。任何生物樣品可以用做靶核酸的來源。靼核酸庫可以是總RNA,或由之衍生的任何核酸,包括通過反轉(zhuǎn)錄mRNA制備的每條cDNA單鏈、或是自雙鏈cDNA中間體轉(zhuǎn)錄的RNA。分離靼核酸以通過寡核苷酸陣列或其他探針進行分析的方法,例如酚-氯仿抽提、乙醇沉淀、磁珠分離或硅膠親和純化,為本領域技術人員所熟知。舉例來說,不同的方法可用于分離或富集RNA。這些方法包括但不限于RNeasy試劑盒(由凱杰公司(Qiagen)提供)、MasterPure試劑盒(由EpicentreTechnologies公司提供)、charge-switch才支術(見例^口美國公布專利申請?zhí)?003/0054395和2003/0130499)及TRIZOL(由GibcoBRL公司提供)。由昂飛公司(Affymetrix)提供的RNA分離方法也可用于本發(fā)明,見例如《基因芯片表達分析技術指南》(GeneChipEXPRESSIONANALYSISTECHNICALMANUAL)(701021rev.3,昂飛公司(Affymetrix,Inc.),2002)。優(yōu)選耙核酸庫(即由之衍生的mRNA或核酸)應反映基因編碼區(qū)的轉(zhuǎn)錄。在一個例子中,通過除去rRNA富集mRNA??捎貌煌姆椒▉硐蚪档蜆悠分械膔RNA量。例如,可通過酶消化去除rRNA。依照后面的方法,rRNA首先使用反轉(zhuǎn)錄酶和特異引物擴增來產(chǎn)生cDNA。使rRNA與cDNA退火。然后用RNA酶H處理樣品,其能特異消化RNA:DNA雜合體中的RNA??梢詳U增把核酸,之后與寡核香酸陣列或其他探針孵育。合適的擴增方法包括但不限于反轉(zhuǎn)錄-聚合酶鏈式反應、連接酶鏈式反應、自主序列復制和體外轉(zhuǎn)錄,為本領域所熟知。要注意的是應選擇寡核苷酸探針與靼核酸互補。因此,如果提供反義革巴核酸庫(當通過體外轉(zhuǎn)錄擴增革巴核酸時通常如此),寡核苷酸探針應對應于有義互補鏈的亞序列。反之,如果乾核酸庫是有義的,寡核苷酸陣列應與之互補(即反義)。最后,如果耙核酸是雙鏈,寡核苷酸探針可以是有義或反義。本發(fā)明包括檢測耙核酸和互補寡核苷酸探針之間的雜交強度。為實現(xiàn)之,粑核酸可以直接或間接與合適可檢測標記相連。直接標記是直接附著于或摻入靶核酸的可檢測標記。間接標記是在雜交后附著于多核苦酸,通常通過附著于在雜交前已附著于靼核酸的結合部分實現(xiàn)。此類直接和間接標記為本領域所熟知。在本發(fā)明的優(yōu)選實施方案中,靶核酸使用生物素-鏈霉親和素-PE偶聯(lián)系統(tǒng)來檢測,其中生物素摻入靶核酸,并通過鏈霉親和素-PE與生物素的結合來檢測雜交。耙核酸可以在與寡核苷酸陣列孵育之前、期間或之后標記。優(yōu)選在孵育前標記耙核酸??梢酝ㄟ^在反應中使用已經(jīng)標記的核苷酸(如生物素偶聯(lián)的dUTP或dCTP)在擴增步驟摻入標記??蛇x的是,標記可以直接加入到原始核酸樣品(例如mRNA、cDNA)中,或在擴增完成后加入到擴增產(chǎn)物中。將標記附著至核酸的方法對于本領域技術人員是熟知的,包括但不限于缺口翻譯、末端標記以及將耙核酸連至核酸接頭,借助接頭將其與標記連在一起??蛇x地,專門設計用于分離和制備靶核酸進行微陣列分析的幾種試劑盒是可商購的,包括但不限于GeneChipIVT標記試劑盒(加州圣克拉拉市昂飛公司(Affymetrix,SantaClara,Calif.))和BioarrayTMHighYieldTMRNA轉(zhuǎn)錄標記試劑盒,配有熒光素-UTP用于核酸P車列(紐約州法明岱爾市因助生命科學公司(EnzoLifeSciences,Inc.,Farmingdale,N.Y.))。在用可檢測基團標記之前多核苷酸可以被片段化。用于片段化的例示性方法包括但不限于熱或離子介導的水解。15適用于本發(fā)明的探針包括寡核苷酸陣列或能夠檢測細胞(或細胞系)、包括已知的細胞或來自未測序生物的細胞中多種基因(包括以前未發(fā)現(xiàn)的基因)的表達、鑒定可能參與誘導特定細胞表型(如增加的及有效的轉(zhuǎn)基因表達)的基因(包括以前未發(fā)現(xiàn)基因)和有關通路的其他探針。本發(fā)明使用的寡核苷酸探針可以是核苷酸多聚體或類似物和其修飾形式,從而與乾核酸庫的雜交以序列特異性的方式在寡核苷酸陣列雜交條件下發(fā)生。在此使用的術語"寡核苷酸陣列雜交條件"意指通常用于寡核苷酸陣列雜交的溫度和離子條件。在許多實例中,這些條件包括于45。C雜交16小時,接著在室溫洗滌至少三次,每次10分鐘。雜交緩沖液包含100mMMES、lM[Na+、20mMEDTA和0.01%Tween20。雜交緩沖液的pH范圍可以是6.5到6.7。洗滌緩沖液是6xSSPET,其中包含0.9MNaCl、60mMNaH2P04、6mMEDTA和0.005%TritonX-IOO。在更嚴謹?shù)墓押塑账彡嚵须s交條件下,洗滌緩沖液可以含IOOmMMES、0.1M[Na+]和0.01%Tween20。參見《基因芯片表達分析技術指南》(GENECHIPEXPRESSIONANALYSISTECHNICALMANUAL)(701021rev.3,昂飛公司(Affymetrix,Inc.)2002),在此以其整體引入作為參考。正如本領域技術人員所知,寡核苷酸探針可以是任何長度。優(yōu)選適用于本發(fā)明的寡核苷酸長度為20到70個核苷酸。最優(yōu)選地,合適的寡核苷酸探針長度為25個核苷酸。在一個實施方案中,本發(fā)明的核酸探針具有相對高的序列復雜度。在許多實例中,探針不含長段的相同核苷酸。此外,可以設計探針,從而其3,端沒有高比例的G或C殘基。在另一實施方案中,探針沒有3,末端T殘基。取決于欲實施的測定或檢測的類型,探針序列中可以納入或者排除預測會形成發(fā)夾或鏈內(nèi)結構如"引物二聚體"的序列。在許多實施方案中,本發(fā)明所采用的^#針不含任何的不明確堿基。制備寡核苷酸探針,使之特異于模板序列(例如與之互補,即能夠與之雜交)。模板序列的任何部分能夠用來制備探針。每個模板序列可以制備多重揮:4十,如5、10、15、20、25、30個或更多。這些多重探針可能互相重疊,可能不重疊。不同探針間的重疊在某些測定中可能是期望的。在許多實施方案中,模板序列的探針和其他模板序列或其互補物序列同一性低。例如,模板序列的每個探針和其他模板序列或其互補物的序列同一性可以不超過70%、60%、50%或更低。這降低了不期望的交叉雜交風險??梢?吏用本領域已知的方法確定序列同一性。這些方法包括但不限于BLASTN、FASTA和FASTDB。也可使用遺傳計算組(GeneticsComputerGroup,GCG)程序,它是包括BLASTN和FASTA的批程序。模板序列的優(yōu)選序列包括但不限于共有序列、轉(zhuǎn)基因序列和對照序列(即用于控制或標準化實驗、樣品、嚴謹度需求及乾核酸制品間差異的序列)。此外,任何共有序列、轉(zhuǎn)基因和對照序列的亞序列君可以用做模板序列。在一個實施方案中,僅利用共有序列、轉(zhuǎn)基因和對照序列的某些區(qū)域(即疊片區(qū)域(tilingregion))作為本發(fā)明所用寡核苷酸探針的模板序列。本領域技術人員將會意識到可用于實施本發(fā)明的方法(如體外轉(zhuǎn)錄方法)通常導致偏向于乾核酸3,端。因此,在本發(fā)明一個實施方案中,共有序列或轉(zhuǎn)基因序列中最接近于共有序列3'端的區(qū)域最常用作寡核苷酸探針的模板。一般而言,如果能夠鑒定出多聚腺苷酸(poly-A)信號,緊靠共有序列或轉(zhuǎn)基因序列末端之前的1400個核苷酸被指定為疊片區(qū)域??蛇x地,如果不能鑒定出poly-A信號,僅共有序列或轉(zhuǎn)基因序列最后的600個核苷酸被指定為疊片區(qū)域。然而,應注意的是本發(fā)明不限于只使用這些共有序列、轉(zhuǎn)基因和對照序列內(nèi)的疊片區(qū)域作為寡核苷酸探針的模板。事實上,疊片區(qū)域可能出現(xiàn)在共有序列、轉(zhuǎn)基因或?qū)φ招蛄袃?nèi)的任何處。例如,對照序列的疊片區(qū)域可能包含來自對照序列的5,和3,端的區(qū)域。實際上,完整共有序列、轉(zhuǎn)基因或?qū)φ招蛄锌梢员挥米鞴押塑账崽结樀哪0濉_m用于本發(fā)明的寡核苷酸陣列可以包括和如上所述鑒定的多種共有序列(即多序列簇的共有序列及例示性序列的共有序列)精確配對的探針。適用于本發(fā)明的寡核苷酸陣列還可以包括與共有和轉(zhuǎn)基因序列都精確配對的探針。對于本領域技術人員顯而易見的是,當細胞系經(jīng)遺傳改造以表達由轉(zhuǎn)基因序列編碼的重組蛋白質(zhì)、分析目的是證實轉(zhuǎn)基因表達及確定此表達水平時,在轉(zhuǎn)基因序列中納入寡核苷酸探針是有用的。在那些轉(zhuǎn)基因以雙順反子mRNA連接至下游ORF如二氬葉酸還原酶(DHFR)的情況下,轉(zhuǎn)基因表達水平也可以根據(jù)下游序列的表達水平來確定。在本發(fā)明另一實施方案中,寡核苷酸陣列還包含標準化實驗、樣品、嚴謹度需求和靶核酸制品間固有差異的對照探針。這些類型對照揮:針中每一類的例示性組成參見美國專利號6,040,138和美國公開號20060010513中,兩者的教導在此以其整體引入作為參考。本領域技術人員熟知的是,從同一樣品獨立加工的兩個革S核酸庫能夠與兩個單獨但相同的寡核苷酸陣列雜交而有不同的結果。這些陣列間的不同結果歸因于幾個因素,如標記靼核酸庫的強度和孵育條件。為了控制這些差異,可以在陣列中標準化添加對照探針。標準化對照探針是與摻和在粑核酸庫中的已知核酸序列精確互補的寡核苷酸。任何寡核苷酸序列可以用作標準化對照探針。例如,標準化對照探針可以從得自不同于待分析細胞系來源生物的沖莫板創(chuàng)建。在一個實施方案中,針對哺乳動物序列的寡核苷酸陣列包含針對下列基因的標準化寡核苷酸探針來自生物大腸桿菌的Wo"、WoC和6"D、來自生物噬菌體PI的cm、以及來自生物枯草芽孢桿菌(5"7/附s"M7Zs)的J"/;,或他們的亞序列。從標準化對照探針獲得的信號強度接著用于標準化來自陣列中所有其他探針的信號強度。此外,當已知核酸序列對于每一轉(zhuǎn)錄物而言以已知的不同濃度摻和在靶核酸庫中時,可以生成將信號強度與轉(zhuǎn)錄物濃度相關聯(lián)的標準曲線,并且可以定量陣列上呈現(xiàn)的所有轉(zhuǎn)錄物的表達水平(見例如Hill等(2001)GenomeBiol.2(12):research0055.1-0055.13)。因為細胞間天然不同的代謝狀態(tài),具體靶核酸的表達隨著樣品的不同而存有差異。此外,某個庫中的輩巴核酸與另一個庫相比可能更傾向于降解。因此,在本發(fā)明另一實施方案中,寡核苷酸陣列還包含與反映細胞代謝狀態(tài)的組成型表達基因或其亞序列精確互補的寡核苷酸探針。這些類型的基因的非限制性例子是P-肌動蛋白、轉(zhuǎn)鐵蛋白受體和甘油醛-3-磷酸脫氫酶(GAPDH)。18在本發(fā)明的一個實施方案中,靶核酸庫通過使用在美國公開號20060010513中所述的方法將分離自樣品的總RNA轉(zhuǎn)換成雙鏈cDNA、并將產(chǎn)生的cDNA轉(zhuǎn)錄成互補RNA(cRNA)來獲得,所述方法的教導在此以其整體引入作為參考。RNA轉(zhuǎn)換方法始于RNA轉(zhuǎn)錄物的3,端,并且如果所述過程無法進行完全(例如,如果RNA是缺口的,等),則3,端信息的量相對于5,端信息將更大,導致3'偏向。此外,RNA降解可能始于5,端(JacobsAnderson等(1998)EMBOJ.17:1497-506)。這些方法的使用暗示著寡核苷酸陣列中優(yōu)選應納入衡量操作質(zhì)量和樣品降解量的對照探針。此類對照探針的例子有與組成型表達基因如上述p-肌動蛋白、轉(zhuǎn)鐵蛋白受體和GAPDH的3,和5,端精確互補的寡核苷酸。從而所產(chǎn)生的組成型表達基因的3,對5,表達比率指示了操作的質(zhì)量和樣品的降解量,即大于3的3,對5,比率指示著不完全的操作或是高RNA降解(Auer等(2003)Nat-Genet.35:292-93)。因此,在本發(fā)明的優(yōu)選實施方案中,寡核苷酸陣列包括與組成型表達基因3,和5'端互補的對照探針。乾核酸庫的質(zhì)量不只反映于操作和靼核酸的降解,而且反映在草巴核酸的來源。污染的序列如基因組DNA可能干擾熟知的定量方法。因此,在本發(fā)明的優(yōu)選實施方案中,陣列還包含精確互補于細菌基因、核糖體RNA和/或基因組基因間區(qū)域的寡核苷酸探針,以提供控制樣品制備物質(zhì)量的手段。這些探針控制靶核酸庫被細菌DNA、非mRNA物質(zhì)和基因組DNA污染的可能性。在美國公開號20060010513中公布了這類例示性對照序列,其教導在此以其整體引入作為參考。在本發(fā)明的優(yōu)選實施方案中,寡核苷酸陣列還包含對于各完美匹配探針而言的對照錯配寡核苷酸探針。錯配探針控制雜交特異性。優(yōu)選地,錯配對照探針除了一個或多個取代的堿基之外,與其相應的完美匹配探針完全相同。更優(yōu)選的是,取代發(fā)生在探針的中心位置。例如,當完美匹配探針長度是25個核苷酸時,相應的錯配探針將具有相同的長度和序列,除了發(fā)生在13位處的單堿基取代(例如將腺噤呤取代為胸腺嘧啶、胸腺嘧咬取代為腺嘌呤、鳥嘌呤取代為胞嘧啶或胞嘧咬取代為鳥嘌呤)。錯配寡核苷酸探針中一個或多個錯配堿基的存在不允許在適當條件下與互補的完美匹配探針結合的靶核酸與相應的錯配對照探針結合。因此,錯配的寡核苷酸探針指示孵育條件是否為最佳,即所用的嚴謹度是否確保乾核酸只與陣列中存在的精確互補探針結合。對每一模板來說,可以使用多種策略選擇一套精確互補于共有、轉(zhuǎn)基因和/或?qū)φ招蛄械膩喰蛄?或其疊片區(qū)域)的完美匹配探針。本領域:汰術人員知道每個模板可以提供大量的潛在探針。正如公知的那樣,表觀(apparent)探針有時不適于包括到陣列中。這可能因為在基因組其他區(qū)域存在相似的亞序列,導致針對這些亞序列的探針交叉雜交,給出假信號。某些表觀#^十可能不適于包括在陣列內(nèi)的另一個原因在于它們可能形成阻礙有效雜交的二級結構。最后,靶核酸與(或?qū)?包含大量探針的陣列的雜交要求每個探針在相同孵育條件下與其特異性靶核酸序列雜交。寡核苷酸陣列可能包含針對共有、轉(zhuǎn)基因或?qū)φ招蛄械囊粋€完美匹配探針,或可能包含針對共有、轉(zhuǎn)基因或?qū)φ招蛄械奶结樇?即多于一個完美匹配探針)。例如,寡核苷酸陣列可能包含針對共有、轉(zhuǎn)基因或?qū)φ招蛄械膌、5、10、25、50、100或多于100個不同的完美匹配探針。在本發(fā)明的優(yōu)選實施方案中,陣列包含至少11-150個精確互補于每個共有和轉(zhuǎn)基因序列的亞序列的不同完美匹配寡核苷酸。在甚至更優(yōu)選實施方案中,只納入每個模板的最佳探針集合??梢允褂枚喾N計算機程序評價雜交用探針的適合度。為此目的的合適的程序包括^旦不限于LaserGene(DNAStar)、Oligo(國家生物科學公司,NationalBiosciences,Inc.)、MacVector(Kodak/IBI)和由GCG提供的標準程序。本領域已知的任何方法或軟件程序可用于制備本發(fā)明模板序列的探針。例如,通過使用由加州森尼韋爾市(Simnyvale,Calif.)TdeChem國際公司提供的軟件包ArrayDesigner可以生成寡核苷酸纟笨針。用于選擇最佳探針集合的另一例示性運算法參見美國專利號6,040,138,其教導在此引入作為參考。最佳化探針集合的其他合適的手段將產(chǎn)生相當?shù)墓押塑账彡嚵?,為本領域熟知,并且可以在例如Lockhart等(1996)Nat.Biotechnol.14:1675-80和Mei等(2003)Proc.Natl.Acad.Sci.USA100:11237-42中找到??梢杂枚喾N方法合成本發(fā)明的寡核苷酸纟笨針。這些方法的例子包括但不限于使用自動化或高通量DNA合成儀,例如由密理博公司(Millipore)、基因儀器公司(GeneMachines)和生物自動化公司(BioAutomation)提供的那些。在許多實施方案中,合成的探針基本上不含雜質(zhì)。在其他許多實施方案中,探針基本上不含可能會妨礙期望探針功能的其他污染物??梢杂迷S多方法純化或濃縮探針,例如反相層析、乙醇沉淀、凝膠過濾、電泳或其任意組合。在美國公開號20060010513中公開了更為詳細的制備適用于本發(fā)明的寡核苷酸陣列的信息和例示性陣列,其公開內(nèi)容在此引入作為參考。如美國^Hf號20060010513中所述,適于本發(fā)明的CHO芯片^f效陣列包括122個陣列質(zhì)量控制序列(非CHO)、732個公開的倉鼠序列、2835個文庫來源的CHO序列和22個產(chǎn)物/過程特異性序列。其他合適的陣列描述于美國專利號6,040,138,其公開內(nèi)容引入作為參考。乾核^與萍W^^以承成染爻潘孵育反應可以以絕對或差異雜交形式進行。在絕對的雜交形式中,來自一個樣品的多核苷酸與寡核苷酸陣列中的探針雜交。在形成雜交復合物之后檢測到的信號與樣品中的多核苷酸水平相關。在差異雜交形式中,來自兩個樣品的多核苷酸用不同的標記部分標記。將這些差異標記的多核苷酸的混合物加入到寡核苷酸陣列中。然后在兩個不同標記的發(fā)射可獨立檢測的條件下檢查寡核苷酸陣列。在一個實施方案中,使用Cy3和Cy5(新澤西州皮斯卡^荅韋市安發(fā)瑪西亞生物技術>^司(AmershamPharmaciaBiotech,Piscataway,N.J.))作為差異雜交形式的標記基團。在本發(fā)明中,孵育條件應是便于靶核酸只與具有高度互補性的寡核苷酸探針雜交。在優(yōu)選的實施方案中,這是通過使靶核酸庫和寡核苷酸陣列在保證雜交的低嚴謹性條件下孵育、然后以持續(xù)升高的嚴謹度進行洗滌直至達到期望雜交特異性水平而實現(xiàn)。在其他實施方案中,靶核酸在嚴謹?shù)幕蚴熘墓押塑账彡嚵须s交條件下與本發(fā)明的陣列孵育。在許多實例中,這些寡核苷酸陣列雜交條件包括45。C孵育16小時,然后在室溫洗滌至少三次,每次10分鐘。雜交緩沖液包含100mMMES、lM[Na+、20mMEDTA和0.01。/。Tween20。雜交緩沖液的pH范圍可以是6.5到6.7。洗滌緩沖液是6xSSPET,其包含0.9MNaCl、60mMNaH2P04、6mMEDTA和0.005%TritonX-IOO。在更嚴謹?shù)墓押塑账彡嚵须s交條件下,洗滌緩沖液可以包含100mMMES、0.1M[Na+和0.01%Tween20。參見《基因芯片表達分析技術指南》(GENECHIPEXPRESSIONANALYSISTECHNICALMANUAL)(701021rev.3,昂飛公司(Affymetrix,Inc.)2002),在此以其整體引入作為參考。^并差西《這浮為^f用來檢測靶核酸與寡核苷酸探針雜交鐠的方法在本領域廣為人知。特別是,檢測和記錄各獨立耙核酸-寡核苷酸探針雜合體熒光的手段已經(jīng)充分建立,并且在本領域廣為人知,描述于例如美國專利號5,631,734、美國公開號20060010513,在此以其整體引入作為參考。例如,可以通過計算才幾控制共聚焦顯微鏡來自動檢測整個陣列的雜交語。此外,作為另一非限制性例子,顯微鏡可以配備光傳感器,連接于數(shù)據(jù)獲取系統(tǒng),來自動記錄各獨立雜合體產(chǎn)生的熒光信號。本領域技術人員將會理解,雜交謙的評估依賴于陣列的組成,即納入了哪些寡核苷酸纟笨針進行分析。例如,當陣列只包括共有序列的寡核普酸探針、或只包括共有序列和轉(zhuǎn)基因序列的寡核苷酸探針時(即陣列不包括用于標準化實驗、樣品、嚴謹度需求和靶核酸制品間差異的對照探針),通過測量陣列上每個位置的絕對信號強度來評估雜交鐠??蛇x地,陣列的平均值、截尾平均值(即去除2-5%具有最低和最高信號強度的探針集合之后的所有探針的平均信號強度)或中值信號強度可以對預設的目標值按比例計算來生成比例因子,隨后可以應用到陣列上每個探針集合來生成每個基因的標準化表達值(見例如昂飛公司(Affymetrix)(2000)ExpressionAnalysisTechnicalManual,A5-14頁)。反之,在陣列還包含對照寡核苷酸探針的情況下,通過對對照寡核苷酸探針所占據(jù)的每個位置的絕對信號強度進行數(shù)學轉(zhuǎn)換,來標準化測試寡核苷酸探針所占據(jù)的每個位置的絕對信號強度,來評估所產(chǎn)生的雜交鐠。一般的標準化策略為本領域所熟知,并且包括在例如美國專利號6,040,138與Hill等(2001)GenomeBiol,2(12):research0055.1-0055.13中。從寡核苷酸陣列收集到的信號可以用商購軟件來分析,例如由昂飛公司(Affymetrix)或安捷倫科技有P艮公司(AgilentTechnologies)提供的那些。在雜交實驗中可以包括(例如用于掃描靈敏度、揮:針標記和cDNA或cRNA定量的)對照。陣列雜交信號在進行進一步分析前可以按比例計算或標準化。例如,考慮到在類似測試條件下使用一個以上陣列時雜交強度間有差異,可以對每個探針的雜交信號進行標準化。與互補探針雜交的獨立靶核酸的信號也可以利用來自每個陣列上包含的內(nèi)部標準化對照的強度來進行標準化。此外,可以使用在不同樣品間具有相對一致表達水平的基因來標準化其他基因的表達水平。為了鑒定賦予或與期望表型或特性關聯(lián)的基因,對來自測試細胞系樣品的基因表達錯和來自目的細胞培養(yǎng)表型與測試細胞系不同的的對照細胞系的對照"i普相比較,并鑒定差異表達的基因。例如,用于鑒定細胞生產(chǎn)力涉及的基因和相關通路的方法可以包括如下1)培養(yǎng)具有特定細胞生長力的第一細胞系的笫一樣品,以及培養(yǎng)具有不同細胞生長力的第二細胞系的第二樣品;2)分離、加工來自第一樣品的總RNA,并與第一寡核苷酸陣列雜交;3)分離、加工來自第二樣品的總RNA,并與第二寡核苷酸陣列雜交;和4)比較產(chǎn)生的雜交譜,以鑒定在第一和第二樣品間差異表達的序列??梢允褂妙愃品椒▉龛b定其他表型涉及的基因。一般來講,每個細胞系至少通過三份生物重復樣品來展示。本領域已知的程序,例如GeneExpress2000(GeneLogic,Gaithersburg,Md,)可用于分析革巴序列的有無,并確定其在一群樣品(例如細胞系或條件或時間點)中與另一群樣品相比較而言的相對表達水平。在所有重復樣品中存在的探針集合可考慮做進一步分析。一般地,如果p值小于或等于0.05,倍數(shù)變化值為1.2倍、1.5倍或更大可認為具有統(tǒng)計學顯著意義。鑒定與一個或多個特定細胞表型(如細胞生長速率、峰值細胞密度、持續(xù)高細胞活力、最大細胞生產(chǎn)力、持續(xù)高細胞生產(chǎn)力、氨生產(chǎn)或消耗、乳酸生產(chǎn)或消耗等)相關的差異表達基因可以導致發(fā)現(xiàn)調(diào)控或指示細胞表型的(包括那些以前未發(fā)現(xiàn)的)基因和通路。對隨后鑒定的基因進行測序,并針對不同的數(shù)據(jù)庫對所述序列進行blast,來確定它們是否為已知基因或未知基因。如果基因已知,可以基于本領域已有的知識進行通路分析。已知和未知基因均通過本領域已知的多種方法進一步確認或證實。例如,可以操縱(如上調(diào)或下調(diào))所鑒定的基因來誘導或抑制細胞的特定表型。闡明此過程的協(xié)調(diào)決策樹示于圖1。更詳細的鑒定和驗證步驟進一步描述于實施例,使用本發(fā)明方法鑒定的例示性差異表達基因示于表9-16。^7ff4^^4這謬》浙本發(fā)明還提供了通過蛋白質(zhì)表達譜分析鑒定差異表達蛋白質(zhì)的方法。蛋白質(zhì)表達鐠可以通過允許分辨和檢測來自細胞系樣品的蛋白質(zhì)的任何方法來生成。通常優(yōu)選具有較高分辨力的方法,因為增加分辨率可允許分析更多的獨立蛋白質(zhì),增加鐠圖的說服力和有效性??梢栽诘鞍踪|(zhì)分辨和檢測之前預處理樣品以去除樣品中的富余蛋白質(zhì),例如免疫清除,因為富余蛋白質(zhì)的存在可能掩蓋其他蛋白質(zhì)表達上更細微的變化,尤其是低豐度蛋白質(zhì)。樣品還可以進行一個或多個操作來降低樣品復雜度。例如,可以用層析法來對樣品進行分級;各級分將具有降低的復雜度,利于分析級分中的蛋白質(zhì)。用于同時分辨和檢測幾種蛋白質(zhì)的三種有用方法包括基于陣列的方法、基于質(zhì)譜的方法和基于二維凝膠電泳的方法。蛋白質(zhì)陣列通常包括大量數(shù)目的不同蛋白質(zhì)捕獲試劑,例如抗體或抗體可變區(qū),分別固定在固相支持物的不同位置。此類陣列可獲自例如西格瑪奧德里奇公司(Sigma-Aldrich),作為其PanoramaTM$列陣列的一部分。陣列與蛋白質(zhì)樣品接觸,而捕獲試劑選擇性地捕獲特異蛋白質(zhì)靼標。通過檢測標記來檢測捕獲的蛋白質(zhì)。例如,在接觸陣列前可以標記蛋白質(zhì);在陣列的特定位置上檢測到標記指示著檢測到相應的蛋白質(zhì)。如果陣列沒有飽和,檢測到的標記量可以與樣品中的蛋白質(zhì)濃度或量相關。還可以像在夾心免疫測定形式中那樣,通過隨后接觸第二捕獲試劑(其本身可經(jīng)標記或以其他方式檢測)來檢測捕獲的蛋白質(zhì)?;谫|(zhì)譜的方法包括,例如,基質(zhì)輔助激光解吸/電離(MALDI)、液相色鐠/質(zhì)鐠/質(zhì)譜(LC-MS/MS)和表面增強激光解吸/電離(SELDI)技術。例如,可以利用電噴射電離和MALDI生成蛋白質(zhì)鐠。例如,如美國專利號6,225,047所述,SELDI在質(zhì)謙芯片上引入滯留表面。蛋白質(zhì)樣品中的蛋白質(zhì)亞群滯留在表面上,P爭低了混合物的復雜度。后面的時間飛行質(zhì)譜生成滯留蛋白質(zhì)的"指紋"。在包括二維凝膠電泳的方法中,在SDS-PAGE期間,樣品中的蛋白質(zhì)一般通過等電點在第一維中分開,而在第二維中通過分子量分開。依靠兩維的分辨,成百成千的蛋白質(zhì)可以同時進行分辨和分析。通過應用染色如銀染或通過蛋白質(zhì)上的標記如Cy2、Cy3或Cy5染料來檢測蛋白質(zhì)。為鑒定蛋白,可以切掉凝膠上的斑點,并進行膠內(nèi)胰蛋白酶消化。胰蛋白酶消化產(chǎn)物可以通過質(zhì)譜如MALDI分析。針對序列數(shù)據(jù)庫搜索產(chǎn)生的肽質(zhì)譜、肽質(zhì)量指紋或PMF。將PMF與通過搜索程序在硅片(insilico)上生成的所有理論胰蛋白酶肽段的質(zhì)量相比較??梢允褂弥T如Prospector、Sequest和MasCot(MatrixScience,Ltd.,London,UK)等程序用于數(shù)據(jù)庫搜索。例如MasCot產(chǎn)生基于統(tǒng)計的Mowse分值,其指示任何配對是有顯著意義的還是無顯著意義的。質(zhì)鐠/質(zhì)譜可以用來增加得到數(shù)據(jù)庫配對的可能性??梢允褂秒牡腃ID-MS/MS(碰撞誘導解離的串聯(lián)質(zhì)譜)來給出包含關于氨基酸序列信息的碎片離子的頻譜。向肽質(zhì)量指紋中加入此信息允許Moscot增大配對的統(tǒng)計學顯著性。在某些情況下還有可能通過只提交未加工的單個肽的MS/MS鐠來鑒定蛋白質(zhì)。蛋白質(zhì)表達鐠比較方面的近期進展包括使用兩個或多個蛋白質(zhì)樣品的混合物,分別用不同的、光譜可分辨的、電荷與質(zhì)量匹配的染料如Cy3和cy5來標記。此進展稱為熒光二維差異凝膠電泳(DIGE),優(yōu)勢在于測試和對照蛋白質(zhì)樣品在同一凝膠上跑樣,利于匹配兩個樣品間的蛋白質(zhì),避免了在不同凝膠上涉及的不同電泳條件的復雜性。凝膠成像獨立進行,并且產(chǎn)生的圖像可以直接疊加,無需進一步修飾。可以使用第三個光譜可分辨的染料如Cy2來標記蛋白質(zhì)樣品庫,作為實驗中不同凝膠跑樣之間的內(nèi)部對照。因此,所有可檢測的蛋白質(zhì)可納入作為內(nèi)部標準,有利于不同凝膠之間的比較。工程/A勿^系以攻迷勿^4型如上所述,本發(fā)明提供了在具有至少一個不同細胞表型的不同細胞系或細胞樣品中差異表達的基因的多核苷酸序列(或亞序列)或蛋白質(zhì)的多肽序列(或亞序列)。這些序列統(tǒng)稱為差異序列。差異序列可用作為靶標來實現(xiàn)細胞表型,特別是表現(xiàn)為增加的和有效的重組轉(zhuǎn)基因生產(chǎn)、增加的細胞生長速率、高峰值細胞密度、持續(xù)高細胞活力、高最大細胞生產(chǎn)力、持續(xù)高細胞生產(chǎn)力、低氨產(chǎn)量和低乳酸產(chǎn)量等特點的細胞表型。更特別的是,本發(fā)明提供了相關表格中述及的每個純化和/或分離的多核苷酸或多肽序列,其表明是用于調(diào)控CHO細胞表型的合適靶標,即第一個CHO細胞系和第二個CHO細胞系相比差異表達之,在此命名為"差異CHO序列"。特別地,在此使用的差異CHO序列包括具有和/或基本上由從表格中述及的基因序列中選擇的序列組成的序列、其片段或互補物。在此使用的差異CHO序列還包括選自表中述及的蛋白質(zhì)序列的多肽序列或其片段。在此使用的差異CHO序列還包括編碼選自表中述及的蛋白質(zhì)序列的多肽序列的多核苷酸序列、其片段或互補物。技術人員應認識到本發(fā)明的差異CHO序列可以包括(如下面所討論的)新CHO序列、具有不參與或以前不參與轉(zhuǎn)基因表達功能的已知基因序列、以及以前無已知功能但可能現(xiàn)在知道作為調(diào)控CHO細胞表型的靶標起作用的已知序列。26本發(fā)明考慮可以用于改變(即調(diào)控(如增強、減弱或修4牟))與細胞或生物體內(nèi)差異CHO序列對應的基因或蛋白質(zhì)的表達和/或活性的方法和組合物。本發(fā)明包含的細胞或生物體內(nèi)差異CHO序列的表達改變可以通過下調(diào)或上調(diào)相應基因或蛋白質(zhì)來實現(xiàn)。例如,差異CHO序列可以通過使用不同的抑制性多核苷酸如反義多核苷酸、結合和/或切割轉(zhuǎn)錄自本發(fā)明基因的mRNA的核酶、靶向基因調(diào)控區(qū)域的三鏈形成寡核苷酸及導致粑mRNA序列特異性降解的短干擾RNA而下調(diào)(例如Galderisi等(1999)^Cell.Physiol.181:251-57;Sioud(2001)Curr.Mol.Med.1:575-88;Knauert和Glazer(2001)Hum.Mol.Genet.10:2243-51;Bass(2001)Nature411:428-29)。適合本發(fā)明的抑制性反義或核酶多核苷酸可以互補于本發(fā)明基因完整編碼鏈或只互補于其一部分。可選地,抑制性多核苷酸可以互補于本發(fā)明基因編碼鏈的非編碼區(qū)??梢允褂帽绢I域廣為人知的方法用化學合成和/或酶法連接反應來構建本發(fā)明的抑制性多核苷酸?;瘜W合成多核苷酸的核苷連接可經(jīng)〗務飾來增強其抗核酸酶介導的降解的能力,以及增強其序列特異性。此類連接修飾包括但不限于硫代磷酸酯、曱基膦酸酯、磷酰胺、硼代磷酸酯、嗎啉和肽核酸(PNA)連接(Galderisi等,同前;Heasman(2002)Dev.Biol.243:209-14;Mickelfield(2001)Curr.Med.Chem.8:1157-70)??蛇x地,反義分子可以利用以反義(即相反)方向亞克隆了本發(fā)明多核苷酸的表達載體進行生物學生產(chǎn)。而在另一實施方案中,適用于本發(fā)明的反義多核苷酸分子是a-異頭多核苷酸分子。a-異頭多核苷酸分子和互補RNA形成特異性雙鏈雜合體,其中與通常的p-單位相反,鏈走向彼此平行。依照本領域已知的技術,反義多核苷酸分子還包括2,-o-甲基核糖核苷酸或嵌合RNA-DNA類似物。適于本發(fā)明的抑制性三鏈形成寡核苷酸(TFO)以高特異性和親和性結合在雙鏈體DNA的大溝內(nèi)(Knauert和Glazer,同前)??梢酝ㄟ^靼向互補于基因調(diào)控區(qū)(即啟動子和/或增強子序列)的TFO形成防止基因轉(zhuǎn)錄的三鏈螺旋結構來抑制本發(fā)明的基因表達。在本發(fā)明一個實施方案中,抑制性多核苷酸是短干擾RNA(siRNA)分子。這些siRNA分子是導致靶mRNA序列特異性降解的短(優(yōu)選19-25個核苷酸;最優(yōu)選19或21核苷酸)雙鏈RNA分子。此降解稱為RNA干擾(RNAi)(例如Bass(2001)Nature411:428-29)。最初在低等生物中發(fā)現(xiàn)的RNAi已經(jīng)被有效應用于哺乳動物細胞,并且最近已經(jīng)顯示以耙向FasmRNA的siRNA分子處理能預防小鼠的重型肝炎(Song等(2003)Nat.Med.9:347-51)。此外,最近有報道鞘內(nèi)遞送siRNA能夠阻斷兩種大鼠模型(激動劑誘導的疼痛模型和神經(jīng)性疼痛模型)的疼痛反應(Dom等(2004)NucleicAcidsRes.32(5):e49)??梢酝ㄟ^一起退火兩個互補的單鏈RNA分子(其中之一與粑mRNA的一部分互補)(Fire等,美國專利號6,506,559)、或通過使用單個發(fā)夾RNA分子自身折回生成必需的雙鏈部分(Yu等,(2002)Proc.Natl.Acad.Sci.USA99:6047-52),來生成適用于本發(fā)明的siRNA分子。siRNA分子可以經(jīng)化學合成(Elbashir等,(2001)Nature411:494-98),或通過使用單鏈DNA模^反體外轉(zhuǎn)錄來生產(chǎn)(Yu等,同前)??蛇x地,siRNA分子可以或瞬時(Yu等,同前;Sui等(2002)Proc.Natl.Acad.Sci.USA99:5515-20)或穩(wěn)定地(Paddison等(2002)Proc.Natl.Acad.Sci.USA99:1443-48)使用包含有義和反義siRNA序列的表達載體來生物法生產(chǎn)。最近,已顯示使用表達發(fā)夾RNA(其進一步被加工成siRNA)的腺病毒載體以有效和序列特異性方式降低原代人類細胞中靶mRNA的水平(Arts等(2003)GenomeRes.13:2325-32)。可以基于本領域熟知的標準設計靶向本發(fā)明差異CHO序列的siRNA分子(例如Elbashir等(2001)EMBOJ.20:6877-88)。例如,靼mRNA的靶區(qū)段應起始于AA(優(yōu)選)、TA、GA或CA;siRNA分子的GC比應為45-55%;siRNA分子不應包含連續(xù)的三個同樣的核苷酸;siRNA分子不應包含七個連續(xù)的混合G/C;而且靶區(qū)段應位于靶mRNA的ORF區(qū)域,并且應在起始ATG之后的至少75bp、在終止密碼子之前至少75bp處。本領域普通技術人員使用上述標準或其他已知標準能夠設計靶向本發(fā)明多核苷酸的siRNA分子。還可以通過插入外源多核苷酸序列破壞對應于本發(fā)明差異CHO序列的內(nèi)源基因,來創(chuàng)建細胞或生物(即敲除細胞或生物),以實現(xiàn)細胞或生物體內(nèi)本發(fā)明基因或蛋白質(zhì)的下調(diào)??善茐膬?nèi)源基因的編碼區(qū),從而產(chǎn)生了非功能性蛋白質(zhì)。可選地,可破壞內(nèi)源基因的上游調(diào)控區(qū)或替換為不同的調(diào)控元件,導致仍為功能性蛋白質(zhì)的表達改變。用來生成敲除細胞的方法包括同源重組,并在本領域廣為人知(例如Wolfer等(2002)TrendsNeurosci.25:336-40)。還可以通過上調(diào)相應于本發(fā)明CHO差異序列的基因或蛋白質(zhì)來改變CHO差異序列的表達或活性。上調(diào)包括提供編碼目的蛋白質(zhì)或基因或保留其活性的變體的外源核酸(如過表達構建體),或提供間接增強蛋白質(zhì)活性的因子或分子。變體通常和目的蛋白質(zhì)或基因享有共同的結構特點,并應保留允許改進細胞表型的活性。變體可以對應于來自其他物種的同源物(如嚙齒動物同源物;靈長動物同源物如人同源物;另一哺乳動物同源物;或保留足以傳達期望細胞表型效應的序列保守性的較為遠源的同源物)。在某些情況下,變體可以保留與CHO序列或與已知同源物至少70%、至少80%、至少卯%、或至少95%的序列同一性。在某些實施方案中,變體是在嚴謹條件下與CHO核酸序列雜交或與已知同源物核酸序列雜交的核酸分子。例如,相應于本發(fā)明差異CHO序列的分離的多核苷酸可以有效連接于一表達控制序列如pMT2和pED表達載體,用于重組生產(chǎn)本發(fā)明差異表達的基因或蛋白質(zhì)。表達重組蛋白質(zhì)的一般方法在本領域廣為人知。本發(fā)明差異表達基因或蛋白質(zhì)的表達或活性還可以通過可以直接或間接調(diào)節(jié)本發(fā)明基因或蛋白質(zhì)活性的外源物質(zhì)、小分子、藥物化合物或其他因子來改變。因此,可以利用這些物質(zhì)、小分子、藥物化合物或其他因子來調(diào)控CHO細胞的表型,例如重組轉(zhuǎn)基因增加的表達、增強的細胞生長速率、高峰值細胞密度、持續(xù)高細胞活力、高最大細胞生產(chǎn)力、持續(xù)高細胞生產(chǎn)力、低氨產(chǎn)量和低乳酸產(chǎn)量等。29上述改變基因或蛋白質(zhì)表達的方法的任意組合均落在本發(fā)明范圍之內(nèi)。影響不同細胞表型的基因或蛋白質(zhì)的任意組合可以基于在此描述的方法進行調(diào)整,并且落在本發(fā)明的范圍之內(nèi)。,奇差萄成f如上所述,本發(fā)明提供了差異序列,包括新發(fā)現(xiàn)的由CHO細胞表達的序列。相應地,本發(fā)明提供了新的、分離的和/或純化的至少是以前未發(fā)現(xiàn)基因的一部分的多核苷酸。新發(fā)現(xiàn)的由CHO細胞表達的基因的例示性新多核苷酸序列(或亞序列)示于表9、13和15。本發(fā)明還提供了分離的和/或純化的至少是以前未發(fā)現(xiàn)蛋白質(zhì)的一部分的多肽。新發(fā)現(xiàn)的由CHO細胞表達的蛋白質(zhì)的例示性新多肽序列(或亞序列)示于表2和4。本發(fā)明還提供了編碼如表2和4中所示多肽序列的新多核苷酸。這樣,本發(fā)明提供了選自表9、13和15的各純化的和/或分離的多核苷酸序列,為從前未發(fā)現(xiàn)的基因(即未被測序和/或未顯示由CHO細胞表達的基因)或為其一部分,經(jīng)證實由CHO細胞表達??蛇x地,本發(fā)明提供了選自表2和4的各純化的和/或分離的多肽序列,為從前未發(fā)現(xiàn)蛋白質(zhì)(即未被測序和/或未顯示由CHO細胞表達的蛋白質(zhì))或為其一部分,經(jīng)證實由CHO細胞表達。本發(fā)明還提供了分離的和/或純化的編碼來自表2和4的各多肽序列的多核苷酸序列。這些序列在此統(tǒng)稱為"新CHO序列"。本發(fā)明優(yōu)選的多核苷酸序列包括DNA序列,包括基因組和cDNA序列和化學合成DNA序列,RNA序列,或其他修飾的核酸序列。本發(fā)明優(yōu)選的多肽序列包括氨基酸序列或修飾的氨基酸序列。本發(fā)明的一部分提供了上述各新CHO序列的抑制性多核苷酸。本發(fā)明的多核苷酸還包括這樣的多核苷酸,其在嚴謹條件下與新CHO序列或其互補物雜交,和/或編碼基本上保留由本發(fā)明新CHO序列所編碼多肽的生物活性的多肽。本發(fā)明的多核苷酸還包括包含至少21個連續(xù)核苷酸的新CHO序列的連續(xù)部分。本發(fā)明的多核苷酸還包括編碼由上述多核苷酸編碼的任何氨基酸序列的多核苷酸,或其連續(xù)部分,并且其與上述多核苷酸的不同只在于眾所周知的遺傳密碼簡并性。本發(fā)明的分離多核苷酸可用作雜交探針(例如,作為如上所述的寡核苷酸陣列)和引物來鑒定和分離其序列與編碼所公開多核苷酸的序列相同或相似的核酸。用于鑒定和分離核酸的雜交方法包括聚合酶鏈式反應(PCR)、Southern雜交和Northern雜交,為本領域技術人員所熟知。雜交反應可以在不同嚴謹度條件下進行。雜交反應的嚴謹度包括任何兩個核酸分子彼此雜交的難度。優(yōu)選各雜交多核苷酸與其相應多核苷酸在降低的嚴謹度條件下雜交,更優(yōu)選嚴謹?shù)臈l件,而最優(yōu)選高嚴謹度條件。在下表l中顯示了嚴謹度條件的實例例如,高嚴謹度條件是那些至少和條件A-F—樣嚴謹?shù)?;例如,嚴謹條件是至少和條件G-L—樣嚴謹?shù)?;而降低嚴謹度條件是例如至少和條件M-R—樣嚴謹?shù)?。?.嚴謹度條件<table>tableseeoriginaldocumentpage32</column></row><table>、雜合體長度是雜交多核苷酸的雜交區(qū)域的預期長度。當多核苷酸與未知序列的乾多核苷酸雜交時,假定雜合體長度是雜交的多核香酸的長度。當已知序列的多核苷酸雜交時,雜合體長度可以通過比對多核苷酸序列并鑒定區(qū)域或最佳序列互補性區(qū)域來確定。H:在雜交和洗滌緩沖液中,SSPE(lxSSPE是0.15MNaCl、10mMNaH2P04和1.25mMEDTA,pH7.4)可以替代SSC(1xSSC是0.15MNaCI和15mM檸檬酸鈉)。TB*-TR*:預期長度小于50個堿基對的雜合體的雜交溫度應比雜合體的溶解溫度(TJ低S-1(TC,其中Tm依照下列方程式確定。對于長度小于18個堿基對的雜合體,Tm('C)=2(A+T堿基數(shù))+4(G+C堿基數(shù)).對于長度為18到49個堿基對的雜合體,Tm('C)=81.5+16.6(log1()Na+])+0.41(%G+C)-(600/N),其中N是雜合體中的堿基數(shù)目,而[Na+]是雜交緩沖液中鈉離子的摩爾濃度(lxSSC的[Na+=0.165M)。通常和如上文所聲明的那樣,本發(fā)明分離的多核苷酸還可以用作雜交探針和引物來鑒定和分離與所公開的多核苷酸同源的DNA。這些同源物是分離自與那些所公開的多核苷酸不同物種的多核苷酸,或是在同一物種分離的,但和所公開的多核苷酸有明顯的序列相似性。優(yōu)選多核普酸同源物和所公開的多核苷酸有至少60%序列同一性(更優(yōu)選至少75%同一性;最優(yōu)選至少90%同一性)。優(yōu)選地,公開的多核苷酸同源物分離自哺乳動物物種。本發(fā)明的分離多核苷酸還可以用作雜交探針和?j物來鑒定表達本發(fā)明多核苷酸的細胞和組織及它們表達的條件。本發(fā)明還考慮重組表達由新CHO序列編碼的蛋白質(zhì)或多肽。許多細胞類型可以擔任合適的宿主細胞,用于重組表達由本發(fā)明新CHO序列編碼的多肽。哺乳動物宿主細胞包括^f旦不限于,例如COS細胞、CHO細胞、293細胞、A431細胞、3T3細胞、CV-1細胞、HeLa細胞、L細胞、BHK21細胞、HL-60細胞、U937細胞、HEK細胞、PerC6細胞、Jurkat細胞、正常二倍體細胞、來自原代組織體外培養(yǎng)和原代移植物的細胞系??蛇x地,可以在低等真核生物例如酵母或在原核生物中重組生產(chǎn)由本發(fā)明的新CHO序列編碼的多肽。潛在的合適的酵母菌林包括釀酒酵母(5Wc/e"w附j^esccev/5iW)、粟酒裂殖酵母(jSc/t"Atfw附y(tǒng)ces"附6e)、克魯維酵母屬(isr/foww/^c^)菌林及假絲酵母屬(am^^)菌林。潛在的合適的細菌菌林包括大腸桿菌、枯草芽孢桿菌和鼠傷寒沙門氏菌(4^/附0^/&0;/^Z附wWm附)。如果多肽在酵母或細菌中制備,為了得到功能性,可能有必要通過例如合適位點的磷酸化或糖基化來修飾它們。此類共價連接可用眾所周知的化學或酶法來實現(xiàn)。還可以通過將分離的本發(fā)明的新CHO序列有效連接于一個或多個昆蟲表達載體(如桿狀病毒載體)中的適當控制序列,并使用昆蟲細胞表達系統(tǒng)來重組生產(chǎn)由本發(fā)明多核苷酸編碼的多肽。用于桿狀病毒/Sf9表達系統(tǒng)的材料和方法可以試劑盒形式商購(例如MaxBac⑧試劑盒,加州卡爾斯班英^Z/^司(Invitrogen,Carlsbad,Calif.))。在合適宿主細胞中重組表達之后,接著可以用公知的純化方法如凝膠過濾和離子交換層析,從培養(yǎng)基或細胞提取物中純化由本發(fā)明多核苷酸編碼的多肽。純化還可以包括用已知結合本發(fā)明多核苷酸所編碼的多肽的試劑進行親和層析。這些純化方法還可用于純化來自天然來源的多肽??蛇x地,由本發(fā)明的新CHO序列編碼的多肽也可以重組表達為利于純化的形式。例如,多肽可以表達為與蛋白質(zhì)如麥芽糖結合蛋白(MBP)、谷胱甘肽-S-轉(zhuǎn)移酶(GST)或硫氧還蛋白(TRX)融合的形式。用于表達和純化此類融合蛋白的試劑盒可分別從麻州比佛利紐英倫生物技術有限公司(NewEnglandBioLabs,Beverly,Mass.)、新澤西州皮斯卡塔韋市發(fā)瑪西亞^^司(Pharmacia,Piscataway,N.J.)和力口州卡爾-Jf班英-脧/〉司(Invitrogen,Carlsbad,Calif.)商購。由本發(fā)明多核苷酸編碼的多肽還可以用小表位標記,而后用針對表位的特異性抗體鑒定或純化。優(yōu)選的表位是FLAG表位,從康涅狄格州紐黑文伊斯曼柯達公司(EastmanKodak,NewHaven,Conn.)商購。由本發(fā)明的新CHO序列編碼的多肽還可以用已知傳統(tǒng)化學合成來生產(chǎn)。用于化學合成由本發(fā)明的新CHO序列編碼的多肽的方法對于本領域技術人員是眾所周知的。此類化學合成多肽可以擁有與天然的、純化的多肽共同的生物學性質(zhì),因此可以用作天然多肽的生物活性或免疫替代物。應理解上述實施方案和下面的實施例以舉例說明方式給出,不是限制。根據(jù)本說明書,在本發(fā)明范圍內(nèi)的不同改變和變動對于本領域技術人員是顯而易見的。實施例實施例1.細胞培養(yǎng)在兩種基本條件下以兩種基本方式在無血清懸浮培養(yǎng)物中培養(yǎng)細胞。一種方式是小量、搖瓶培養(yǎng),其中細胞在通氣組織培養(yǎng)瓶中,以小于100ml的體積,在C02孵箱中的有軌搖床上旋轉(zhuǎn)培養(yǎng)。第二種方式是在臺式生物反應器中,以2L或更少的工作體積,控制pH、營養(yǎng)、溶氧和溫度。兩種基本培養(yǎng)條件是37。C的普通傳代條件,或補料分批培養(yǎng)條件。在基本補料分批培養(yǎng)中,細胞培養(yǎng)更長一段時期,并且轉(zhuǎn)換到低一些的溫度以延長細胞活力和擴展培養(yǎng)物的生產(chǎn)期。實施例2.CHO細胞培養(yǎng)物分類基于如下有益于高產(chǎn)分批補料細胞培養(yǎng)過程的每一種表型的來分類CHO細胞系高細胞生長速率、高峰值細胞密度、持續(xù)高細胞活力、高最大細胞生產(chǎn)力、持續(xù)高細胞生產(chǎn)力、低氨產(chǎn)量和低乳酸產(chǎn)量。生成細胞樣品矩陣,其中各表型類別由取自搖瓶和臺式細胞反應器培養(yǎng)物的合適34CHO細胞樣品增殖,并且包括375個獨立樣品(包括生物學上一式三份或一式四份的重復)和29個表達單克隆抗體、細胞因子、凝血因子及Fc:受體融合分子的不同rCHO細胞系。圖2描述了細胞樣品矩陣的例示性部分,其中縮寫詞Qp表示細胞生產(chǎn)力。圖3描述了測試細胞系和對照細胞系之間有關"高細胞生長速率"表型的例示性表型比較。實施例3.差異表達蛋白質(zhì)檢測才法收集細胞并在7M尿素、2M硫脲、4%CHAPS、30mMTris、5mM醋酸4美pH8.5中進行標準裂解。使用pH4-7的18cm固定的pH梯度等點聚焦梯度膠條、以二維凝膠電泳分析150ng小份裂解物,來確定樣品質(zhì)量。膠條以每塊膠條340nl緩沖液再水化過夜。于膠條的陰極端上樣,進行1小時500V、1小時1000V和4小時8000V電泳,儲存于-80"C,直至在12.5%丙烯酰胺凝膠上進行第二維電泳。以每塊凝膠1.5W進行第二維電泳30分鐘,然后用Dalt6對6塊大型膠進行總共100W5小時電泳。銀染觀察蛋白質(zhì)來證實裂解物中的蛋白質(zhì)的質(zhì)量。接著用熒光染料標記小部分最初裂解物,以備熒光二維差異凝膠電泳(DIGE),圖4顯示了其概覽。細胞培養(yǎng)物的每次比較用一式兩份凝膠進行四次,每個實驗共8塊DIGE凝膠,每塊凝膠使用50jig各Cy2-、Cy3-和Cy5-標記的細胞裂解物。匯集實驗中使用的所有細胞裂解物,并用Cy2標記用做內(nèi)部標準。對照細胞裂解物以Cy3標記,而測試細胞裂解物以Cy5標記。在冰上于黑暗中進行標記30分鐘,接著在水上于黑暗中使用10mM賴氨酸淬火反應10分鐘。然后匯集Cy2-、Cy3-和Cy5-標記的裂解物并在水上于黑暗中與2x樣品緩沖液混合15分鐘。將樣品施加到固定的pH梯度等點聚焦膠條。膠條過夜再水化大約20小時。于條帶的陰極端上樣,并進行300V/3hr/G、600V/3hr/S&H、1000V/3hr/G、8000V/3hr/G、8000V/4hr/S&H和500V/12hr/S&H電泳。35在SDS-PAGE前1小時,對膠條進行8000V電泳1小時。膠條在SDS緩沖液+1%DTT中平衡15分鐘,在SDS緩沖液+2.5。/。碘乙酰胺中平衡15分鐘。將膠條施加到聚丙烯酰胺凝膠上,并用瓊脂糖覆蓋。在Dalt12上用U塊大型膠在l(TC以1.5W/膠大約18小時進行穿過凝膠的電泳。以可變模式成像儀在Typhoon9400掃描儀上掃描凝膠;切割并輸入到DeCyderTM軟件。使用生物方差分析(BVA)鑒定差異調(diào)控的蛋白質(zhì)。這些蛋白質(zhì)與上樣了400jtg蛋白質(zhì)并以釕染色的預制膠相匹配。從預制膠上,用EttanSpotPicker挑選出通過DIGE鑒定為差異調(diào)控的蛋白質(zhì)。使用EttanDigestor以過夜胰蛋白酶孵育來消化個體蛋白質(zhì)。用質(zhì)謙分析得到的肽。使用MALDI來分析肽質(zhì)量指紋,尤其是膠上的高豐度樣品。對于豐度低些的樣品,使用MDLCLTQ機器進行LC-MS/MS。來自二維凝膠斑點的胰蛋白酶消化樣品重懸于含0.1。/。TFA的20pLLC-MS級水中,并通過一維LC-MS使用以高通量配置與FinniganLTQTM(熱電公司,ThermoElectron)直接連接的EttanMDLC系統(tǒng)(通用電氣醫(yī)療集團,GEHealthcare)來分析。濃縮樣品,在RPC捕獲柱(ZorbaxTM300SBC18,0.3mmx5mm,安捷倫科技有限公司(AgilentTechnologies))上脫鹽,并在RPC納米柱(Zorbax300SBC18,0.075mmxlOOmm,安捷倫科技有限公司(AgilentTechnologies))使用0-65%乙腈(Riedel-deHaSn公司LC-MS級)的線性乙腈梯度進行為時60分鐘的肽分離,直接經(jīng)由10納升電噴霧(nanoESI)發(fā)射器(PresearchFS360-20-10-CE-20)進入LTQ。LTQ離子阱質(zhì)鐠儀用于MS/MS。使用300-2000的m/z范圍約0.15s的掃描時間(一幀樣吏掃描的最大離子注射時間10ms),繼以MS/MS分析從每幀掃描得到的3個最大豐度峰,接著在下面60秒將其排除,然后繼以MS/MS分析下面的三個豐度峰,依次在60秒將其排除,依此類推。離子分裂采用35%的"碰撞能量,,設置,并使用動態(tài)排除來區(qū)別開以前分析的離子(數(shù)據(jù)依賴性分析)。用于納升液相色鐠(nanoLC)分離的所有緩沖液包含0.1。/。蟻酸(Fluka公司)作為離子對試劑。以鐠圖方式記錄全程掃描質(zhì)譜,并以質(zhì)心模式記錄串聯(lián)質(zhì)譜。通過使用SEQUESTTM搜索SWISSPROT數(shù)據(jù)庫、用串聯(lián)質(zhì)譜中的信息來鑒定肽。作為統(tǒng)計截斷值所使用的Xcorr值對帶單電荷的肽是>1.5,對帶雙電荷的肽是>2.0,而對帶三電荷的肽是>2.5。處義敘應i,力辨^尹記將過表達PACE(弗林前原蛋白)、具有高最大細胞生產(chǎn)力的細胞系的四份培養(yǎng)物的蛋白質(zhì)表達鐠與對照細胞系的四份培養(yǎng)物的蛋白質(zhì)表達鐠相比較。所有8個凝膠實驗(包括總共24張圖像)中大約有2000個蛋白質(zhì)匹配。為在DeCyder分析中視為差異表達的蛋白質(zhì),蛋白質(zhì)必須已經(jīng)在所有24張圖像中被鑒定;已被證明至少1.5倍上調(diào)或下調(diào);并且已被證明T檢驗分值小于0.05。188種蛋白質(zhì)被鑒定為差異調(diào)控,多數(shù)具有高度顯著意義的T檢-驗分值,包括幾種低豐度蛋白質(zhì)。圖5顯示了例示性凝膠上的Cy3和Cy5染色模式。圖中顯示了在Cy5標記的測試細胞提取物中顯示5倍上調(diào)的蛋白質(zhì),還給出了Cy5標記的測試細胞提取物中蛋白質(zhì)相對豐度的圖示。圖6顯示了在Cy5標記的測試細胞提取物中顯示4倍下調(diào)的蛋白質(zhì),并且給出了類似于前圖5中的那些圖示。表2和3中列出了鑒定為在高最大細胞生產(chǎn)力細胞系中差異表達的幾個斑點。對表中列出的每個斑點,MALDI序列分析鑒定了一個或兩個相應的氨基酸序列。對于每個斑點號,表中提供了測試和對照樣品間蛋白質(zhì)水平的倍數(shù)差異,標記為"平均比率";在測試樣品中水平降低的蛋白質(zhì)以負號顯示。表中還提供了表達差異可能是隨機發(fā)生結果的p值和相應于任何所鑒定氨基酸序列的蛋白質(zhì)名稱及登錄號。在MALDI序列分析中,胰蛋白酶片段的分子量和已知序列的胰蛋白酶片段的預測分子量相比較。在某些情況下,在本申請中包括的此序列分析和其他肽序列分析中,檢測的分子量指示檢測到肽修飾形式,例如其中半胱氨酸以碘乙酰胺修飾,或其中甲硫氨酸被部分氧化。應理解這不必然反映就細胞或細胞環(huán)境中蛋白質(zhì)而言的肽的原始狀態(tài)。因此,在序列表中提供的肽序列反映了肽的未修飾形式,并且在某些實施方案中,欲工程化改造以具有期望細胞表型的細胞將被工程化改造來調(diào)控表達包含一個或多個所述肽的氨基酸序列的基因。在表中,"%覆蓋率"意指實驗中檢測的相應胰蛋白酶片段占數(shù)據(jù)庫序列總長的百分數(shù)。pl和MR表示蛋白質(zhì)斑點的表觀等電點和表觀分子量。對于一些蛋白質(zhì),表中還提供了推定的蛋白質(zhì)功能。表2:鑒定為非倉鼠蛋白質(zhì)的新同源物的高MaxQpProt蛋白質(zhì)<table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table><table>tableseeoriginaldocumentpage41</column></row><table><table>tableseeoriginaldocumentpage42</column></row><table>圖7-59提供了鑒定的蛋白質(zhì)的序列數(shù)據(jù)。對于來自DIGE的特定蛋白質(zhì)斑點,每張圖提供了在胰蛋白酶消化產(chǎn)物中檢測到的分子量語;相應的蛋白質(zhì)數(shù)據(jù)庫匹配或匹配群,包括與預測胰蛋白酶肽萃殳相匹配的蛋白質(zhì)數(shù)據(jù)庫錄入肽的個數(shù)、登錄號、名稱和來自數(shù)據(jù)庫錄入的蛋白質(zhì)的物種、覆蓋率百分數(shù)、等電點和質(zhì)量;對于與預測肽的預測質(zhì)量相匹配的每個分子量而言,提供了測量的質(zhì)量、預期的(比較的)質(zhì)量、兩者間的差異和相應的肽序列;以及來自數(shù)據(jù)庫錄入的蛋白質(zhì)的全長序列。^敘應衛(wèi)長遽,W標記具有高細胞生長速率的PADUKX378的蛋白質(zhì)表達譜與PADUKX153.8的蛋白質(zhì)表達鐠相比較。表4和5列出了在高最大細胞生產(chǎn)力細胞系中鑒定為差異表達的幾個斑點。對于表中列出的每個斑點,MALDI序列分析鑒定了和相應來自中國倉鼠或來自其他物種的氨基酸序列的匹配。對于每個斑點號,表中提供了測試和對照樣品間蛋白質(zhì)水平的倍數(shù)差異(標作"平均比率,,);在測試樣品中水平降低的那些蛋白質(zhì)以負號表示。表中還提供了p值(統(tǒng)計學顯著意義)、及蛋白質(zhì)名稱、登錄號、和對應于任何鑒定的氨基酸序列的物種。43表4:鑒定為非倉鼠蛋白質(zhì)新同源物的高細胞生長率蛋白質(zhì)<table>tableseeoriginaldocumentpage44</column></row><table><table>tableseeoriginaldocumentpage45</column></row><table><table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table><table>tableseeoriginaldocumentpage48</column></row><table><table>tableseeoriginaldocumentpage49</column></row><table><table>tableseeoriginaldocumentpage50</column></row><table><table>tableseeoriginaldocumentpage51</column></row><table>圖60-112提供了鑒定的蛋白質(zhì)的序列數(shù)據(jù)。對于得自DIGE的特定蛋白質(zhì)斑點,每張圖提供了在胰蛋白酶消化產(chǎn)物中檢測到的分子量譜;相應的蛋白質(zhì)數(shù)據(jù)庫匹配或匹配群,包括與預測胰蛋白酶肽段相匹配的蛋白質(zhì)數(shù)據(jù)庫錄入肽的個數(shù)、登錄號、名稱和來自數(shù)據(jù)庫錄入的蛋白質(zhì)的物種、覆蓋率百分數(shù)、等電點和質(zhì)量;對于與預測肽的預測質(zhì)量相匹配的每個分子量而言,提供了測量的質(zhì)量、預期的(比較的)質(zhì)量、兩者間的差異和相應的肽序列;以及來自數(shù)據(jù)庫錄入的蛋白質(zhì)的全長序列。實施例4.在具有持續(xù)高細胞活力或高峰值細胞密度的細胞中差異表達的蛋白質(zhì)表7列出了利用如實施例3所述的方法鑒定為在具有持續(xù)高細胞活力的細胞中差異表達的幾個斑點。圖113到127提供了鑒定的蛋白質(zhì)的序列數(shù)據(jù)。表8列出了用類似方法在具有高峰值細胞密度的細胞中鑒定為差異表達的幾個斑點;圖128到138顯示了相應的序列數(shù)據(jù)。對于每個斑點號,表中提供了測試和對照樣品間蛋白水平的倍數(shù)差異(標作"平均比率");在測試樣品中水平降低的蛋白質(zhì)以負號注明。表中還提供了表達差異可能是隨機發(fā)生結果的p值和對應于任何所鑒定氨基酸序列的蛋白質(zhì)名稱及登錄號。通過質(zhì)譜分析了得到的肽。使用MALDI(特別是對凝膠上高豐度樣品)來分析肽質(zhì)量指紋。對較低豐度樣品,使用利用MDLCLTQ儀器的LC-MS/MS。在MALDI序列分析中,胰蛋白酶片段的分子量和已知序列的胰蛋白酶片段的預測分子量相比較。在表中,"%覆蓋率"意指其在實驗中被檢測到的相應胰蛋白酶片段占數(shù)據(jù)庫序列全長的百分數(shù)。pl和Mr表示蛋白質(zhì)斑點的表觀等電點和表觀分子量。表7.在具有持續(xù)細胞活力的細胞中的差異表達蛋白質(zhì)<table>tableseeoriginaldocumentpage53</column></row><table><table>tableseeoriginaldocumentpage54</column></row><table>表8.HCD3蛋白列表所有測試樣品相對于所有對照樣品(3、5、7天),(過濾-1.2倍上/下調(diào),t-檢驗〈0.01,雙向AnovaO.Ol,Decyder統(tǒng)計學分析)<table>tableseeoriginaldocumentpage55</column></row><table><table>tableseeoriginaldocumentpage56</column></row><table>實施例5.mRNA表達鐠分析獲得來自測試和對照CHO細胞系的RNA樣品,并在含有如美國專利申請公開US2006/0010513中所述的CHOmRNA序列(其完整內(nèi)容在此引入作為參考)的探針的微芯片進行上分析。使用標記的已知濃度的對照序列的片段化cRNA,雜交混合物用片段化cRNA標準分析來生成標準曲線,使得數(shù)據(jù)標準化并能評價芯片的靈敏度和飽和度。使用p-肌動蛋白和GAPDH的3V5,比、信號強度和一致性及呈現(xiàn)的百分數(shù)對掃描的數(shù)據(jù)進行質(zhì)量控制。通常,用軟件工具Affy5.0和Genesis2.0、或dChiP(見Li等(2001)Proc.Natl.Acad.Sci.USA98:31-36和Li等(2001)GenomeBiol.2:0032.1-0032.11)和Genespring來進行數(shù)據(jù)標準化。在進一步考察基因之前,需要P值小于或等于0.05并且測試和對照系間的最小倍數(shù)變化為1.2。圖139和140描述了無監(jiān)督的Pearson聚類分析。在圖141中描述了數(shù)據(jù)分析的例示性方法。比較了對于高細胞生長速率而言的成對測試和對照細胞系,并且鑒定了符合1.2倍變化需求的mRNA表達^t式。其中65個基因鑒定為在四個不同成對測試和對照細胞系的每對中均為差異表達。65個中的29個是在測試細胞系中或持續(xù)上調(diào)或持續(xù)下調(diào);優(yōu)先對這些進行進一步分析。圖142描述了不依賴于成對差異的數(shù)據(jù)分析的例示性方法。鑒定了590個基因,其在高細胞生長率的測試CHO細胞系群中平均表達水平比對照CHO細胞系群的平均表達高至少1.2倍。當需要表達有1.5倍差異、并且附加地使用更嚴謹?shù)慕y(tǒng)計學分析時,78個基因通過了標準;更優(yōu)先對這些進行進一步分析。實施例6.在具有高最大細胞生產(chǎn)力的細胞中差異表達的基因表9和10中提供了鑒定為具有高最大細胞生產(chǎn)力的細胞中差異表達的核酸概要。對于每個核酸,提供了合格者名錄、符號和名錄,還有在具有高最大細胞生產(chǎn)力的細胞中核酸是上調(diào)還是下調(diào)。對于在Unigene數(shù)據(jù)庫中具有人或小鼠同源物的核酸,表中提供了UnigeneID號和比較相關的統(tǒng)計,包括e值、CHO序列和Unigene數(shù)據(jù)庫錄入間的序列同一性百分數(shù)、及覆蓋率百分數(shù)("%QC,,)。內(nèi)質(zhì)網(wǎng)(ER)或高爾基復合體相關蛋白質(zhì)的編碼核酸可能對細胞生產(chǎn)力特別是分泌蛋白質(zhì)的生產(chǎn)有作用。表11總結了在過表達PACE細胞中差異表達至少為1.2倍并編碼ER相關蛋白質(zhì)的核酸。表12總結了在過表達PACE細胞中差異表達為1.2倍并編碼高爾基體相關蛋白質(zhì)的核酸。<table>tableseeoriginaldocumentpage59</column></row><table><formula>formulaseeoriginaldocumentpage60</formula>人Unigene小鼠Unigene倍數(shù)變變化方向合格者名錄符號名稱IDe值%ID0/oQCIDe值%ID%QC化WAN008D眼at環(huán)氣化物水解酶1,微粒體的(Ephxl)(SEQIDNO:1^03)EPHX1Hs.896499E-8587.98760.392Mm.90751E-II391.22362.5491.319上調(diào)WA翻8盯7at細胞色素P450,家族51,亞家族多(SEQIDNO:T504)肽I(CYP51AI)Hs.41707786.87998.051Mm.460441E-15288.51598.4411.297上調(diào)WAN008ELHat(SEQIDNO:1505)RPN1核糖體結合蛋白IHs.518244090—51999.643Mm.188544092.335100.0001.295上調(diào)WAN0088K7xat熱休克70kDa蛋白5(葡萄糖調(diào)節(jié)蛋(SEQIDNO:r5一HSPA5白,78kDa)00.000O扁Min.3301600.000009跳OOO6.9233—401上調(diào)LOO176at(SEQIlJNO:1500)HMGCR3-羥基-3-甲基戊二酰輔酶A還原酶Hs.118997E-5487.98157.939Mm.3166523E-8294.47255.4322.551上調(diào)L00H8at(SEQn5"NO:1507)腹GCR3_羥基_3_甲基戊二酰輔酶A還原酶Hs.U8993E-4790.06242.819Mm.3166521E-5793.03842.0212.033上調(diào)LOO169at(SEQnJNO:i508)HMGCR3-羥基-3-曱基戊二酰輔酶A還原酶Hs.I18992E-1989.53533.992Mm.3166527E-2794.87230.8302.020上調(diào)LOO180at(SEQn5"NO:1509)HMGCR3_羥基_3_甲基戊二酰輔酶A還原酶Hs.U柳5E-3586.31068.016Mm.3166521E-49卯.24466.397l細上調(diào)L00181at(SEQh5"nO:1510)畫GCR3—羥基_3_曱基戊二酰輔酶A還原酶Hs.118991e-3789.78132.697Mm.3166523e-5293.61733.6521.976上調(diào)L00171at(SEQn5"NO:1511)HMGCR3_幾基_3_甲基戊二酰輔酶A還原酶Hs.U8995E-3691.52533,Mm.3166525E-4193.22033細1-934上調(diào)L00170xat(SEQ115"l70:1512)HMGCR3-羥基-3-甲基戊二酰輔酶A還原酶Hs.脂97E-27訓9170.968Mm.3166526E-5494.81587—0971.718上調(diào)LOO173at(SEQIJ5"N0:1513)HMGCR3-羥基—3—甲基戊二酰輔酶A還原酶Hs.ll柳2E-3385.88230.466Mm.3166528E-7889.91944.444L621上調(diào)LOO182at(SEQn3"NO:m4)畫GCR3一雍基-3-甲基戊二酰輔酶A還原酶Hs.118993E-6594.01248.688Mm.3166522E-6594.47947.5221.546上調(diào)AF380341at(SEQIDN"5:1515)CANX鈣聯(lián)結蛋白Hs.5679681E-10193.35967.016Mm.2488271E-11495.00068.0633.165上調(diào)WAN013I86xat(SEQ〖DNO:l細CANX鈣聯(lián)結蛋白Hs.567968IE-Ill86.05397J87Mm.2488271E-16992.072100.0001.508上調(diào)WAN008ES3at(SEQIDNO:T5")CANX鈣聯(lián)結蛋白Hs.56796S5E-1888—42122.565Mm.2488271E-11492.56286.2231.376上調(diào)WA畫犯HWat(SEQ〖DNO:1^8)OPRS1阿片樣受體,olHs.5220871E-14187.77695.777Mm.290251E-16389.34997.313上調(diào)XI5652at(SEQIDNO:1519)NSFN-乙基馬來酰亞胺敏感因子Hs.431279089.89999.331Mm.260117094.649i[00.0001.346上調(diào)WA翻88XHat高半胱氨酸誘導的,內(nèi)質(zhì)網(wǎng)壓力誘導的,(SEQIDNO:1520)HERPUD1泛素樣結構域成員1Hs-1463937E-7987.41768.481Mm,51IE-I5091.46392.9711.247上調(diào)200780022890.4轉(zhuǎn)溢也被56/126到<table>tableseeoriginaldocumentpage62</column></row><table><table>tableseeoriginaldocumentpage63</column></row><table>實施例7.在具有高細胞生長率的細胞中差異表達的基因表13和14提供了鑒定為在具有高細胞生長率的細胞中差異表達的核酸的總結。對每個核酸,提供了合格者名錄、符號和名稱,還有在具有高最大細胞生產(chǎn)力的細胞中核酸是上調(diào)還是下調(diào)。對于在Unigene數(shù)據(jù)庫中有人或小鼠同源物的核酸,表中提供了UnigeneID號和比較相關的統(tǒng)計,包括e值、CHO序列和Unigene數(shù)據(jù)庫錄入間的序列同一性百分數(shù)、及覆蓋率百分數(shù)("%QC")。<table>tableseeoriginaldocumentpage65</column></row><table><table>tableseeoriginaldocumentpage66</column></row><table>實施例8,在具有高峰值細胞密度的細胞中差異表達的基因表15、16和17中提供了鑒定為在具有高峰值細胞密度的細胞中差異表達的核酸的總結。對每個核酸,提供了合格者名錄、符號和名稱,還有在具有較高最大細胞生產(chǎn)力的細胞中核酸是上調(diào)還是下調(diào)。對于在Unigene數(shù)據(jù)庫中有人或小鼠同源性的核酸,表提供了UnigeneID號和比4交相關的統(tǒng)計,包括e值、CHO序列和Unigene數(shù)據(jù)庫錄入間的序列同一性百分數(shù)、及覆蓋率百分數(shù)("%QC")。<formula>formulaseeoriginaldocumentpage68</formula><table>tableseeoriginaldocumentpage69</column></row><table><table>tableseeoriginaldocumentpage70</column></row><table>小鼠Unigeie變化方向(測合格者名錄符號名稱人UnigeneIDe值%ID%QCIDe值%ID%QC試相對于對照)WA畫3I2Kat5爭膜蛋白帶EGF樣和二卵泡抑(SEQ〖DNO:1650)TMEFF1素樣結枸域1Hs.336224犯-9391.0781100MnU309827E-8689.963100下調(diào)WA麗3I2Lat溶解栽體家族7(陽離子氨基(SEQIDNO:1651)SLC7A5酸轉(zhuǎn)運蛋白,y+系統(tǒng)),成員5Hs.5137979.00E-071002.2523Mm.27943I.00E-07923.7538上調(diào)WA麗3I2Tat色原體同源物5(HP1a聚合酶,(SEQIDNO:1652)CBX5果蠅)Hs.3492831E-14291.863572.023Mm.2620591E-16894.75172.023上調(diào)WAN013I3Pat(SEQIDN071653)C細LG《丐調(diào)節(jié)配體Hs.529846IE-14786.702199.296麵A1E-17288.61298.944上調(diào)WAN013I61at(SEQIDNO:1654)Nppb利尿鈉肽前體B類Hs.219140Mm.27405E-3088.28123.146下調(diào)WA麗3I6Cat溶解載體家族16(單羧酸轉(zhuǎn)運(SEQIDNO:1655)SLC16A1蛋白),成員1Hs.752312E-2684.47212.697Mm駕61E-11087.2430.284上調(diào)WAN013I6Exat(SE(J〖DNO:1656)GSTP1谷胱甘肽-S-轉(zhuǎn)移酶氨基甲酰磷酸合成酶2,天門Hs.5238361E-12981.990585.889#N/A087.57788.467下調(diào)WAN013I6Jsat冬氨酸轉(zhuǎn)氨甲酰酶,及二氫乳(SEQIDNO:lS57)CAD清酸酶Hs.37701009U55299.461Mm.305535093.50299.461上調(diào)WAN013I6PxatATP結合盒,亞家族B(SEQIDNO:1^58)ABCB1(MDR/TAP),成員1Hs.4,33087.710428.592Mm.146649089.77133.646下調(diào)W扁13I8B一at醛酮還原酶家;j美1,成員A4(SEQIDNO:1659)Akrla4(乙醛還原酶)Hs.474584091.537199.314Mm.30085091.7199.314下調(diào)WA薩3I8Vat(SEQIDNO:1660)核仁素Hs.79110IE-HI卯.058567.059Mm.1543781E-13793.27567.059上調(diào)WAN013I8Xat熱休克60kDa蛋白1(伴侶蛋(SEQIDNO:,)HSPD1白)Hs.1136840卯.30899.775Mm.1777093.38899.775上調(diào)WAN013I9Fat(SEQIDNO:1662)HSPA9B熱休克蛋白9AHs.1842333E-2992.23318.693Mm.2094192E-7244.828上調(diào)WAN01319Gat溶解載體家族3(二堿性和中(SEQIDNO:1663)SLC3A2性氨基酸運輸激活子),成員2Hs.5027691E-10584.854438細Mm.4114088.59658.98上調(diào)WAN013I9Zat(SEQIDNO:1664)GNAS鳥噪呤核苷結合蛋白,a刺激Hs.125898Mm.125770094.40341.104下調(diào)<table>tableseeoriginaldocumentpage72</column></row><table>1.5倍上調(diào)<table>tableseeoriginaldocumentpage73</column></row><table><table>tableseeoriginaldocumentpage74</column></row><table><table>tableseeoriginaldocumentpage75</column></row><table><table>tableseeoriginaldocumentpage76</column></row><table><table>tableseeoriginaldocumentpage77</column></row><table>實施例9.具有持續(xù)高細胞活力的細胞中差異表達的基因Bcl-xL是細胞死亡的強大抑制因子。過表達Bcl-xL的細胞顯示了持續(xù)高細胞活力。表18和19總結了在過表達Bcl-xL的細胞中差異表達為至少1.2倍的核酸。在多個時間點取樣樣品進行比較。表18總結了在第5天差異表達至少1.2倍的核酸。表19總結了在笫5天之后的階段差異表達至少1.2倍的核酸。<table>tableseeoriginaldocumentpage79</column></row><table><table>tableseeoriginaldocumentpage80</column></row><table><table>tableseeoriginaldocumentpage81</column></row><table><table>tableseeoriginaldocumentpage82</column></row><table><table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table><table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table>實施例10.平臺分析根據(jù)平臺方法分類分析了當培養(yǎng)于分批補料培養(yǎng)物時具有期望代謝表型的四種細胞系。就是說,在分批補料培養(yǎng)晚期細胞系維持高活力并消耗乳酸和氨。對于在分批補料培養(yǎng)物中生長的每種細胞系收集多個時間點樣品。用ANOVA分析研究各細胞系各時間點的樣品來監(jiān)測在培養(yǎng)期間的基因表達的變化。比較來自各細胞系的基因列表,并鑒定出那些在所有4種細胞系中共有的基因。表20列出了例示性的核酸序列。<table>tableseeoriginaldocumentpage93</column></row><table><table>tableseeoriginaldocumentpage94</column></row><table><table>tableseeoriginaldocumentpage95</column></row><table><table>tableseeoriginaldocumentpage96</column></row><table>實施例11.乾標-驗證s說A^t通過使用本領域已知的方法過表達抑制相關基因表達的核酸驗證了差異表達的基因及蛋白質(zhì)影響細胞表型的能力。下面描述了基于干擾RNA構建體的例示性方法。通常,測序作為siRNA介導的基因敲低候選物的靶標并證實序列。優(yōu)選(盡管不必要)利用全長cDNA序列信息以便于siRNA設計。作為基因敲低候選物的靶序列與公共或?qū)@麛?shù)據(jù)庫可得的基因序列相比較(例如BLAST搜索)。在靶基因內(nèi)與其他已知序列重疊(例如同源的16-17個連續(xù)堿基對)的序列一般不適于做特異性siRNA介導的基因敲低的靶標。例如,可以使用在安全網(wǎng)絡連接上的在線設計工具例如在Ambion網(wǎng)站師D:〃www.ambion.com/techlib/misc/siRNAfmder.html)上可用的工具來設計siRNA??蛇x地,還可以自Ambion(其應用Cenix算法來設計有效的siRNA)索取定制的siRNA。標準的siRNA通常是5nmol、退火并在板中具有標準純度的形式。當收到合成的siRNA時,依照制造商提供的指導來制備siRNA并儲存在適宜的溫度(-20。C)。使用標準方法來進行siRNA轉(zhuǎn)染。通常待轉(zhuǎn)染的細胞在轉(zhuǎn)染前一天預傳代來保證細胞處于對數(shù)生長期。通常,使用siRNA分批補料測定。轉(zhuǎn)染的例示性材料、條件和方法如下轉(zhuǎn)染(第0天)每個離心管(50ml)100fiLRl2uLTransit-TKO轉(zhuǎn)染試劑(Minis)10jiL10fiMsiRNA2mLle5細胞/mL,于AS1培養(yǎng)基中97轉(zhuǎn)染之后37C:72hrs31。C:96hrs加入AQ3,在笫3天(D3)在第1天(Dl)、第3天(D3)、第7天(D7)取樣W^老浮脊襲對于各實驗,使用1mL總體積的100,000個細胞(如3C7細胞)和50nMsiRNA。為制備用于3份反應的混合物,混合150jiLRl和70jiLMinisTKO試劑并在室溫醉育10分鐘。加入15fiL10siRNA并在室溫孵育混合物10分鐘。向3個孔中分別轉(zhuǎn)入57.3jiL混合物。加入942.7fiLR5CD1(含100,000個細胞)板在37。C搖床上孵育72小時。庠心f^/7A^脊染對于各實驗,使用imL總體積的100,000個細胞(如3C7細胞)。對每份轉(zhuǎn)染,混合100nLRl和2nLMirusTKO試劑,并在室溫孵育10分鐘。加入10pL10jiMsiRNA并在室溫孵育混合物15分鐘,偶爾混合。向各離心管中轉(zhuǎn)入1.9mL培養(yǎng)物。向各離心管內(nèi)加入siRNA混合物(112HL)。先在37。C孵育培養(yǎng)物,在第3天改變溫度到31°C??焖僬袷?約250RPM)離心管培養(yǎng)物。在第l、3和7天取樣。在第7天終止培養(yǎng)。每一塊板上都包括生長和生產(chǎn)力對照。例示性的生產(chǎn)力對照是DHFR(雙順反子mRNA選擇性標記)。以DHFRsiRNA處理可重復地降低了CM-FcIGEN(抗體生產(chǎn)對照)中的抗體量。例示性的生長對照是CHOI(驅(qū)動蛋白)(見Matuliene等(2002)Mol.Cell.Biol.13:1832-45)(通過,以CHOI處理觀察到大約20-30%的生長抑制)。還納入了其他標準對照,例如無siRNA處理(只有轉(zhuǎn)染試劑)和非尋靶siRNA處理(非特異性siRNA)。然后對板進行細胞計數(shù)(例如,在96孔細胞計數(shù)器中)以評估生長,和例如在自動化96孔滴度測定中來評估生產(chǎn)力。由此驗證了經(jīng)單獨98或組合調(diào)節(jié)足以改變有益細胞表型的基因,并且能夠在哺乳動物細胞系單獨或組合地設計此類變化,以改變其特性。表21顯示了用于驗證目的的模式細胞系及它們的特征。圖143-146總結了以離心管形式評價的3C7細胞系中的一些靶基因。評價的靶基因包括DM9(WAN013I8K),如上文所述鑒定為在具有升高的生長率的細胞中上升;EIF4B,如上文所述鑒定為在具有升高的生長率的細胞中上升;HSP27(HSPB1),如上文所述鑒定為在具有升高生長率的細胞中上升;MCP1(CCL2),如上文所述鑒定為在具有高細胞密度的細胞中降低;NAAT1(SLC1A4),如上文所述鑒定為具有升高的生長率的細胞中降低;MMD1(芊果酸脫氫酶),如上文所述鑒定為在具有高最大細胞生產(chǎn)力的細胞中降低;MATF-4(ATF-4),如上文所述鑒定為在具有高細胞密度的細胞中上升;及SCoA連接酶(suclg2),如上文所述鑒定為在具有高細胞密度的細胞中上升。如圖143所示,對于鑒定為在具有升高生長率細胞中上升的基因,抑制所述基因?qū)е铝讼鄬τ趯φ盏纳L抑制。如圖144所示,細胞生產(chǎn)力一般不會受到對等的影響。表21.細胞系和其特征<table>tableseeoriginaldocumentpage99</column></row><table>通過使用本領域已知的方法過表達編碼相關基因表達的核酸確證了差異表達基因和蛋白質(zhì)影響細胞表型的能力。下面描述了例示性的方法。例如,通過瞬時轉(zhuǎn)染將過表達特定靶標的核酸引入到CHO細胞中,接著監(jiān)測過表達對于細胞生長和生產(chǎn)力的影響。圖147和148說明了24孔方式的例示性方案。一般使用生長和生產(chǎn)力對照進行過表達測定。例如,在此實驗中所使用的的陽性生長/活力對照包括Ha-Ras和Bcl-xL。使用的陰性生長對照包括p27。其他適合的生長和生產(chǎn)力對照為本領域公知,且能用于過表達測定。還納入了額外的標準對照如無核酸對照(只有轉(zhuǎn)染試劑)。如表22所示,克隆耙基因和對照基因到pExpressl載體內(nèi)并引入不同的模式細胞系中。表22.用于分析的細胞系及其特征克隆特征1.18中間水平5C10中間水平DE-6中間水平DD畫ll中間水平1.14HCGR,持續(xù)高活力、非持續(xù)高Qp、非低NH4、非高細胞密度2.8高最大Qp、持續(xù)高Qp3B12高最大Qp、持續(xù)高Qp、高細胞密度、低乳酸DA-4非HCGR、非高細胞密度5B5非持續(xù)高Qp、非低乳酸2B6非高細胞密度、非高最大Qp使用24孔方式以區(qū)分不同基因瞬時轉(zhuǎn)染對不同細胞系的表型效應。對細胞生長和生產(chǎn)力進行了測定。圖149-151圖解了例示性結果。發(fā)現(xiàn)結果通常具有代表性并可重復。在表23中總結了例示性的過表達結果。表23.過表達分析的總結<table>tableseeoriginaldocumentpage101</column></row><table>NA=未測或結果待定(***)強烈地增加或減少(**)增加或減少_(*)適度增加或減少實施例13.基于證實的靶基因來工程化細胞系以改進細胞表型使用經(jīng)證實的靶基因來影響細胞表型,特別是以增加和有效生產(chǎn)重組轉(zhuǎn)基因、增加細胞生長率、高峰值細胞密度、持續(xù)高細胞活力、高最大細胞生產(chǎn)力、持續(xù)高細胞生產(chǎn)力、低氨產(chǎn)量和低乳酸產(chǎn)量等為特征的表型。上文例如表2-20和表24-30公開了例示性的靶基因。<table>tableseeoriginaldocumentpage102</column></row><table>WAN0OSD6R_at(SEQIDNO:1604)TMED4跨膜emp24含蛋白轉(zhuǎn)運結構域4Hs.5隨5IE"II9173.7Mm.254495IE-1409286.6下調(diào)轉(zhuǎn)運蛋白;未知功能WAN008DMI_at(SEQIDNO:1610)ACSL5跌基輔酶A合成酶長鏈家族成員5Hs.U6388596.6卿A09099—6上調(diào)脂生物合成;脂肪酸降解WAN008DWJat(SEQIDNO:USP1類似于泛素特異性蛋白酶1Hs.3508609397Mm.37,09496-5上調(diào)去泛素化酶WA,8e5l一at溶解栽體家族i(中性氨基酸轉(zhuǎn)運蛋(sb:qmNo:l619)slc1a5白),成員5Hs.5154948E-428445.6Mm.10561e-11588s3.3上調(diào)氨基酸轉(zhuǎn)運蛋白WAN008E9N—at(SEQIDMO:〖620)KLHL7Kelch樣7(杲繩)Hs.3纖lIE-1508999.4Mm.27376809389.1下調(diào)未知功能WAN008EBP—at(SEQIDNO:r621)Sqstml隔離體i應蛋白fO^^/"e/rf-/flfc(^病,Hs-529靴09397.8Mm.4082809397.8下調(diào)泛素相關蛋白質(zhì)股卿犯仍a.(7w歸'flnStra"他/sS"c/ww&《/"祭合癥,WAN008ELE—at/VM>及命&家^關弒癥J9E-458734.8M肌糾州57.2T調(diào)(SEQIDNO:〖626)PSATI磷酸絲氨酸氨基轉(zhuǎn)移酶1Hs.4942617E-279316.2Mm.2899365E-708858.2上調(diào)絲氨酸生物合成WAN008EM4—atARHGAP1(SEQIDNO:1627)8RhoGTP酶激活蛋白IS化1098597-9Mm.3564961E-14788100下調(diào)未知功能WAN008EOB_at(SEQIDNO:1629)NOLI核仁蛋白1,120kDaHs.5343348E-489042.5Mm.29203IE-I208792.2上調(diào)細胞周期進行WAN008ERI_at(SEQIDNO:632)FNBP3形成素結合蛋白3Hs.2987354E-819798.9Mm.2574742E-9499100下調(diào)mRNA前體加工WANOO犯RP一at(SEQEDNO:r634)皮屑蛋白樣IHs.374191IE-458792.8Mm.326柳1E-688994下調(diào)細胞增殖的負調(diào)控()WAN00犯UO一at(SEQIDNO:1635)LPL脂蛋白酯酶Hs.圓782E-828874.1Mm.15141E-U39274J下調(diào)甘油醋代謝在新測試中同源物,但在WAN008F1P—x_at多數(shù)情況下+/-,并且這(SEQIDNO:1^37)NA1U65A-A01,A下調(diào)些沒有任何同源性WAN013HW0—x—at顯示為線粒體的多順反(SEQIDNO:l^fO)NA包括WAN008CO310600D-F02的聚簇#N/A#N/A上調(diào)mRNA!!!WAN013HXS丄at(SEQIDNO:l&O)E〖F4A2真核翻譯起始因子4A,同工酶2Hs478553IE-15596100Mm.2600841E-I55%100下調(diào)翻譯起始WAN013IlU一x—at(SEQrDNO「lf48)NA包括WAN008BLL11233C-H10的聚簇#N/A2E-05927.71WA1E-05927.71上調(diào)WAN01312T_at色原體同源物5(HPIalpha同源物,(SEQIDNO:1652)CBX5果蠅JHs.3492S31E-1429272Mm262059iE-1689572上調(diào)染色質(zhì)結合WAN013I6J—s—at氨基甲酰4l酸合成酶2,天門冬氨酸轉(zhuǎn)(SEQIDNO:1^57)CAD氨甲酰酶,及二氫乳清酸酶Hs.37701009199.5Mm.30553509499.5上調(diào)嘧啶生物合成WAN013I8X—at(SEQIDNO:l66i)HSPD1熱休克60kDa蛋白1(伴侶蛋白)Hs.1136840卯99.8Mm.177709399.8上調(diào)分子伴侶WAN013I9Z—at(SEQIDNO:1664)GNAS烏嗜呤核苷結合蛋白alpha刺激性Hs.125898Mm.12577009441.1下調(diào)細胞生長WANOI3I9F_at(SEQIDNO:1662)HSPA犯熱休克蛋白9AHs掘2333E-299218.7Mm.2094192E-729144-8上調(diào)細月包增殖小鼠合格者名錄符號名稱人UnigeneIDe值%QCUnigeneIDe值%1D%QCFC功能gi|34853001Uaplll推測的類似于UDP-N-乙酰葡糖胺焦磷酸酶卜樣1Mm.33797-2.22<formula>formulaseeoriginaldocumentpage104</formula><table>tableseeoriginaldocumentpage105</column></row><table><formula>formulaseeoriginaldocumentpage106</formula><table>tableseeoriginaldocumentpage107</column></row><table><table>tableseeoriginaldocumentpage108</column></row><table><table>tableseeoriginaldocumentpage109</column></row><table><table>tableseeoriginaldocumentpage110</column></row><table><table>tableseeoriginaldocumentpage111</column></row><table><table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table><table>tableseeoriginaldocumentpage114</column></row><table><table>tableseeoriginaldocumentpage115</column></row><table><table>tableseeoriginaldocumentpage116</column></row><table><table>tableseeoriginaldocumentpage117</column></row><table><table>tableseeoriginaldocumentpage118</column></row><table><table>tableseeoriginaldocumentpage119</column></row><table>此頁無內(nèi)容表26.高度優(yōu)先考慮基因列表3<table>tableseeoriginaldocumentpage121</column></row><table><table>tableseeoriginaldocumentpage122</column></row><table><table>tableseeoriginaldocumentpage123</column></row><table><table>tableseeoriginaldocumentpage124</column></row><table><table>tableseeoriginaldocumentpage125</column></row><table><table>tableseeoriginaldocumentpage126</column></row><table><table>tableseeoriginaldocumentpage127</column></row><table>表29.LLP2+4測試特異性1.2倍上調(diào)<table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table><table>tableseeoriginaldocumentpage130</column></row><table>使用標準細胞工程方法修飾靶基因來實現(xiàn)期望的細胞表型。如上文所討論的那樣,通過干擾RNA、傳統(tǒng)基因敲除或過表達方法修飾靶基因來獲得期望的CHO細胞表型。通常,使用敲除方法或用過表達構建體穩(wěn)定轉(zhuǎn)染的方法來改造修飾的CHO細胞系。其他適當?shù)姆椒ㄔ诟攀霾糠钟兴懻摚楸绢I域所公知。本發(fā)明前述內(nèi)容提供了舉例說明和描述,但并非旨在窮舉或?qū)⒈景l(fā)明精確局限為所公開的內(nèi)容。可以按照上述教導進行修改和變動,或可以通過實施本發(fā)明而實現(xiàn)。因而,應指出本發(fā)明的范圍由權利要求書及其等同方案限定。引入作為參考在本申請中引述的所有序列登錄號、出版物和專利文獻為了所有的目的以其整體引入作為參考,就如同每一單獨出版物或?qū)@墨I的內(nèi)容分別在此引入一樣。13權利要求1.用于鑒定調(diào)控或指示細胞系細胞培養(yǎng)表型的蛋白質(zhì)的方法,所述方法包括生成來自測試細胞系樣品的蛋白質(zhì)表達譜;將蛋白質(zhì)表達譜和來自對照細胞系的對照譜相比較;和基于比較鑒定一個或多個差異表達的蛋白質(zhì),其中測試細胞系的細胞培養(yǎng)表型與對照細胞系不同,并且一個或多個差異表達的蛋白質(zhì)能夠調(diào)控或指示細胞培養(yǎng)表型。2.權利要求l的方法,其中細胞系是中國倉鼠卵巢(CHO)細胞系。3.權利要求l的方法,其中細胞培養(yǎng)表型是細胞生長速率、細胞生產(chǎn)力、峰值細胞密度、持續(xù)細胞活力、氨生產(chǎn)或消耗速率或乳酸生產(chǎn)或消耗速率。4.權利要求3的方法,其中細胞培養(yǎng)表型是最大細胞生產(chǎn)力。5.權利要求3的方法,其中細胞培養(yǎng)表型是持續(xù)細胞活力。6.權利要求3的方法,其中細胞培養(yǎng)表型是峰值細胞密度。7.權利要求3的方法,其中細胞培養(yǎng)表型是細胞生長速率。8.權利要求l的方法,其中通過熒光二維差異凝膠電泳生成蛋白質(zhì)表達謙。9.用于改進細胞系的方法,所述方法包括上調(diào)依照權利要求l的方法所鑒定的一個或多個蛋白質(zhì)。10.用于改進細胞系的方法,所述方法包括通過過表達來上調(diào)依照權利要求1的方法所鑒定的一個或多個蛋白質(zhì)。11.用于改進細胞系的方法,所述方法包括下調(diào)依照權利要求1的方法所鑒定的一個或多個蛋白質(zhì)。12.權利要求11的方法,其中所述方法包括通過RNA干擾來下調(diào)依照權利要求1的方法所鑒定的一個或多個蛋白質(zhì)。13.用于改進細胞系的細胞生產(chǎn)力的方法,所述方法包括上調(diào)依照權利要求1的方法所鑒定的一個或多個蛋白質(zhì)。14.用于改進細胞系的細胞生產(chǎn)力的方法,所述方法包括下調(diào)依照權利要求1的方法所鑒定的一個或多個蛋白質(zhì)。15.用于改進細胞系的細胞生產(chǎn)力的方法,所述方法包括調(diào)節(jié)選自表2、3、9、10、11和12的一個或多個基因或蛋白質(zhì)。16.用于改進細胞系的細胞生產(chǎn)力的方法,所述方法包括調(diào)節(jié)依照權利要求4的方法所鑒定的一個或多個蛋白質(zhì)。17.用于改進細胞系的細胞生長速率的方法,所述方法包括調(diào)節(jié)選自表4、5、6、13、14、27和28的一個或多個基因或蛋白質(zhì)。18.用于改進細胞系的細胞生長速率的方法,所述方法包括調(diào)節(jié)依照權利要求7的方法所鑒定的一個或多個蛋白質(zhì)。19.用于增加細胞系的峰值細胞密度的方法,所述方法包括調(diào)節(jié)選自表8、15、16和17的一個或多個基因或蛋白質(zhì)。20.用于增加細胞系的峰值細胞密度的方法,所述方法包括調(diào)節(jié)依照權利要求6的方法所鑒定的一個或多個蛋白質(zhì)。21.用于增加細胞系的持續(xù)細胞活力的方法,所述方法包括調(diào)節(jié)選自表7、18和19的一個或多個基因或蛋白質(zhì)。22.用于增加細胞系的持續(xù)細胞活力的方法,所述方法包括調(diào)節(jié)依照權利要求5的方法所鑒定的一個或多個基因或蛋白質(zhì)。23.用于改進細胞系的方法,所述方法包括調(diào)節(jié)選自表20、24、25和26的一個或多個基因。24.用于調(diào)節(jié)細胞系中乳酸生產(chǎn)或消耗速率的方法,所述方法包括調(diào)節(jié)選自表29和30的一個或多個基因。25.用于改進細胞系的方法,所述方法包括上調(diào)或下調(diào)至少兩種基因或蛋白質(zhì),其中第一基因或蛋白質(zhì)影響第一細胞培養(yǎng)表型,而第二個基因或蛋白質(zhì)影響不同的第二細胞培養(yǎng)表型,其中細胞培養(yǎng)表型選自細胞生長速率、細胞生產(chǎn)力、峰值細胞密度、持續(xù)細胞活力、氨生產(chǎn)或消耗速率、或乳酸生產(chǎn)或消耗速率。26.權利要求M的方法,還包括上調(diào)或下調(diào)影響不同于第一和第二細胞培養(yǎng)表型的第三細胞培養(yǎng)表型的第三基因或蛋白質(zhì)。27.評估細胞系的細胞培養(yǎng)表型的方法,所述方法包括檢測細胞培養(yǎng)物樣品中依照權利要求i所鑒定蛋白質(zhì)的表達水平;和將表達水平和參照水平相比較,其中比較指示細胞培養(yǎng)表型。28.評估細胞系的細胞培養(yǎng)表型的方法,所述方法包括檢測細胞培養(yǎng)物樣品中指示細胞培養(yǎng)表型的一個或多個標記,其中所述標記從由選自圖7到138的肽、選自表2到8的蛋白質(zhì)、及選自表9到20和24到30的基因的基因表達產(chǎn)物組成的組中選擇。29.具有改進的細胞培養(yǎng)表型的工程細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)依照權利要求1所鑒定的一個或多個蛋白質(zhì)的工程構建體。30.具有改進的細胞生產(chǎn)力的工程細胞系,包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表2、3、9、10、11和12的一個或多個基因或蛋白質(zhì)的工程構建體。31.權利要求30的工程細胞系,其中工程構建體是過表達構建體。32.權利要求30的工程細胞系,其中工程構建體是干擾RNA構建體。33.具有改進的細胞生長速率的工程細胞系,包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表4、5、6、13、14、27和28的一個或多個基因或蛋白質(zhì)的工程構建體。34.權利要求33的工程細胞系,其中工程構建體是過表達構建體。35.權利要求33的工程細胞系,其中工程構建體是干擾RNA構建體。36.具有改進的峰值細胞密度的工程細胞系,包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表8、15、16和17的一個或多個基因或蛋白質(zhì)的工程構建體。37.權利要求36的工程細胞系,其中工程構建體是過表達構建體。38.權利要求36的工程細胞系,其中工程構建體是干擾RNA構建體。39.具有改進的持續(xù)細胞活力的工程細胞系,包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表7、18和19的一個或多個基因或蛋白質(zhì)的工程構建體。40.杈利要求39的工程細胞系,其中工程構建體是過表達構建體。41.權利要求39的工程細胞系,其中工程構建體是干擾RNA構建體。42.具有調(diào)節(jié)的乳酸生產(chǎn)或消耗的工程細胞系,所述工程細胞系包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表29和30的一個或多個基因的工程構建體。43.權利要求42的工程細胞系,其中工程構建體是過表達構建體。44.權利要求42的工程細胞系,其中工程構建體是干擾RNA構建體。45.改進的細胞系,其包含工程細胞群,各工程細胞包含上調(diào)或下調(diào)選自表20、24、25和26的一個或多個基因或蛋白質(zhì)的工程構建體。46.權利要求45的工程細胞系,其中工程構建體是過表達構建體。47.權利要求45的工程細胞系,其中工程構建體是干擾RNA構建體。48.用于表達目的蛋白質(zhì)的方法,所述方法包括步驟向權利要求29的工程細胞系中引入編碼目的蛋白質(zhì)的核酸;和收獲目的蛋白質(zhì)。49.分離或重組的核酸,其包含選自表9、13和15的CHO序列。50.分離或重組的蛋白質(zhì),其包含選自表2和4的CHO序列。全文摘要本發(fā)明提供了通過表達譜分析來系統(tǒng)鑒定最大化蛋白質(zhì)表達和分泌的基因和蛋白質(zhì)及相關通路的方法。本發(fā)明還提供了操縱所鑒定的基因和蛋白質(zhì)來工程化改進的細胞系的方法。文檔編號G01N33/50GK101479601SQ200780022890公開日2009年7月8日申請日期2007年4月21日優(yōu)先權日2006年4月21日發(fā)明者D·L·迪尼諾,K·M·麥卡錫,K·安德森,K·科佩欽斯基,M·S·西納科雷,M·倫納德,M·克萊因斯,M·邁維勒,N·巴龍,P·加梅爾,P·杜蘭,P·米萊蒂,T·沙勒布瓦申請人:惠氏公司;都柏林城市大學