專利名稱:一種多因素結(jié)合法研究基因轉(zhuǎn)錄調(diào)控機(jī)制的模型的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于基因表達(dá)調(diào)控研究領(lǐng)域,是一種從全基因組水平及基因水平,結(jié)合表觀遺傳及DNA序列特征等因素研究基因表達(dá)調(diào)控機(jī)制的模型,為進(jìn)一步研究生物體內(nèi)表達(dá)調(diào)控提供技術(shù)及理論依據(jù)。
背景技術(shù):
基因表達(dá)調(diào)控是一個(gè)很復(fù)雜的生物學(xué)現(xiàn)象。目前,研究報(bào)道中提到的關(guān)于基因表達(dá)調(diào)控的指揮系統(tǒng)就有很多種。經(jīng)典的遺傳學(xué)認(rèn)為基因表達(dá)主要是受DNA序列本身決定的。與之相對(duì)的表觀遺傳學(xué)(epigenetics)認(rèn)為在基因的DNA序列沒有發(fā)生改變的情況下,基因功能會(huì)發(fā)生可遺傳的變化,并最終導(dǎo)致了表型的變化。組蛋白密碼是表觀遺傳學(xué)研究的重要內(nèi)容。組蛋白密碼研究的內(nèi)容包括核小體在基因組的分布以及組蛋白修飾之間的級(jí)聯(lián)效應(yīng)。核小體的形成及其在染色質(zhì)上的精確定位,除了導(dǎo)致DNA在組蛋白上纏繞得足夠緊密以便于細(xì)胞核的包裝作用以外,還能導(dǎo)致染色質(zhì)結(jié)構(gòu)不均勻,影響組蛋白修飾及DNA甲基化的發(fā)生,而這些又能直接或間接的調(diào)控基因表達(dá)。有些研究認(rèn)為核小體通過在基因調(diào)控區(qū)如啟動(dòng)子,終止子區(qū)定位的變化來影響基因的轉(zhuǎn)錄。
目前,我們尚不知道核小體占位水平以及DNA序列本身是如何影響全基因組的轉(zhuǎn)錄水平的。隨著RNA-seq技術(shù)的出現(xiàn),我們不僅能看到基因區(qū)的表達(dá)情況,同時(shí)我們還能看到基因間區(qū)及整個(gè)基因組水平的表達(dá)情況。同時(shí)ChlP-seq技術(shù)使得我們能夠從基因組水平研究核小體的分布。本發(fā)明利用ChlP-seq及rmRNA-seq獲得小鼠大腦中的全基因組H3的分布及轉(zhuǎn)錄數(shù)據(jù),并結(jié)合公開發(fā)表的全基因組組蛋白修飾及DNA甲基化等方面的數(shù)據(jù),構(gòu)建了一種研究基因轉(zhuǎn)錄調(diào)控機(jī)制的模型。
發(fā)明內(nèi)容
本發(fā)明的目的是建立一個(gè)模型,通過基因組上組蛋白H3占位水平并結(jié)合DNA序列特征等因素來預(yù)測(cè)基因組或基因水平的轉(zhuǎn)錄情況。利用新一代DNA測(cè)序平臺(tái)SOLiD獲得小鼠大腦全基因組組蛋白H3ChIP-seq及轉(zhuǎn)錄組rmRNA-seq數(shù)據(jù)。根據(jù)自己開發(fā)的平臺(tái)對(duì)SOLID序列進(jìn)行基因組注釋,然后分別從全基因組水平及基因水平研究核小體占位等多種因素與基因組表達(dá)水平的關(guān)系。一、從基因組水平將每條染色體等分成一定數(shù)量的小區(qū)域,并計(jì)算每個(gè)小區(qū)域的H3信號(hào)及mRNA信號(hào)。對(duì)這兩部分?jǐn)?shù)據(jù)做相關(guān)分析發(fā)現(xiàn)兩者高度相關(guān)。并結(jié)合公開發(fā)表的組蛋白各種修飾CHIP-Seq的數(shù)據(jù)及GC含量等相關(guān)數(shù)據(jù),發(fā)現(xiàn)基因組表達(dá)水平與這些因素均相關(guān)。二、從基因水平根據(jù)NCBI公開發(fā)表的RefSeq基因位置信息,計(jì)算每個(gè)基因上的H3信號(hào)及mRNA信號(hào)。結(jié)合公開發(fā)表的組蛋白各種修飾CHIP-Seq的數(shù)據(jù)、GC含量及DNA甲基化等相關(guān)數(shù)據(jù)進(jìn)行多方面的分析,發(fā)現(xiàn)基因表達(dá)水平受所有這些因素調(diào)控。主要進(jìn)行如下幾個(gè)方面的分析:1.相關(guān)性分析Pearson相關(guān)性檢驗(yàn)結(jié)果顯示基因表達(dá)與核小體占位、GC含量、各種H3修飾及DNA甲基化高度相關(guān);不同表達(dá)水平基因區(qū)核小體占位箱式圖顯示核小體占位與基因表達(dá)呈正相關(guān),結(jié)果見附圖1。2.核小體在基因調(diào)控區(qū)定位分析比較分析了沉默基因集及表達(dá)基因集中核小體在基因轉(zhuǎn)錄起始位點(diǎn)(TSS)以及其周圍的分布情況。同樣還計(jì)算了在轉(zhuǎn)錄終止位點(diǎn)(TTS),外顯子與內(nèi)含子連接處上下游區(qū)域核小體的分布。結(jié)果發(fā)現(xiàn)核小體在不同表達(dá)水平基因調(diào)控區(qū)的定位模式不一致。3.聚類分析對(duì)基因水平的核小體占位及各種組蛋白修飾、DNA methylation、RNAPol1-1I等做分層聚類分析,結(jié)果清楚顯示,整個(gè)基因集被分成兩類:第一類為高表達(dá)區(qū),具有核小體及各種修飾富集,而低甲基化,高GC等特點(diǎn);第二類為低表達(dá)區(qū),具有核小體及各種修飾缺乏,而高甲基化,低GC等特·點(diǎn);
圖1不同表達(dá)水平基因區(qū)核小體占位箱式圖
具體實(shí)施例方式1.材料a)小鼠大腦組織小鼠的大腦組織來自十周成年雄性BALB/c小鼠。b)所需主要試劑與儀器Trizol, IObp DNA Ladder, pUC18 DNA/Mspl 購于 TIANGEN,pGEM-T 載體、T4 連接酶,OneShot ToplO Competent Cell 購于 Promega。其他常見試劑如氯仿(Chloroform)
等2.上機(jī)實(shí)驗(yàn)利用新一代DNA測(cè)序平臺(tái)SOLiD進(jìn)行rmRNA-seq及Chip-Seq實(shí)驗(yàn)3.數(shù)據(jù)分析a) SOLiD序列在基因組上的注釋根據(jù)網(wǎng)上公開發(fā)表的小鼠基因組信息,用blast序列比對(duì)方法做基因組注釋。b)構(gòu)建基因集NCBI上下載相關(guān)的基因集信息。c)表達(dá)譜及核小體占位分析分別從基因組及基因水平研究核小體占位與表達(dá)譜之間的關(guān)系。分析方法有相關(guān)性、分層聚類法等。實(shí)駘實(shí)例實(shí)駘實(shí)例
取小鼠大腦組織,用DNA測(cè)序平臺(tái)SOLID分別做組蛋白Chip-seq及rmRNA-Seq。從基因組及基因水平研究核小體占位與表達(dá)譜之間的關(guān)系,發(fā)現(xiàn)無論在基因組水平還是基因水平,兩者都高度相關(guān),而且核小體在不同表達(dá)水平基因調(diào)控區(qū)的定位模式不一致。聚類結(jié)果顯示核小體占位及GC含量,組蛋白修飾及DNA甲基化等因素能夠很好的區(qū)分不同表達(dá)水平的基因。以上是對(duì)本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實(shí)施方式,均在本發(fā)明的保護(hù)范圍 之中。
權(quán)利要求
1.全基因組水平轉(zhuǎn)錄調(diào)控因素分析模型。其特征在于把全基因組分成小區(qū)域,結(jié)合表觀遺傳因素及DNA序列特征來研究轉(zhuǎn)錄調(diào)控。
2.基因水平轉(zhuǎn)錄調(diào)控因素分析模型。利用多種分析方法研究轉(zhuǎn)錄調(diào)控因素如相關(guān)分析、聚類分析等。同時(shí)對(duì)核小 體在基因調(diào)控區(qū)定位特征分析其與基因轉(zhuǎn)錄調(diào)控的關(guān)系。
全文摘要
本發(fā)明屬于基因組學(xué)研究領(lǐng)域,是一種從全基因組水平研究表觀遺傳組及轉(zhuǎn)錄組之間關(guān)聯(lián)關(guān)系的信息分析技術(shù)。把表觀遺傳方面的因素如核小體占位、DNA甲基化,與DNA序列特征等因素相結(jié)合,利用多種分析技術(shù)研究這些因素與基因轉(zhuǎn)錄水平間的關(guān)聯(lián)關(guān)系。最后結(jié)果顯示核小體占位及GC含量,組蛋白修飾及DNA甲基化等因素能夠很好的區(qū)分不同表達(dá)水平的基因。該結(jié)果為進(jìn)一步研究生物體內(nèi)表達(dá)調(diào)控提供技術(shù)及理論依據(jù)。
文檔編號(hào)C12Q1/68GK103160573SQ20111040734
公開日2013年6月19日 申請(qǐng)日期2011年12月9日 優(yōu)先權(quán)日2011年12月9日
發(fā)明者曾華宗 申請(qǐng)人:上海聚類生物科技有限公司