當人類(lèi)基因體定序計劃的重要里程碑完成之后,生命科學(xué)正式邁入了一個(gè)后基因體時(shí)代,基因芯片 (microarray) 的出現讓研究人員得以宏觀(guān)的視野來(lái)探討分子機轉。不過(guò)分析是相當復雜的學(xué)問(wèn),正因為基因芯片成千上萬(wàn)的信息使得分析數據量龐大,更需要應用到生物統計與生物信息相關(guān)軟件的協(xié)助。要取得一完整的數據結果,除了前端的實(shí)驗設計與操作的無(wú)暇外,如何以精確的分析取得可信數據,運籌帷幄于方寸之間,更是畫(huà)龍點(diǎn)睛的關(guān)鍵。
?0?2
基因芯片的應用
基因芯片可以同時(shí)針對生物體內數以千計的基因進(jìn)行表現量分析,對于科學(xué)研究者而言,不論是細胞的生命周期、生化調控路徑、蛋白質(zhì)交互作用關(guān)系等等研究,或是藥物研發(fā)中對于藥物作用目標基因的篩選,到臨床的疾病診斷預測,都為基因芯片可以發(fā)揮功用的范疇。
?0?2
基因表現圖譜抓取了時(shí)間點(diǎn)當下所有的動(dòng)態(tài)基因表現情形,將所有的探針所代表的基因與熒光強度轉換成基本數據 (raw data) 后,仿如尚未解密前的達文西密碼,隱藏的奧秘由絲絲的線(xiàn)索串聯(lián)綿延,有待專(zhuān)家抽絲剝繭,如剝洋蔥般從外而內層層解析出數千數萬(wàn)數據下的隱晦含義。
?0?2
要獲得有意義的分析結果,恐怕不能如潑墨畫(huà)般灑脫隨興所致。從 raw data 取得后,需要一連貫的分析流程 (圖一),經(jīng)過(guò)許多統計方法,才能條清理明的將 raw data 整理出一初步的分析數據,當處理到取得實(shí)驗組除以對照組的對數值后 (log2 ratio),大約完成初步的統計工作,可進(jìn)展到下一步的進(jìn)階分析階段。
基因芯片(Gene chip)技術(shù)是指通過(guò)微陣列(Microarray)技術(shù)將高密度DNA片段陣列通過(guò)高速機器人或原位合成方式以一定的順序或排列方式使其附著(zhù)在如玻璃片等固相表面,以熒光標記的DNA探針,借助堿基互補雜交原理,進(jìn)行大量的基因表達及監測等方面研究的技術(shù)。 基因芯片具有快速、高通量、自動(dòng)化、使用的試劑少等優(yōu)點(diǎn),本文主要介紹基因芯片數據分析和信息挖掘方法,包括聚類(lèi)分析和基因調控網(wǎng)絡(luò )分析。
詳細資料請參考:on
基因芯片的原位合成法是基于組合化學(xué)的合成原理[9], 通過(guò)一組定位模板來(lái)決定基片表面上不同化學(xué)單體的偶聯(lián)位點(diǎn)和次序, 把腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)四種不同堿基的核苷酸按不同次序化學(xué)偶聯(lián)在相應的位點(diǎn), 原位合成序列不同的寡核苷酸探針, 形成DNA芯片. 這一技術(shù)是由Affymetrix公司的Fodor及其同事最先發(fā)明的[1], 他們使用含光敏化學(xué)保護基的DNA合成試劑, 用光脫保護法直接在基片上合成寡核苷酸探針, 即光導向原位合成法. 該方法的優(yōu)點(diǎn)在于精確性高, 缺點(diǎn)是制造光掩蔽劑既費時(shí)又昂貴.。
將基因表達譜芯片的數據按照指定的格式和要求上傳到NCBI 的GEO Datesets 上面的方法
你到GEO上注冊,然后按照他們的步驟做,他們會(huì )有人聯(lián)系你來(lái)確保數據質(zhì)量的 。格式等直接問(wèn)他們就可以。通常是SOFT格式。
GEO Database
近年來(lái),利用高通量方法檢測基因表達越來(lái)越普及,諸如微陣列雜交和基因表系列分析(SAGE)可以同時(shí)測量數以萬(wàn)計的基因轉錄腳本(gene transcript)。基因表達大棚車(chē)(GEO:Gene Expression Omnibus)則是歸檔和自由分發(fā)科研人員提交的高通量基因表達數據的公共倉庫。目前,GEO存儲了大約10億單個(gè)基因表達的數據,來(lái)自于100多種生物,內容廣泛涉及到各種生物學(xué)問(wèn)題。這些大容量的數據可以使用用戶(hù)友好的以Web為基礎的工具進(jìn)行有效的挖掘,檢索和可視化表達。
當人類(lèi)基因體定序計劃的重要里程碑完成之后,生命科學(xué)正式邁入了一個(gè)后基因體時(shí)代,基因芯片 (microarray) 的出現讓研究人員得以宏觀(guān)的視野來(lái)探討分子機轉。
不過(guò)分析是相當復雜的學(xué)問(wèn),正因為基因芯片成千上萬(wàn)的信息使得分析數據量龐大,更需要應用到生物統計與生物信息相關(guān)軟件的協(xié)助。要取得一完整的數據結果,除了前端的實(shí)驗設計與操作的無(wú)暇外,如何以精確的分析取得可信數據,運籌帷幄于方寸之間,更是畫(huà)龍點(diǎn)睛的關(guān)鍵。
?0?2基因芯片的應用基因芯片可以同時(shí)針對生物體內數以千計的基因進(jìn)行表現量分析,對于科學(xué)研究者而言,不論是細胞的生命周期、生化調控路徑、蛋白質(zhì)交互作用關(guān)系等等研究,或是藥物研發(fā)中對于藥物作用目標基因的篩選,到臨床的疾病診斷預測,都為基因芯片可以發(fā)揮功用的范疇。?0?2基因表現圖譜抓取了時(shí)間點(diǎn)當下所有的動(dòng)態(tài)基因表現情形,將所有的探針所代表的基因與熒光強度轉換成基本數據 (raw data) 后,仿如尚未解密前的達文西密碼,隱藏的奧秘由絲絲的線(xiàn)索串聯(lián)綿延,有待專(zhuān)家抽絲剝繭,如剝洋蔥般從外而內層層解析出數千數萬(wàn)數據下的隱晦含義。
?0?2要獲得有意義的分析結果,恐怕不能如潑墨畫(huà)般灑脫隨興所致。從 raw data 取得后,需要一連貫的分析流程 (圖一),經(jīng)過(guò)許多統計方法,才能條清理明的將 raw data 整理出一初步的分析數據,當處理到取得實(shí)驗組除以對照組的對數值后 (log2 ratio),大約完成初步的統計工作,可進(jìn)展到下一步的進(jìn)階分析階段。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.171秒