科學(xué)家利用遷移學(xué)習(xí)建立計(jì)算大模型預(yù)測基因調(diào)控研究
日期: 2023年07月10日 17:29 來源:科技部生物中心
基因網(wǎng)絡(luò)繪制需要大量轉(zhuǎn)錄組數(shù)據(jù)用于建立基因之間的聯(lián)系,這也阻礙了一些數(shù)據(jù)有限場景(如罕見。┑妊芯。最近,利用遷移學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù)在自然語言和計(jì)算機(jī)視覺等領(lǐng)域帶來了變革性進(jìn)展,其通過在大規(guī)模通用數(shù)據(jù)集上進(jìn)行大模型預(yù)訓(xùn)練,而后遷移到數(shù)據(jù)量有限的特定任務(wù)進(jìn)行微調(diào)。美國博德研究所等研究團(tuán)隊(duì)提出了一個(gè)深度學(xué)習(xí)模型Geneformer可實(shí)現(xiàn)特定生物學(xué)任務(wù)與背景中的預(yù)測。該研究成果于近日發(fā)表在《Nature》雜志上,題為:Transfer learning enables predictions in network biology!
研究人員開發(fā)的深度學(xué)習(xí)模型Geneformer,在大約3000萬個(gè)單細(xì)胞轉(zhuǎn)錄組的大規(guī)模數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練,以便在網(wǎng)絡(luò)生物學(xué)有限數(shù)據(jù)的情況下進(jìn)行特異性預(yù)測。在預(yù)訓(xùn)練期間,Geneformer獲得了對(duì)網(wǎng)絡(luò)動(dòng)態(tài)的基本理解,以完全自我監(jiān)督的方式在模型的注意力權(quán)重中編碼網(wǎng)絡(luò)層次。研究人員利用Geneformer基于下游有限數(shù)據(jù)進(jìn)行了預(yù)測任務(wù),包括“疾病候選靶點(diǎn)預(yù)測”“解釋拷貝數(shù)變異”“關(guān)鍵基因網(wǎng)絡(luò)調(diào)控因子”“基因網(wǎng)絡(luò)層次編碼”“染色質(zhì)動(dòng)力學(xué)預(yù)測”等,并通過實(shí)驗(yàn)支持了其預(yù)測的結(jié)果!
綜上,Geneformer代表了一種預(yù)訓(xùn)練的深度學(xué)習(xí)模型,可以對(duì)其進(jìn)行微調(diào),以實(shí)現(xiàn)廣泛的下游應(yīng)用,加速發(fā)現(xiàn)網(wǎng)絡(luò)調(diào)節(jié)關(guān)鍵環(huán)節(jié)和候選治療目標(biāo)!
注:此研究成果摘自《Nature》雜志,文章內(nèi)容不代表本網(wǎng)站觀點(diǎn)和立場,僅供參考。
|