2020年11月9日,中國(guó)醫(yī)學(xué)科學(xué)院系統(tǒng)醫(yī)學(xué)研究中心蘇州系統(tǒng)醫(yī)學(xué)研究所蔣太交研究員團(tuán)隊(duì)在《Briefings in Bioinformatics》發(fā)表了“DeepSSV: detecting somatic small variants in paired tumor and normal sequencing data with convolutional neural network”論文,報(bào)道了一個(gè)用于識(shí)別癌癥相關(guān)短序列突變位點(diǎn)的基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)方法。
癌癥研究的終極目標(biāo)是個(gè)體化精準(zhǔn)醫(yī)療,需要使用識(shí)別算法準(zhǔn)確判別癌癥相關(guān)突變。目前基于統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法的識(shí)別算法只考慮有限的比對(duì)特性,并不能包含潛在突變位點(diǎn)上下游的基因組區(qū)域的比對(duì)特性,而卷積神經(jīng)網(wǎng)絡(luò)相對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí)算法具有特征學(xué)習(xí)能力優(yōu)勢(shì)。本研究基于腫瘤和正常細(xì)胞測(cè)序數(shù)據(jù)的混合文件,構(gòu)建一個(gè)二維矩陣作為卷積神經(jīng)網(wǎng)絡(luò)模型的輸入,然后用訓(xùn)練好的模型預(yù)測(cè)潛在突變位點(diǎn)是否是癌癥相關(guān)的突變位點(diǎn)的概率。測(cè)試結(jié)果表明,相比于基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的識(shí)別算法,DeepSSV的預(yù)測(cè)性能得到了顯著提高。

圖:DeepSSV工作流程
本研究工作得到中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)與健康科技創(chuàng)新工程(2016-I2M-1-005, 2020-I2M-2-003)等項(xiàng)目的資助;蘇州系統(tǒng)醫(yī)學(xué)研究所蔣太交研究員為論文通訊作者,孟靜博士為論文的第一作者。
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbaa272/5960414?guestAccessKey=4a9111e2-d9d4-44b1-9488-6b07d254fc12