近日,哈爾濱工業(yè)大學(xué)數(shù)學(xué)學(xué)院靳水林教授團(tuán)隊(duì)在單細(xì)胞測(cè)序數(shù)據(jù)建模與分析領(lǐng)域取得重要進(jìn)展,解決了多生物來(lái)源數(shù)據(jù)整合建模的關(guān)鍵問(wèn)題。研究成果發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》(PNAS)上。
單細(xì)胞數(shù)據(jù)整合旨在通過(guò)消除數(shù)據(jù)中的批次效應(yīng),以融合不同實(shí)驗(yàn)批次的單細(xì)胞測(cè)序數(shù)據(jù),對(duì)胚胎發(fā)育、組織功能及疾病機(jī)制等研究具有重要意義。針對(duì)相關(guān)難題,靳水林教授團(tuán)隊(duì)提出了一種多源生物變異的數(shù)據(jù)整合新模型——組中心化主成分分析。該模型首次定義了多生物來(lái)源數(shù)據(jù)的組技術(shù)變異,利用生物來(lái)源的總體變異和批次內(nèi)變異估計(jì)批次效應(yīng),構(gòu)建了組技術(shù)變異最小化的優(yōu)化模型,進(jìn)而在保留多源生物變異條件下對(duì)數(shù)據(jù)進(jìn)行了整合,取得了優(yōu)良效果。該研究為多生物來(lái)源單細(xì)胞測(cè)序數(shù)據(jù)的有效整合提供了高效、可靠的數(shù)學(xué)模型。