国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

虛擬細胞研究正在爆發(fā):20篇CNS論文系統(tǒng)解讀,現(xiàn)在學(xué)還來得及

0
分享至

過去,單細胞數(shù)據(jù)分析的天花板,往往只是差異分析和細胞注釋。數(shù)據(jù)做完了,圖也畫全了,但真正決定文章層次的“機制深度”和“創(chuàng)新表達”,卻始終上不去。

虛擬細胞AI 大模型的出現(xiàn),正在把這層天花板徹底打開。它讓單細胞數(shù)據(jù)不再只是“看見細胞”,而是能夠進一步走向虛擬敲除、RNA 預(yù)測蛋白、空間推斷、調(diào)控網(wǎng)絡(luò)構(gòu)建、藥物響應(yīng)模擬和機制延伸,推動課題從“描述現(xiàn)象”躍升到“預(yù)測機制”,從而更容易形成高分文章真正需要的新意和深度。

更重要的是,虛擬細胞+AI大模型方向正處在最明顯的技術(shù)紅利期:CSN 頂刊和子刊密集發(fā)表、方法快速爆發(fā)、創(chuàng)新空間巨大、發(fā)高質(zhì)量文章窗口剛剛打開。

01

課程特色

1.跟著二十篇CNS頂刊,系統(tǒng)學(xué)習(xí)和復(fù)現(xiàn)虛擬細胞
不是零散講概念,而是站在頂刊高度系統(tǒng)拆解虛擬細胞方向的核心模型、創(chuàng)新邏輯與發(fā)文路徑。

2.課程全面系統(tǒng),徹底掌握虛擬細胞各領(lǐng)域概念
從AI基礎(chǔ)大模型到虛擬擾動預(yù)測,從RNA到蛋白翻譯到空間虛擬敲除,再到多尺度微環(huán)境建模與方法評估,幫助你建立完整知識框架。

3.不是只教跑代碼,而是結(jié)合頂刊AI大模型活用手頭數(shù)據(jù)
不只是學(xué)會幾個AI大模型的工具,而是真正知道不同方法適合什么數(shù)據(jù)、能解決什么問題、能支撐什么創(chuàng)新。

4.虛擬細胞技術(shù)紅利期,直接服務(wù)高分文章
幫助你把已有單細胞數(shù)據(jù)挖得更深,把現(xiàn)有課題做得更高,發(fā)真正高質(zhì)量的文章。

02

課程核心模塊

課程總體分為八個模塊:

模塊一:虛擬細胞基礎(chǔ)大模型
系統(tǒng)理解虛擬細胞最核心的基礎(chǔ)模型框架。帶大家學(xué)習(xí)虛擬細胞為什么會成為單細胞與AI大模型結(jié)合的重要方向,掌握基礎(chǔ)模型的基本思想、任務(wù)定義與應(yīng)用場景,為后續(xù)所有進階內(nèi)容打下底層認知基礎(chǔ)。

模塊二:網(wǎng)絡(luò)生物學(xué)預(yù)測(轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò))
從單純看表達,進一步走向網(wǎng)絡(luò)層面的理解。通過前沿模型學(xué)習(xí)如何從序列、表達和表觀遺傳等信息中,挖掘更深層次的調(diào)控關(guān)系與網(wǎng)絡(luò)結(jié)構(gòu),理解虛擬細胞如何幫助我們從“看見細胞狀態(tài)”升級到“推斷調(diào)控邏輯”。

模塊三:scRNA-seq 虛擬蛋白組
聚焦單細胞轉(zhuǎn)錄組到蛋白組的跨模態(tài)預(yù)測,理解如何利用大模型從 RNA 信息進一步翻譯出蛋白表達層面的結(jié)果。這個模塊非常適合啟發(fā)大家如何把現(xiàn)有 scRNA-seq 數(shù)據(jù)繼續(xù)往更深層次挖掘,拓展新的分析維度和文章空間。

模塊四:基因擾動預(yù)測(虛擬敲除)
這是虛擬細胞最具想象力、也最具發(fā)文潛力的核心方向之一。課程會系統(tǒng)講解從單基因擾動到組合擾動、從虛擬敲除到藥物響應(yīng)模擬的主流思路,讓大家真正理解虛擬細胞如何把單細胞數(shù)據(jù)從“描述現(xiàn)象”推進到“預(yù)測干預(yù)結(jié)果”。

模塊五:空間微環(huán)境與多尺度虛擬細胞
從單細胞進一步走向空間組織層面,理解虛擬細胞如何與空間組學(xué)結(jié)合,分析細胞間通訊、微環(huán)境變化與空間擾動效應(yīng)。這個模塊重點體現(xiàn)虛擬細胞從單個細胞狀態(tài)預(yù)測,擴展到組織、微環(huán)境乃至個體層面的多尺度建模能力。

模塊六:形態(tài)學(xué)擾動預(yù)— 從轉(zhuǎn)錄組到細胞圖像
聚焦從分子信息走向細胞形態(tài)學(xué)變化的預(yù)測,理解虛擬細胞如何連接轉(zhuǎn)錄組、藥物擾動與細胞圖像。這一部分能夠幫助大家打開跨模態(tài)研究思路,看到虛擬細胞不僅能預(yù)測表達變化,也能進一步預(yù)測表型變化。

模塊七:擾動動力學(xué)
不僅預(yù)測“擾動后會不會變”,還進一步理解“擾動后如何動態(tài)變化”。課程會帶大家認識發(fā)育軌跡、擾動響應(yīng)、細胞命運轉(zhuǎn)變等動態(tài)預(yù)測思路,讓虛擬細胞從靜態(tài)分析走向更高層次的時間維度模擬。

模塊八:評估與基準(zhǔn)測試
真正高質(zhì)量的虛擬細胞研究,不只是會跑模型,更重要的是知道結(jié)果是否靠譜、方法如何比較、不同任務(wù)下該如何選模型。本模塊會系統(tǒng)講解擾動預(yù)測與虛擬細胞分析中的評估框架、常用指標(biāo)和方法選擇邏輯,幫助大家建立更扎實、更規(guī)范的研究思維。

03

課程具體內(nèi)容

模塊一:虛擬細胞的基礎(chǔ)模型

1GET Foundation:GET (Gene Expression Transformer) 是一個從 DNA 可及性(ATAC)預(yù)測基因表達的基礎(chǔ)模型。它將細胞類型特異的表觀遺傳學(xué)信號與基因組序列結(jié)合,學(xué)習(xí)跨細胞類型的轉(zhuǎn)錄調(diào)控模式。Nature主刊

模型實現(xiàn)的功能

1. PBMC 微調(diào)與 GRN 推斷:在 PBMC 數(shù)據(jù)上微調(diào),推斷基因調(diào)控網(wǎng)絡(luò)

2. ATAC 評估:預(yù)測 ATAC-seq 可及性信號

3. 星形膠質(zhì)細胞推斷:跨細胞類型的基因表達預(yù)測

4. Motif-ATAC 預(yù)測:轉(zhuǎn)錄因子結(jié)合 motif 的可及性預(yù)測

課程內(nèi)容:

1.模型微調(diào)與GRN:① 加載 GET 預(yù)訓(xùn)練模型 ② 加載 PBMC 微調(diào) checkpoint ③ 推理基因表達 ④ 提取注意力矩陣 ⑤ 構(gòu)建 GRN(含 R pcalg 因果分析)

2.模型ATAC 預(yù)測評估:① 加載 ATAC 預(yù)測模型 ② 預(yù)測 TSS 可及性 ③ 評估 Pearson 相關(guān) ④ 可視化預(yù)測 vs 真實

3.模型細胞推斷:① 加載星形膠質(zhì)細胞數(shù)據(jù) ② 跨細胞類型表達推斷 ③ 比較不同細胞類型表達模式

4.模型Motif-ATAC預(yù)測:① TF 結(jié)合 motif 分析 ② Motif-ATAC 可及性預(yù)測 ③ 已知 TF motif 驗證


第2講scGPT :是一個基于 Transformer 的單細胞基礎(chǔ)模型,在 3300 萬個單細胞數(shù)據(jù)上預(yù)訓(xùn)練。它使用生成式預(yù)訓(xùn)練范式(類似 GPT),通過注意力掩碼的基因表達預(yù)測任務(wù)來學(xué)習(xí)細胞和基因的通用表示。該模型可以通過微調(diào)用于多種下游任務(wù)。Nature Methods

模型實現(xiàn)的功能

1. 細胞類型注釋 — 使用預(yù)訓(xùn)練模型微調(diào)后對未見過的細胞進行分類

2. 批次整合 — 消除不同實驗批次間的技術(shù)變異

3. 基因擾動預(yù)測 — 預(yù)測基因敲除后的轉(zhuǎn)錄組變化

4. 基因調(diào)控網(wǎng)絡(luò)推斷 — 通過基因嵌入和注意力矩陣推斷 GRN

課程內(nèi)容:

1.細胞注釋:① 加載預(yù)訓(xùn)練 scGPT 模型 ② 加載微調(diào)后的注釋 checkpoint ③ 對 PBMC 10K 數(shù)據(jù)推理 ④ 預(yù)測細胞類型標(biāo)簽 ⑤ 生成混淆矩陣 ⑥ 計算準(zhǔn)確率指標(biāo)

2.批次整合:① 加載 Immune_ALL_human 多批次數(shù)據(jù) ② 加載微調(diào)后整合模型 ③ 生成細胞嵌入 ④ UMAP 可視化批次效應(yīng)消除 ⑤ 計算 batch mixing 指標(biāo)

3.擾動預(yù)測:① 加載 Adamson Perturb-seq 數(shù)據(jù) ② 加載擾動微調(diào) checkpoint ③ 預(yù)測基因敲除后表達變化 ④ 計算 Pearson 相關(guān)系數(shù) ⑤ 比較預(yù)測 vs 真實表達

4.GRN嵌入:① 加載基因嵌入矩陣 ② 計算基因間余弦相似度 ③ 構(gòu)建基因調(diào)控網(wǎng)絡(luò) ④ 可視化網(wǎng)絡(luò)拓撲 ⑤ 與已知 TF-target 關(guān)系對比。


模塊二 :網(wǎng)絡(luò)生物學(xué)預(yù)測--轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)

第3講AlphaGenome是 Google DeepMind 開發(fā)的統(tǒng)一 DNA 序列模型,能從 DNA 序列同時預(yù)測多種基因組特征(表達、可及性、甲基化、組蛋白修飾等)。Nature主刊

模型實現(xiàn)的功能

1. 多模態(tài)預(yù)測:從 DNA 序列預(yù)測 7000+ 個基因組 track

2. 變異效應(yīng)評估: 評估 SNP 對基因組特征的影響

課程內(nèi)容:

1.AlphaGenome快速入門與多模態(tài)預(yù)測:① 加載 AlphaGenome 模型(~450M params) ② 輸入 DNA 序列 ③ 預(yù)測多種基因組 track ④ 可視化預(yù)測結(jié)果 ⑤ 復(fù)現(xiàn) 5 個關(guān)鍵論文圖

2.AlphaGenome的變異效應(yīng)評估基準(zhǔn):① 加載 19 個預(yù)計算評估基準(zhǔn) ② AUROC/AUPRC/Spearman 評估 ③ 與其他模型對比


第4講scPRINT:scPRINT 在 5000 萬個單細胞上預(yù)訓(xùn)練的大規(guī)模 Transformer 模型,支持零樣本(無需微調(diào))的多種下游任務(wù)。【NC

模型實現(xiàn)的功能

1. 細胞嵌入與零樣本分類:不需要微調(diào)即可嵌入和分類細胞

2. GRN 推斷:通過注意力矩陣推斷基因調(diào)控網(wǎng)絡(luò)

3. 去噪與表達恢復(fù):恢復(fù) dropout 造成的零值

課程內(nèi)容:

1.細胞嵌入與零樣本預(yù)測:① 加載 scPRINT medium-v1.5 模型 ② 零樣本細胞嵌入 ③ UMAP 可視化 ④ kNN 分類準(zhǔn)確率 ⑤ 混淆矩陣

2.GRN推斷:① 提取注意力矩陣 ② 構(gòu)建基因調(diào)控網(wǎng)絡(luò) ③ GRN 熱力圖 ④ 網(wǎng)絡(luò)圖可視化 ⑤ 與已知 TF 對比

3.去噪與表達恢復(fù):① 表達值去噪 ② 散點圖對比 ③ 分布對比 ④ marker 基因熱力圖


模塊三 :scRNAseq 虛擬蛋白組

第5scTranslator使用Performer FAVOR+ 架構(gòu),從單細胞轉(zhuǎn)錄組(RNA)直接預(yù)測蛋白質(zhì)組(protein)表達。117M 參數(shù),在 200 萬個細胞上預(yù)訓(xùn)練。Nature Biomedical Engineering

課程內(nèi)容:

1.蛋白質(zhì)豐度預(yù)測:① 加載 scTranslator 模型(117M params, 449MB) ② RNA→Protein 翻譯推理 ③ 預(yù)測 vs 真實蛋白質(zhì)豐度對比 ④ Pearson 相關(guān)評估

2.偽基因敲除與下游分析:① 模擬基因敲除(置零) ② 預(yù)測蛋白質(zhì)組變化 ③ 差異蛋白分析 ④ 聚類可視化


模塊四 :基因擾動預(yù)測:從單基因到組合CRISPR 虛擬敲除

第6講STATE:是 ARC Institute 開發(fā)的擾動響應(yīng)預(yù)測基礎(chǔ)模型,在 Replogle 等大規(guī)模 Perturb-seq 數(shù)據(jù)集上預(yù)訓(xùn)練。支持 few-shot 預(yù)測未見過的基因擾動。bioRxiv

課程內(nèi)容:

1.數(shù)據(jù)加載與架構(gòu)介紹:① K562 評估數(shù)據(jù)加載 ② 擾動分布可視化 ③ 表達對比(擾動 vs 對照) ④ PCA 可視化

2.擾動響應(yīng)預(yù)測:① 加載 ST-HVG-Replogle 模型(10M params) ② 推理預(yù)測 ③ DE 基因?qū)Ρ?④ Pearson r 評估

3.結(jié)果分析與可視化:① 熱力圖可視化 ② 通路聚類分析 ③ 預(yù)測方向分析

第7講dbDiffusion :dbDiffusion 使用 VAE + 擴散模型的組合來預(yù)測基因擾動后的轉(zhuǎn)錄組變化,并通過去偏差技術(shù)消除觀測數(shù)據(jù)中的混雜因素偏差。【PNAS】

課程內(nèi)容:

1.數(shù)據(jù)探索與擾動聚類:① 加載 Yao Perturb-seq 數(shù)據(jù)(8000 cells) ② PCA + Leiden 聚類 ③ UMAP 可視化

2.擴散模型采樣與可視化:加載 VAE(22MB) + Diffusion(20MB) 模型 ② 擴散采樣生成 ③ VAE 解碼 ④ UMAP 對比

3.去偏差推斷與評估:① PPI 網(wǎng)絡(luò)去偏 ② 置信區(qū)間估計 ③ 火山圖可視化

第8講GEARS :GEARS 使用圖神經(jīng)網(wǎng)絡(luò)(GNN) 結(jié)合知識圖譜預(yù)測單基因和組合基因擾動后的轉(zhuǎn)錄組變化。創(chuàng)新點是能預(yù)測未見過的基因組合的協(xié)同效應(yīng)。Nature Biotechnology

課程內(nèi)容:

1.數(shù)據(jù)加載與探索:① 加載 Norman K562 數(shù)據(jù)(降采樣版) ② 擾動條件統(tǒng)計 ③ UMAP 可視化 ④ 數(shù)據(jù)分割分析

2.擾動預(yù)測推理:① 加載 GEARS 模型(8.9MB) ② 單基因擾動預(yù)測 ③ 組合擾動預(yù)測 ④ Top 20 DE 基因 MSE ⑤ GI 分析

3.模型評估與可視化:① 全數(shù)據(jù)集評估 ② Pearson 相關(guān)(0.987) ③ MSE/方向錯誤率 ④ 子組對比(1-gene vs 2-gene)

第9講Prnet:是一個條件 VAE (CVAE) 模型,對Bulk進行基因擾動,PRnet 利用藥物分子結(jié)構(gòu)(SMILES→Morgan Fingerprint)和基因表達數(shù)據(jù),預(yù)測新化合物處理后的轉(zhuǎn)錄組變化。NC

模型實現(xiàn)的功能:

1. LINCS L1000 數(shù)據(jù)探索:大規(guī);衔飻_動數(shù)據(jù)集 + SMILES 編碼

2. 藥物擾動響應(yīng)預(yù)測:預(yù)測新化合物的轉(zhuǎn)錄效應(yīng)

3. 潛在空間與連接性分析:藥物嵌入 t-SNE + 連接性評分

課程內(nèi)容:

1.數(shù)據(jù)加載與PRnet架構(gòu)介紹:① LINCS L1000 demo 數(shù)據(jù)(681 cells, 978 genes, 350 drugs) ② SMILES 編碼展示 ③ Morgan Fingerprint 生成 ④ PRnet CVAE 架構(gòu)

2.藥物擾動響應(yīng)預(yù)測:① 加載預(yù)訓(xùn)練 PRnet(0.5M-2.5M params) ② 推理預(yù)測 ③ R2/Pearson 評估 ④ 散點圖

3.潛在空間與藥物嵌入分析:① 潛在空間 t-SNE ② 余弦相似度熱力圖 ③ 連接性評分


第10講scTenifoldKnk:基因調(diào)控網(wǎng)絡(luò)(GRN)的拓撲結(jié)構(gòu)隱含了基因之間的功能依賴,刪除某基因會改變網(wǎng)絡(luò)平衡。因此,只要有 WT 的單細胞轉(zhuǎn)錄組,就能構(gòu)建一個 GRN,并虛擬刪除目標(biāo)基因,再觀察全局擾動。Patterns

課程內(nèi)容:

1.通過 PC 回歸+ tensor decomposition 構(gòu)建去噪 GRN

2.虛擬 KO =人為將基因的調(diào)控影響“清零”

3.流形對齊揭示 KO 前后每個基因的擾動程度

第11講scGen:是一個基于變分自編碼器(VAE)的單細胞擾動預(yù)測模型,核心思想是在低維潛在空間中學(xué)習(xí)細胞狀態(tài)變化,再通過向量運算(vector arithmetics)來模擬刺激、感染、藥物處理或基因擾動帶來的轉(zhuǎn)錄組響應(yīng)。Nature Methods

模型實現(xiàn)的功能:
1. 擾動響應(yīng)預(yù)測:根據(jù)對照組細胞,預(yù)測刺激、感染、藥物處理或基因敲除后的表達變化
2. 跨細胞類型泛化:訓(xùn)練時未見過的細胞類型,也可以推測其受擾動后的狀態(tài)
3. 跨研究預(yù)測可把一個研究中學(xué)到的刺激效應(yīng),遷移到另一個只有對照組的數(shù)據(jù)集中
4. 跨物種預(yù)測:可結(jié)合物種差異向量與擾動差異向量,推斷另一物種的擾動響應(yīng)

課程內(nèi)容:

1. 模型原理:① 理解 VAE 編碼器—解碼器結(jié)構(gòu) ② 理解 scGen 如何在潛在空間中學(xué)習(xí)擾動向量 δ ③ 掌握“對照細胞 + 擾動向量 = 預(yù)測擾動細胞”的核心思想 ④ 理解為什么 scGen 適合做單細胞擾動外推預(yù)測。

2. 擾動預(yù)測:① 加載單細胞數(shù)據(jù) ② 訓(xùn)練 scGen 模型學(xué)習(xí)潛在空間表示 ③ 估計擾動差異向量 ④ 對未見細胞類型進行擾動狀態(tài)預(yù)測 ⑤ 比較預(yù)測表達與真實表達 ⑥ 計算 Pearson 相關(guān)或 R2 等指標(biāo)評估預(yù)測效果

3. 感染響應(yīng)預(yù)測:① 加載感染數(shù)據(jù) ② 學(xué)習(xí)感染前后狀態(tài)變化 ③ 預(yù)測未見細胞群感染后的表達譜 ④ 比較 top DEGs 與整體表達相關(guān)性

4. 跨研究遷移:① 以研究A中“對照+刺激”數(shù)據(jù)訓(xùn)練模型 ② 導(dǎo)入研究B中僅有對照的數(shù)據(jù) ③ 將研究A學(xué)到的刺激效應(yīng)遷移到研究B ④ 預(yù)測研究B細胞若被刺激后會呈現(xiàn)的表達狀態(tài) ⑤ 檢查關(guān)鍵響應(yīng)基因是否被成功恢復(fù)。

12講GenKI:是一個基于變分圖自編碼器(VGAE)的虛擬基因敲除推斷方法,專門用于在只有野生型(WT)單細胞轉(zhuǎn)錄組數(shù)據(jù)、沒有真實敲除樣本的情況下,預(yù)測某個基因被敲除后可能引起的轉(zhuǎn)錄組變化。NAR

模型實現(xiàn)的功能:

1.虛擬基因敲除推斷:在沒有真實 KO 樣本時,直接基于 WT scRNA-seq 數(shù)據(jù)模擬目標(biāo)基因敲除效應(yīng)。

2.KO 響應(yīng)基因識別:通過比較 WT 與虛擬 KO 狀態(tài)下的潛在分布差異,篩選受擾動最顯著的基因。

3.基因調(diào)控網(wǎng)絡(luò)輔助解析:將基因表達信息與 scGRN 共同建模,比單純做差異分析更容易抓到功能關(guān)聯(lián)基因。

4.雙基因敲除模擬:不僅可做單基因 KO,還可進一步擴展到雙基因聯(lián)合敲除效應(yīng)預(yù)測。

課程內(nèi)容:

1.虛擬敲除基礎(chǔ)分析:① 加載 WT 單細胞表達矩陣 ② 構(gòu)建單細胞基因調(diào)控網(wǎng)絡(luò)(scGRN) ③ 訓(xùn)練 GenKI 的 VGAE 模型 ④ 設(shè)定目標(biāo)基因進行虛擬敲除 ⑤ 計算 WT 與虛擬 KO 的潛在分布差異 ⑥ 輸出 KO-responsive genes 排名。

2.模型原理與訓(xùn)練:① 理解 GenKI 如何聯(lián)合表達矩陣和調(diào)控網(wǎng)絡(luò)建模 ② 學(xué)習(xí) VGAE 編碼器—解碼器結(jié)構(gòu) ③ 掌握 KL divergence 在 KO 響應(yīng)基因識別中的作用 ④ 了解 bagging 提高結(jié)果穩(wěn)定性的思路。

3.功能富集與網(wǎng)絡(luò)解釋:① 對 KO-responsive genes 做 GO/通路富集 ② 構(gòu)建 STRING 蛋白互作網(wǎng)絡(luò) ③ 從功能模塊角度解釋目標(biāo)基因作用 ④ 比較預(yù)測結(jié)果與已知文獻結(jié)論的一致性。


模塊五 :空間微環(huán)境與多尺度虛擬細胞 — 前沿與展望

第13講Celcomen:在空間分辨率下進行因果解耦建模,利用空間轉(zhuǎn)錄組數(shù)據(jù)(如 10x Xenium)學(xué)習(xí)細胞間通訊的因果結(jié)構(gòu),然后預(yù)測虛擬擾動的空間效應(yīng)。由 CCE (Causal Cell-cell Effect) + SCE (Spatial Causal Effect) 兩個模塊組成。NC

模型實現(xiàn)的功能:空間轉(zhuǎn)錄組中的預(yù)測基因或細胞擾動后空間組織改變,細胞被敲掉一個基因后,周圍組織會發(fā)生什么?

課程內(nèi)容:

1.環(huán)境驗證與空間數(shù)據(jù)探索:① 10x Xenium GBM 數(shù)據(jù)(1781 cells × 473 genes) ② 空間坐標(biāo)可視化 ③ 細胞類型分布

2.模擬數(shù)據(jù)自一致性驗證:① 生成模擬數(shù)據(jù) ② 自一致性檢驗 ③ 因果發(fā)現(xiàn)驗證

3.空間因果推斷與擾動分析:① CCE 因果推斷(CPU ~2s) ② 加載 GPU 訓(xùn)練的 SCE 權(quán)重 ③ 空間擾動預(yù)測 ④ 因果效應(yīng)可視化

第14講Nicheformer:是一個 49.3M 參數(shù)的 Transformer Encoder 基礎(chǔ)模型,在單細胞和空間轉(zhuǎn)錄組數(shù)據(jù)上聯(lián)合預(yù)訓(xùn)練。支持零樣本的細胞嵌入、標(biāo)簽遷移、空間標(biāo)簽預(yù)測等任務(wù)。【Nature Methods】

模型實現(xiàn)的功能:從基因表達預(yù)測細胞的空間位置

課程內(nèi)容:

1.環(huán)境驗證與數(shù)據(jù)探索:① 模型架構(gòu)介紹 ② PBMC 樣本數(shù)據(jù)加載 ③ 基因詞表對齊

2.Embedding生成與可視化:① HuggingFace from_pretrained 加載 ② 細胞嵌入提取 ③ UMAP 可視化 ④ 多層嵌入對比

3.空間標(biāo)簽預(yù)測與遷移:① 零樣本標(biāo)簽預(yù)測 ② kNN 標(biāo)簽遷移 ③ 評估準(zhǔn)確率


第15講PULSAR:多尺度虛擬細胞架構(gòu),從單細胞表達→群體(multicellular)嵌入→個體(patient)級別表示。支持零樣本的年齡回歸、疾病分類、供體檢索等個體級別任務(wù)。bioRxiv

課程內(nèi)容:

1.環(huán)境驗證與模型探索:① PULSAR-pbmc 模型(87.4M params) ② 架構(gòu)探索 ③ 參數(shù)統(tǒng)計

2.零樣本年齡回歸預(yù)測:① OneK1K 數(shù)據(jù)(80 donors, 4000 cells) ② 供體嵌入生成 ③ 年齡回歸預(yù)測 ④ MAE/R2 評估

3.疾病分類與供體檢索:① Lupus 數(shù)據(jù)(60 donors, 4800 cells) ② SLE 疾病分類 ③ DONORxEMBED 供體檢索 ④ AUROC 評估

第16講Tahoe-100M:是目前最大的單細胞化學(xué)擾動數(shù)據(jù)集,包含 1 億個單細胞、1100 種藥物、50 種癌癥細胞系。這是一篇數(shù)據(jù)資源論文,重點是數(shù)據(jù)集分析而非模型訓(xùn)練。bioRxiv

課程內(nèi)容:

1.數(shù)據(jù)集概覽與實驗設(shè)計:① 實驗設(shè)計(50細胞系×1100藥物) ② 元數(shù)據(jù)統(tǒng)計 ③ 藥物/細胞系分布

2.轉(zhuǎn)錄組景觀與批次效應(yīng):① UMAP 嵌入(預(yù)計算) ② 批次效應(yīng)分析 ③ E-distance ④ 細胞周期

3.藥物響應(yīng)機制與前沿展望:① DE 基因分析(pseudobulk) ② 藥物機制歸類 ③ Tahoe-x1 模型介紹


模塊六 :形態(tài)學(xué)擾動預(yù)測 — 從轉(zhuǎn)錄組到細胞圖像

第17講IMPA:基于 StarGANv2 的 GAN 風(fēng)格遷移模型,從細胞熒光顯微鏡圖像預(yù)測藥物擾動導(dǎo)致的細胞形態(tài)變化。使用 Morgan Fingerprint 嵌入實現(xiàn) zero-shot 泛化到未見過的藥物。【NC】

模型實現(xiàn)的功能:從轉(zhuǎn)錄組到細胞圖像

課程內(nèi)容:

1.環(huán)境驗證與數(shù)據(jù)探索:① BBBC021 數(shù)據(jù)集探索 ② 6種藥物處理 ③ 細胞形態(tài)統(tǒng)計

2.藥物擾動形態(tài)預(yù)測:① 加載 StarGANv2 模型 ② 6種已知藥物的形態(tài)預(yù)測 ③ 生成vs真實對比

3.未知藥物預(yù)測與擾動空間:① Zero-shot 未知藥物預(yù)測 ② PCA 形態(tài)學(xué)空間分析


模塊七 :擾動動力學(xué) — 從靜態(tài)預(yù)測到時間軌跡模擬

第18講Squidiff:使用條件 DDIM 擴散模型預(yù)測單細胞轉(zhuǎn)錄組的動態(tài)變化(發(fā)育軌跡 + 擾動響應(yīng) + 藥物組合效應(yīng))【Nature Methods】

課程內(nèi)容:

1.模擬數(shù)據(jù)與擴散過程:① 模擬數(shù)據(jù)生成 ② 擴散過程可視化 ③ DDIM 采樣 ④ 模型訓(xùn)練(CPU ~4.5min)

2.基因擾動預(yù)測:① 加載擾動模型(197MB) ② 基因敲除預(yù)測 ③ 預(yù)測 vs 真實對比

3.藥物組合效應(yīng)預(yù)測:① 加載藥物模型 ② 單藥/組合藥效預(yù)測 ③ 協(xié)同效應(yīng)分析

第19講CellOracle:通過線性回歸構(gòu)建基因調(diào)控網(wǎng)絡(luò)(GRN),然后模擬轉(zhuǎn)錄因子(TF)敲除對細胞狀態(tài)的影響。純 CPU 計算(無神經(jīng)網(wǎng)絡(luò)),基于統(tǒng)計方法。【Nature主刊】

課程內(nèi)容:

1.環(huán)境驗證與數(shù)據(jù)探索:① CellOracle 安裝驗證 ② Paul 2015 造血數(shù)據(jù)加載 ③ 細胞分群可視化

2.GRN構(gòu)建與網(wǎng)絡(luò)分析:① 基于 scATAC 的 base GRN 構(gòu)建 ② 線性回歸 GRN 擬合 ③ 網(wǎng)絡(luò)連接度分析

3.TF擾動模擬與可視化:① Gata1 KO 模擬 ② Spi1 KO 模擬 ③ 擾動效應(yīng)可視化 ④ 細胞命運轉(zhuǎn)換分析


模塊八 :評估與基準(zhǔn)測試 — 如何判斷擾動預(yù)測靠不靠譜?

第20講scPerturBench:對 27 種擾動預(yù)測方法在 29 個數(shù)據(jù)集上進行了系統(tǒng)評估,使用 6 種評估指標(biāo),揭示了不同方法在不同場景下的優(yōu)劣勢,并提供了方法選擇決策樹。Nature Methods

課程內(nèi)容:

1.環(huán)境驗證與數(shù)據(jù)探索:① Kang IFN-β 數(shù)據(jù)集 ② 擾動前后對比 ③ 27方法×29數(shù)據(jù)集概覽

2.評估指標(biāo)詳解與實現(xiàn):① MSE ② PCC-delta ③ E-distance ④ Wasserstein ⑤ KL divergence ⑥ Common-DEGs — 6個指標(biāo)從零實現(xiàn)

3.基準(zhǔn)結(jié)果可視化與方法選擇:① 方法排名熱力圖 ② 性能對比 ③ 決策樹可視化


04

課程費用

標(biāo)準(zhǔn)版:2880元 ( 注:轉(zhuǎn)發(fā)朋友圈集贊20個可享受此價;原價3380元)

? 全方位學(xué)習(xí): 直播授課 + 全套錄播(支持無限次回放)

? 教學(xué)答疑: 授課期間專屬學(xué)習(xí)群內(nèi)導(dǎo)師一對一指導(dǎo)

? 配套資源: 全套核心代碼、教學(xué)數(shù)據(jù)、精美講義及大模型授權(quán)碼

永久答疑版(推薦)3880元 ( 注:轉(zhuǎn)發(fā)朋友圈集贊20個可享受此價;原價4380元)

? 標(biāo)準(zhǔn)版全部權(quán)益

? 金牌售后: 七名全職助教團隊,每日 8:00 - 23:00 在線輪班,高效響應(yīng)

? 科研助力: 提供個性化課題設(shè)計建議及數(shù)據(jù)分析一對一指導(dǎo)

? 持續(xù)更新: 優(yōu)先獲取團隊最新研究資料與技術(shù)升級包

組團更優(yōu)惠

兩人同行: 享 9折 優(yōu)惠

三人及以上: 享 85折 巨大折扣

掃碼加微信咨詢課程

也可以搜索微信添加: huage5389

05

機構(gòu)介紹

華哥科研平臺

授課理念:將CNS文章的新技術(shù)學(xué)懂(理解)、學(xué)會(會敲代碼分析)、學(xué)透徹(站在課題頂層設(shè)計角度理解)、學(xué)以致用(用到自己的標(biāo)書申請和文章發(fā)表中)。

初心使命:普及前沿技術(shù),服務(wù)科研一線,賦能創(chuàng)新突破,助推生命科學(xué)進步

主講老師(一)

楊奕濤,東京大學(xué)醫(yī)學(xué)科學(xué)研究所助理教授,日本學(xué)術(shù)振興會(JSPS)特別研究員,長期深耕深度學(xué)習(xí)算法、醫(yī)療AI與空間組學(xué)交叉領(lǐng)域,積累了豐富的科研實踐經(jīng)驗;現(xiàn)致力于多模態(tài)融合、生物醫(yī)學(xué)基礎(chǔ)大模型開發(fā)及轉(zhuǎn)化醫(yī)學(xué)相關(guān)算法研究。發(fā)表Nature Communications等SCI期刊發(fā)表論文多篇;與中日及歐美頂尖計算生物學(xué)實驗室深度合作,參與多項國際前沿科研項目,致力于以人工智能驅(qū)動生命科學(xué)新發(fā)現(xiàn)。

主講老師(二)

張振華,華哥生信創(chuàng)始人,目前在東京大學(xué)從事醫(yī)學(xué)人工智能研究。深耕單細胞多組學(xué)、空間轉(zhuǎn)錄組與機器學(xué)習(xí)領(lǐng)域6年,培養(yǎng)學(xué)員3萬余人 ; 指導(dǎo)學(xué)員發(fā)表CNS主刊文章18篇、一區(qū)及子刊100余篇 ; 參與國自然重點、國家重大專項、孔雀計劃等項目申報;合作院士團隊及國際頂尖實驗室,發(fā)表SCI論文26篇(Sci.Adv、Mol Cell、PNAS、JACS、NC、Cell Rep Med、Mol Cancer、EMBO Mol Med等頂刊)。

06

課程收獲

1. 跟著二十篇頂刊系統(tǒng)掌握虛擬細胞完整框架
跟著二十篇CNS級頂刊系統(tǒng)學(xué)習(xí)和復(fù)現(xiàn)虛擬細胞,收獲對虛擬細胞方向形成全面、系統(tǒng)、成體系的認識。真正弄清楚虛擬細胞各大方向分別在做什么、解決什么問題、適合什么數(shù)據(jù)、能夠支撐什么創(chuàng)新。

2. 學(xué)會把虛擬細胞真正用到自己的單細胞課題中
把虛擬細胞方法真正遷移到自己的數(shù)據(jù)和課題里。無論你手里是普通 scRNA-seq、擾動數(shù)據(jù),還是空間組學(xué)相關(guān)課題,學(xué)完之后都會更清楚:自己的數(shù)據(jù)還能往哪里挖、還能延伸出哪些分析、還能做出哪些新的文章點。

3. 從“基礎(chǔ)分析”升級到“機制預(yù)測”,把已有數(shù)據(jù)挖得更深
把單細胞數(shù)據(jù)伸到虛擬敲除、調(diào)控網(wǎng)絡(luò)、RNA預(yù)測蛋白、空間推斷、藥物響應(yīng)模擬等方向,讓課題從“描述現(xiàn)象”走向“預(yù)測機制”,明顯提高文章深度和創(chuàng)新性。尤其對于手里已經(jīng)有單細胞數(shù)據(jù)的研究人員來說,學(xué)會如何把現(xiàn)有數(shù)據(jù)的潛力真正釋放出來。爭取從同一批數(shù)據(jù)中做出更多成果、更多文章和更高質(zhì)量的故事。

4. 建立“看懂頂刊—復(fù)現(xiàn)頂刊—借鑒頂刊—遷移頂刊”的能力閉環(huán)
學(xué)完以后,你會更有能力看懂前沿工作、復(fù)現(xiàn)核心思路、借鑒頂刊框架,并把這些方法遷移到自己的課題設(shè)計和成果產(chǎn)出中,把前沿技術(shù)真正轉(zhuǎn)化成自己的科研競爭力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
解放后損失最大俘虜逃跑事件,劫走一架飛機帶走3名我軍中層干部

解放后損失最大俘虜逃跑事件,劫走一架飛機帶走3名我軍中層干部

鶴羽說個事
2026-04-16 22:07:31
EA888發(fā)動機!奧迪新車:降價首發(fā)

EA888發(fā)動機!奧迪新車:降價首發(fā)

手機評測室
2026-04-22 11:49:39
日本向中國提了一個請求!高市早苗知道:再猶豫,中國就要收網(wǎng)了

日本向中國提了一個請求!高市早苗知道:再猶豫,中國就要收網(wǎng)了

起喜電影
2026-04-22 00:41:35
斯諾克賽程:誕生3席16強,斯佳輝首秀2虎上陣,賀國強慘敗火箭?

斯諾克賽程:誕生3席16強,斯佳輝首秀2虎上陣,賀國強慘敗火箭?

劉姚堯的文字城堡
2026-04-22 08:20:20
特朗普不演了,警告中國有大麻煩,話音剛落,美國人推動罷免總統(tǒng)

特朗普不演了,警告中國有大麻煩,話音剛落,美國人推動罷免總統(tǒng)

混沌錄
2026-04-21 21:10:15
美國防部:415名美軍人員在對伊朗軍事行動中受傷,目前死亡人數(shù)仍為13人

美國防部:415名美軍人員在對伊朗軍事行動中受傷,目前死亡人數(shù)仍為13人

每日經(jīng)濟新聞
2026-04-21 14:32:25
這是底氣!申花主帥賽前直接明牌 | 臨時換裁判 能擋住追趕步伐嗎

這是底氣!申花主帥賽前直接明牌 | 臨時換裁判 能擋住追趕步伐嗎

80后體育大蜀黍
2026-04-22 10:26:15
竄訪宣布取消后,國民黨表態(tài),民眾黨向大陸攤牌,賴清德親自回應(yīng)

竄訪宣布取消后,國民黨表態(tài),民眾黨向大陸攤牌,賴清德親自回應(yīng)

聞識
2026-04-22 11:19:56
28+25+23!湖人2比0!KD沒頂住,老詹太猛了...

28+25+23!湖人2比0!KD沒頂住,老詹太猛了...

左右為籃
2026-04-22 13:33:24
別的不說,殷桃不愧是內(nèi)娛最性感的女明星之一,豐乳肥臀的太絕了

別的不說,殷桃不愧是內(nèi)娛最性感的女明星之一,豐乳肥臀的太絕了

動物奇奇怪怪
2026-04-22 09:04:37
經(jīng)濟熱點快評丨重磅意見印發(fā),服務(wù)業(yè)擴能提質(zhì)有了“路線圖”

經(jīng)濟熱點快評丨重磅意見印發(fā),服務(wù)業(yè)擴能提質(zhì)有了“路線圖”

人民網(wǎng)
2026-04-21 19:59:12
上海房東正在快速出貨

上海房東正在快速出貨

魔都財觀
2026-04-22 07:40:13
寧德時代這一夜,不只是發(fā)電池,而是在重寫中國電車規(guī)則

寧德時代這一夜,不只是發(fā)電池,而是在重寫中國電車規(guī)則

自主汽車
2026-04-21 23:53:57
白鹿這套“白里透黑”,誰看了不心癢?

白鹿這套“白里透黑”,誰看了不心癢?

飛娛日記
2026-04-22 08:06:06
今天,茶顏悅色深圳兩店齊開,上百名“黃!毙顒荽l(fā),不論品種每杯88元,品牌回應(yīng)

今天,茶顏悅色深圳兩店齊開,上百名“黃!毙顒荽l(fā),不論品種每杯88元,品牌回應(yīng)

深圳晚報
2026-04-22 08:10:41
時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

新車知多少
2026-04-21 18:28:58
爆冷!馬克西29+9探花爆發(fā)立功,布朗36+7首發(fā)最低,塔圖姆里程碑

爆冷!馬克西29+9探花爆發(fā)立功,布朗36+7首發(fā)最低,塔圖姆里程碑

魚崖大話籃球
2026-04-22 09:37:51
趙心童即便衛(wèi)冕成功也成不了世界第1!特魯姆普:大熱必死你小心

趙心童即便衛(wèi)冕成功也成不了世界第1!特魯姆普:大熱必死你小心

風(fēng)過鄉(xiāng)
2026-04-22 13:16:46
伊朗代表:美國解除對伊海上封鎖或可成為談判基礎(chǔ)

伊朗代表:美國解除對伊海上封鎖或可成為談判基礎(chǔ)

新京報
2026-04-22 07:35:07
初代宅男女神宣布離婚:多謝大家關(guān)心...

初代宅男女神宣布離婚:多謝大家關(guān)心...

小椰的奶奶
2026-04-04 22:16:21
2026-04-22 14:07:00
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學(xué)研究
9248文章數(shù) 145057關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

頭條要聞

KTV服務(wù)員被指強奸14歲女生 官方通報

頭條要聞

KTV服務(wù)員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復(fù)婚無望!baby黃曉明陪小海綿零交流

財經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長;鹌谙

汽車要聞

純電續(xù)航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

家居
本地
時尚
數(shù)碼
公開課

家居要聞

極簡繪夢 克制和諧

本地新聞

春色滿城關(guān)不。座N梅浪漫盛放,吳山藏了一片四月雪

頂流復(fù)工,已判若兩人

數(shù)碼要聞

官宣!追覓硅谷發(fā)布會定檔,4月27日-30日登陸北美

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版