Tech、Food & Life

  • 首页
  • 软件下载
    • 电脑和软件
    • Mac软件
    • windows软件
  • Telegram电报
  • 网站资源推荐
  • 海外流媒体
    • netflix
    • Youtube
    • Disney+
    • HBO
  • 生活日常
    • COVID19疫情相关
    • 德国驾照和车
    • 电脑和软件
    • 花花草草
  • 烘焙
  • 关于我
  • 中EN
Tech Food & Life
爱技术,爱美食,爱生活
  1. 首页
  2. 科研学习
  3. 生信学习
  4. Linux和测序
  5. 正文

单细胞测序入门:Seurat 完整流程(raw counts → UMAP)全注释

2026年5月22日 4点热度 0人点赞 0条评论
Language: 🇨🇳 中文版 🇬🇧 English

单细胞 RNA 测序(scRNA-seq)是过去几年增长最快的生命科学技术之一,Seurat 是目前最主流的分析 R 包。这篇把完整流程从原始计数矩阵到 UMAP 聚类每步都注释清楚,适合刚入门的人参考。

安装和加载

# 需要 R 4.1 及以上,Seurat v5
install.packages("Seurat")
library(Seurat)
library(ggplot2)

读入数据

# 10x Genomics 输出目录应包含:
# barcodes.tsv.gz, features.tsv.gz, matrix.mtx.gz
counts <- Read10X(data.dir = "data/sample1/")

seurat <- CreateSeuratObject(
  counts      = counts,
  project     = "my_project",
  min.cells   = 3,    # 基因至少在 3 个细胞中表达,过滤噪声基因
  min.features = 200  # 细胞至少表达 200 个基因,过滤空液滴
)

质量控制(QC)

# 计算线粒体基因比例(高比例通常表示细胞在裂解/凋亡)
seurat[["percent.mt"]] <- PercentageFeatureSet(seurat, pattern = "^MT-")
# 小鼠数据用 "^mt-"

# 可视化 QC 指标
VlnPlot(seurat, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)

# 过滤(阈值根据实际数据分布调整,这里只是示例)
seurat <- subset(seurat,
  nFeature_RNA > 200 & nFeature_RNA < 5000 & percent.mt < 20)

标准化、高变基因、归一化

seurat <- NormalizeData(seurat)  # 每个细胞总 UMI 归一化到 10,000 再 log 变换

seurat <- FindVariableFeatures(seurat, nfeatures = 2000)  # 找高变异基因

seurat <- ScaleData(seurat)  # z-score 标准化,消除细胞间文库大小差异

降维和聚类

seurat <- RunPCA(seurat)        # PCA 降维
ElbowPlot(seurat)               # 看拐点,决定用几个 PC(通常 10-20)

seurat <- FindNeighbors(seurat, dims = 1:15)     # 构建 KNN 图
seurat <- FindClusters(seurat, resolution = 0.5) # resolution 越高 cluster 越多
seurat <- RunUMAP(seurat, dims = 1:15)           # UMAP 可视化

DimPlot(seurat, label = TRUE)   # 绘制 UMAP,每个点是一个细胞

找 Marker 基因并注释细胞类型

# 找每个 cluster 的特异性高表达基因
markers <- FindAllMarkers(
  seurat,
  only.pos = TRUE,   # 只找上调基因
  min.pct  = 0.25,   # 至少在 25% 的细胞中表达
  logfc.threshold = 0.25
)

# 查看 cluster 0 的 top 10 marker
head(subset(markers, cluster == 0), 10)

# 可视化已知 marker(T 细胞、单核细胞等)
FeaturePlot(seurat, features = c("CD3D", "CD14", "MS4A1"))

运行时间和内存参考

  • 10,000 个细胞:普通笔记本,全流程约 10-15 分钟,内存 8GB 足够
  • 50,000 个细胞:建议 32GB 以上内存,ScaleData 和 FindClusters 是瓶颈步骤,推荐在服务器跑
  • 100,000+ 细胞:考虑使用 Seurat v5 的 sketch 工作流或切换到 AnnData/Scanpy(Python)
标签: 暂无
最后更新:2026年5月22日

这个人很懒,什么都没留下

点赞
< 上一篇

文章评论

razz evil exclaim smile redface biggrin eek confused idea lol mad twisted rolleyes wink cool arrow neutral cry mrgreen drooling persevering
取消回复

最新 热点 随机
最新 热点 随机
德国求职信(Anschreiben)怎么写:格式规范与正文结构详解 德国 Bio 有机产品值不值得买:哪些食物优先选有机,在哪里买最省 德国学生餐厅(Mensa)完全指南:价格、菜单、付款和全国特色 穷游瑞士:从德国出发 5 天 500 欧的可行路线 Notion + Obsidian 管理博士/硕士科研笔记:知识库搭建方案 在德国复刻中式早餐:豆浆、油条和葱油饼在家怎么做
ggplot2 科研配色方案:5 套可直接用的代码单细胞测序入门:Seurat 完整流程(raw counts → UMAP)全注释德国面粉 Type 405/550/1050 区别:对应中国低筋/中筋/高筋粉的换算在德国做中式面食:食材替代方案和必去亚洲超市攻略德国黄油烘焙指南:Süßrahm vs Sauerrahm、脂肪含量和温度处理德国硕士申请全流程:Uni-Assist 注册、材料提交和 NC 判断
这份“公司作息表”火到被举报:涵盖1300+公司 作息精准到部门 德国硕士申请全流程:Uni-Assist 注册、材料提交和 NC 判断 史上最完善的 iOS 翻墙规则 Shadowrocket 小火箭配置规则 2022年 德国报税入门:留学生和研究人员如何用 ELSTER / Taxfix 退税 南瓜品种概述 德国法兰克福回国的所有航班和机票搜索
标签聚合
在线 Netflix 破解 下载 4k mac windows 奈飞

COPYRIGHT © 2020-2025 SUNQI.ORG ALL RIGHTS RESERVED. 本站部分资源来源于网络,如有侵权请联系删除,谢谢。

Theme Kratos Made By Seaton Jiang