DESeq2差异表达分析:RNA-seq最小可用流程
402 字
2 分钟
DESeq2差异表达分析:RNA-seq最小可用流程
差异表达分析回答”处理组和对照组哪些基因发生了变化”。从 count 矩阵出发,DESeq2 提供了标准化的差异分析流程。本文聚焦最小可用流程:表达矩阵准备、样本表构建、差异分析、结果提取、火山图,不深入统计原理。
1. 准备数据
DESeq2 需要两个输入:
# 1. count矩阵(基因×样本,整数)head(counts)# control1 control2 control3 treat1 treat2 treat3# ENSG00001 200 180 190 500 520 480# ENSG00002 5 8 3 10 12 15
# 2. 样本信息coldata <- data.frame( row.names = colnames(counts), condition = factor(c(rep("Control",3), rep("Treatment",3))))注意:count必须是整数(raw counts),不能用FPKM/TPM。
2. 差异分析
library(DESeq2)
# 构建对象dds <- DESeqDataSetFromMatrix( countData = counts, colData = coldata, design = ~ condition)
# 过滤低表达基因(至少在3个样本中count≥10)keep <- rowSums(counts(dds) >= 10) >= 3dds <- dds[keep, ]
# 跑分析dds <- DESeq(dds)
# 提取结果res <- results(dds, contrast = c("condition", "Treatment", "Control"), alpha = 0.05)summary(res)
# 导出write.csv(as.data.frame(res), "DEG_results.csv")3. 筛选差异基因
res_sig <- as.data.frame(res) %>% filter(padj < 0.05, abs(log2FoldChange) > 1) %>% arrange(padj)| 阈值 | 含义 |
|---|---|
| padj < 0.05 | 多重检验校正后显著 |
| |log2FC| > 1 | 变化超过2倍 |
4. 火山图
library(ggplot2)ggplot(as.data.frame(res), aes(x = log2FoldChange, y = -log10(padj))) + geom_point(alpha = 0.3, size = 0.5) + geom_vline(xintercept = c(-1, 1), linetype = "dashed") + geom_hline(yintercept = -log10(0.05), linetype = "dashed") + theme_bw()5. 踩坑
坑1:count矩阵有小数——featureCounts 输出有时含浮点数。用 round() 取整。
坑2:样本名不匹配——coldata 的 row.names 必须等于 count 矩阵的 colnames。
坑3:没有生物学重复报错——DESeq2 要求每组≥2个重复。n=1时用 design = ~ 1,但不推荐。
本文于 2025-08-20 实测。
文章分享
如果这篇文章对你有帮助,欢迎分享给更多人!
DESeq2差异表达分析:RNA-seq最小可用流程
https://fg.ink/posts/deseq2-differential-expression-basics/ 相关文章 智能推荐
1
生信自学路线图:从Linux基础到独立分析
技术 从Linux基础到独立分析的完整生信自学路线,覆盖环境配置、数据获取、质控比对、差异分析和可视化各个阶段。
2
HISAT2 RNA-seq比对:建索引、双端比对、参数调优
技术 HISAT2 RNA-seq比对全流程,从建索引、双端比对参数调优到比对率统计,附与STAR的选型对比。
3
命令行小工具:seqtk/csvtk/datamash/bioawk
技术 seqtk、csvtk、datamash、bioawk等命令行小工具的生信实战指南,覆盖序列抽样、表格处理和快速统计场景。
4
热图可视化:pheatmap与ComplexHeatmap
技术 pheatmap与ComplexHeatmap的热图绘制实操,覆盖数据标准化、配色调色板、行列注释和高级拼图布局。
5
ggplot2学术绘图:配色方案、主题、多图拼接
技术 ggplot2学术级图表绘制指南,覆盖CNS期刊配色方案、统计标注、多图拼接和300dpi矢量图导出。
随机文章 随机推荐