磁盘空间管理与清理:df/du/ncdu
磁盘空间排查全流程:df/du/ncdu定位空间占用、大文件查找、conda/pip缓存清理、log轮转、临时文件自动清理、软链接节省空间。Debian 13实测,含7个踩坑记录
Bash数组与字符串处理:参数展开、截取、替换
Bash数组(索引数组、关联数组)、字符串截取、替换、匹配、参数展开全解。含样本ID提取、路径操作、文件列表管理、批量参数传递等场景模板。Debian 13实测,8个踩坑记录
生信软件安装:Conda/APT/源码编译/Docker对比
全面对比生物信息学软件安装方式:Conda环境隔离、APT/YUM系统包、源码编译(configure/make)、Docker容器。每种方式的适用场景、优点和代价,附安装时间对比表
ggplot2学术绘图:配色方案、主题、多图拼接
ggplot2学术级数据可视化:CNS级别配色方案、ggpubr统计标注、cowplot/patchwork多图拼接、导出300dpi矢量图、5个真实踩坑记录
生物信息学数据库全景:序列/表达/功能/变异
整理生信必备的15个免费数据库:序列类(NCBI/Ensembl/UCSC)、表达类(GEO/SRA/TCGA/GTEx)、功能类(UniProt/KEGG/GO/STRING)、变异类(gnomAD/dbSNP/COSMIC)、表观类(ENCODE)
Git版本控制:项目管理全流程
Git全流程:初始化、分支策略、.gitignore配置、大文件处理、版本回退、协作提交规范。从单人脚本到团队维护流程。Debian 13实测,含7个踩坑记录
生信文件格式:FASTQ/SAM/BAM/VCF/GFF/BED
生信7大核心文件格式深度对比:结构、用途、转换方式、常见坑点。附带格式互转命令大全和格式验证工具
SSH远程连接进阶:免密登录、跳板机、端口转发
SSH高级技巧:密钥认证免密登录、~/.ssh/config多主机管理、ProxyJump跳板穿越、本地/远程/动态端口转发、SSHFS远程挂载、tmux防断线。Debian 13实测,含6个踩坑记录
参考基因组下载与索引准备:Ensembl/UCSC/NCBI
Ensembl、UCSC、NCBI三大来源参考基因组下载地址、命名规则、文件选择策略。完整索引准备:bwa-index、bowtie2-build、hisat2-build、samtools faidx、GATK dict。GTF/GFF注释文件获取
GEO数据库数据下载与解析:公共数据挖掘入门
GEOquery批量下载、GEO数据格式解读(SOFT/MINiML/Series Matrix)、表达矩阵提取、样本注释解析、GEO2R替代方案、国内下载加速,附5个常见错误解决
Profile Image of the Author
风观
风有来路,观有所思
分类
标签
站点统计
文章
52
分类
1
标签
38
总字数
64,085
运行时长
0
最后活动
0 天前

文章目录