生信自学路线图:从Linux基础到独立分析
生信学习路线:Linux基础→Conda环境→数据获取→质控比对→差异分析→可视化→可重复性。附每个阶段的学习资源和避坑指南
命令行小工具:seqtk/csvtk/datamash/bioawk
seqtk序列抽样、csvtk表格处理、datamash命令行统计、bioawk生信awk替代、tsv-utils表格操作。Debian 13实测
网络诊断与测速:ping/mtr/iperf3/curl
网络连通性诊断、路由追踪、带宽测试、DNS排查、HTTP/FTP下载优化全解。含教育网/CSTNET的特殊网络问题、axel多线程下载、代理配置、SSH隧道端口转发。Debian 13实测,含7个踩坑
Markdown与Pandoc:文档写作与格式转换
用Markdown写实验记录、分析报告,Pandoc一键转PDF/Word/HTML/LaTeX。模板定制、文献引用、代码块高亮、表格、图片交叉引用。Debian 13实测,含6个踩坑记录
ENSEMBL BioMart批量数据导出:REST API与biomaRt
BioMart REST API + biomaRt R包批量导出基因注释:GO/KEGG/InterPro/PFAM/跨物种同源基因。Python+R双语言实现,含7个踩坑记录
文件编码与换行符:UTF-8/CRLF/BOM诊断与转换
文件编码与换行符完全指南:UTF-8 vs GBK识别与转换(iconv)、CRLF vs LF换行符诊断(dos2unix/file)、BOM头处理、Vim/VSCode配置、GFF/VCF/FASTA编码问题实战。Debian 13实测
管道与重定向进阶:stdin/stdout/stderr/文件描述符
Linux管道和重定向深入:stdin/stdout/stderr/文件描述符、tee分流、进程替换、命名管道、xargs并发。覆盖SAM排序压缩、FASTQ质控过滤、批量GFF处理等场景。Debian 13实测,含7个踩坑记录
VCF文件处理:bcftools过滤/注释/统计
bcftools view/query/filter/stats/concat/merge/annotate完整实操。VCF四部分结构详解、QUAL/DP/GQ/GT各字段含义、硬过滤公式、VCF压缩索引规范、INFO/ANN字段注释。Debian 13实测
Python Pandas数据清洗:表达矩阵、差异结果、样本注释
用Pandas处理生信数据三大场景:表达矩阵过滤与标准化、差异表达结果筛选与注释、样本元数据合并与质控。包括缺失值处理、分组聚合、多表连接、5个踩坑记录。Debian实测