上次我们分享了 指定病人的指定基因的突变全景瀑布图,好像一下子戳中了大家的痛点,很多粉丝留言表示感谢,这下子他们终于可以在自己的风险预后模型区分了病人高低分组后,可视化铁死亡基因集,细胞焦亡基因集的突变情况,对比展示。
但是接下来大家又想问,同样的想比较两个分组的免疫评分的差异,但是免疫评分的工具太多了,比如有一个2019的综述文章:《Comprehensive evaluation of transcriptome-based cell-type quantification methods for immuno-oncology》比较了常见的免疫细胞比例推断工具的表现,另外一个2018的综述《Quantifying tumor-infiltrating immune cells from transcriptomics data》提到工具更多,起码十几款了。大家也不可能一一研读,下载,测试,使用它。但是又确实看到了大量数据挖掘文章都使用了这些免疫评分信息啊,比如:新鲜出炉(2021年6月)的文章:《Identification of a Ferroptosis- Related LncRNA Signature as a Novel Prognosis Model for Lung Adenocarcinoma》 ,就对比了 ESTIMATE, TIMER, MCP counter, CIBERSORTx,和ssGSEA ,如下所示:
类似于的分析在很多数据挖掘文章里面都有,再比如同样是2021年的文章:《Characterization of a ferroptosis
and iron-metabolism related lncRNA signature in lung adenocarcinoma》,最后一个大图也是:
Fig. 5 Immune infiltration analysis. A Heatmap for immune responses based on TIMER, CIBERSORT, QUANTISEQ, MCP-counter, XCELL, and EPIC algorithms among high and low risk groups.
虽然我们确实写了教程,每个软件如何使用,如何解读其结果,比如 estimate看基质和免疫细胞比例 ,来源于2013数据挖掘文章,作者就整理了两个基因集来根据表达量矩阵使用estimate方法去量化肿瘤样品里面的基质细胞和免疫细胞的比例。教程目录是:
- estimate的两个打分值本质上就是两个基因集的ssGSEA分析
- 针对TCGA数据库全部的癌症的表达量矩阵批量运行estimate
- 不同癌症内部按照estimate的两个打分值高低分组看蛋白编码基因表达量差异
但是一口气学十几款软件也确实难为大家了,其实绝大部分数据挖掘文章都是临床医生做的,他们并不具备软件安装调试以及跑通的能力,唯一的解释就是这些免疫评分,都不是自己算的,是公共数据库里面就有的: - ESTIMATE, TIMER, MCP counter, CIBERSORTx,和ssGSEA
- TIMER, CIBERSORT, QUANTISEQ, MCP-counter, XCELL, and EPIC algorithms
比如在 https://gdc.cancer.gov/about-data/publications/pancanatlas 我们可以找到: https://gdc.cancer.gov/about-data/publications/panimmune
这里面应有尽有,需要的仅仅是提取里面的数据,进行可视化即可!其它软件的免疫打分,也可以去各自的官方网站下载现成的!
当然了,使用R语言最佳,再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理: - 《生信分析人员如何系统入门R(2019更新版)》
- 《生信分析人员如何系统入门Linux(2019更新版)》
把R的知识点路线图搞定,如下: - 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习: - 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
- 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余、查找、切割、替换、合并、补齐,熟练掌握awk、sed、grep这文本处理的三驾马车。
- 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
- 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
- 第5阶段:任务提交及批处理,脚本编写解放你的双手。
- 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。