最近安排团队学习者帮忙系统性整理单细胞肿瘤研究的3大应用方向的文献,发现里面包含一个
单细胞数据在GSE108679,大家可以下载去玩一玩,其数据分析的全部描述如下:
其实数据分析就是我们单细胞天地发布的全网第一个单细胞转录组课程所精炼了常规单细胞转录组数据分析主线,就是5大R包, scater,monocle,Seurat,scran,M3Drop,然后10个步骤:
- step1: 创建对象
- step2: 质量控制
- step3: 表达量的标准化和归一化
- step4: 去除干扰因素(多个样本整合)
- step5: 判断重要的基因
- step6: 多种降维算法
- step7: 可视化降维结果
- step8: 多种聚类算法
- step9: 聚类后找每个细胞亚群的标志基因进行亚群命名
- step10: 继续分类
现在让我们来一一查看其中的主线图表:降维聚类分群可视化
因为是CELL文章,所以图表会比较精炼,如下:
展示感兴趣基因的表达量
前面步骤分群后,很容易找到各个细胞亚群的标记基因,然后可视化如下:
细胞亚群功能注释
通常这一步,就是对每个细胞亚群的重要的基因进行GO/KEGG数据库注释,跟bulk转录组分析方法类似。
细胞亚群的稳定性
这个通常是诊断性图表
不同细胞亚群有各自的标记基因
差异分析
这里作者感兴趣的是tSCs这一群细胞,跟所有其它细胞进行比较,差异分析进行热图展示:
作者的表达矩阵都公布了
在 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE108679 可以公开免费下载,然后走我们教给大家的10个步骤就可以完成文章大部分图表啦》
GSE108679_Phoenix_CSC_TPM.txt.gz 6.2 Mb (ftp)(http) TXT GSE108679_Phoenix_OT1_TPM.txt.gz 9.7 Mb (ftp)(http) TXT