六年前我组建过一个【生信文献200篇】活动,因为自己课题组背景偏好性导致大家一起读了很多肿瘤领域的类器官文献,如下所示:
- 【生信文献200篇】75 ,人肝癌类器官模型
- 【生信文献200篇】54, 胃癌类器官
- 【生信文献200篇】48 ,乳腺癌类器官
- 【生信文献200篇】38 ,卵巢癌类器官
- 【生信文献200篇】30 ,食道腺癌的类器官
- 【生信文献200篇】24, 类器官助力CRPC-NE的治疗
- 【生信文献200篇】22, 胰腺癌的类器官可以辅佐治疗决策
- 【生信文献200篇】14, 2018膀胱癌类器官
但是六年前的单细胞转录组并不流行,因为没有10x这样的商业化的仪器,所以那个时候的在每个癌症领域的类器官CNS文章都是做几十个或者上百个病人的类器官培养后,做常规的转录组和肿瘤外显子数据,来说明类器官能非常好的维持其来源的原位肿瘤,这样就说明了类器官可以成为肿瘤病人的精准医疗替身!
过去的五年,虽然说单细胞转录组的大行其道,但是在类器官领域的应用仍然是很有限,单细胞时代到了仅仅是2019之后的类器官研究继续“复制粘贴一波”。比如2023发表在NC的文章:《Bladder cancer organoids as a functional system to model different disease stages and therapy response》确实是有单细胞转录组数据,在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE217956
可以看到,是3个膀胱癌病人的类器官和对应的原位肿瘤样品的单细胞转录组数据:
GSM6731130 BLCa77 organoids
GSM6731131 BLCa77 parental tumor
GSM6731132 BLCa86 organoids
GSM6731133 BLCa86 parental tumor
GSM6731134 BLCa98 organoids
GSM6731135 BLCa98 parental tumor
作者给出来的是一个99.0 Mb的 GSE217956_data.matrix.h5文件,很容易读取它然后进行标准的单细胞转录组分析:
比如可以看看降维聚类分群后看细胞亚群的比例分布情况:
有意思的是,它这个类器官的单细胞转录组数据集里面原位肿瘤就已经是基本上只有恶性肿瘤上皮细胞了,之前我们介绍的另外几个癌症的数据集就不一样,起码在原位肿瘤阶段还是有很多肿瘤微环境的,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45+,PTPRC),
- epithelial/cancer (EpCAM+,EPCAM),
- stromal (CD10+,MME,fibro or CD31+,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。
我读取了作者给出来的99.0 Mb的 GSE217956_data.matrix.h5文件,走我们的标准代码。常规的单细胞转录组降维聚类分群代码可以看 链接: https://pan.baidu.com/s/1bIBG9RciAzDhkTKKA7hEfQ?pwd=y4eh ,基本上大家只需要读入表达量矩阵文件到r里面就可以使用Seurat包做全部的流程,但是初始情况下只能说是拿到如下所示的图:
搞清楚这个单细胞转录组数据集里面的样品分布情况以及对应的分组, 就可以试试看复现文章里面的 图表啦,作为学徒作业给家吧!核心读取文件的代码是:
sce.all =CreateSeuratObject(counts = Read10X_h5('GSE217956_data.matrix.h5') ,
min.cells = 5,
min.features = 300 )
library(stringr)
#sce.all$group=gsub('[0-9]*','',str_split(colnames(sce.all),'[-_]',simplify = T)[,2])
tmp = str_split(colnames(sce.all),'[-_]',simplify = T)[,3]
table( tmp )
sce.all$orig.ident = tmp
table(sce.all$orig.ident)
sce.all
可以看到,降维聚类分群后,肿瘤领域的类器官文献的单细胞转录组数据分析是很有限的,比如这个文章就做了下面的3个分析,首先是:
- d UMAP plot of cells derived from PT/PDOs pairs clustered by sample types.
- e Barplot of the fraction of positive cells for Ki67 and PCNA in PT/PDOs pairs.
第一个图就是说明了作者使用了harmony等整合算法,所以不同样品来源的单细胞会混合的比较好,单细胞会按照细胞亚群的生物学属性区分开了,然后就看了看具体的每个样品里面的两个细胞增殖相关基因的阳性情况:
然后就沿着这条路继续往前走,看看其它典型的生物学功能基因的阳性情况:
f Correlation of the fraction of cells positive for basal (blue) and luminal (green) markers in PT/PDOs pairs. Two-sided Pearson Correla- tion (R). BLCa, bladder cancer. KRT, cytokeratin.