18

不同癌症的差异难道大于其与正常对照差异吗?

 

前面的教程:[大样本量多分组表达量矩阵分析你难道没想到单细胞吗](https://mp.weixin.qq.com/s/p2oYAgG-LO9yLGx1r3i9zQ),提到了我们整合全部的33种癌症的仅仅是蛋白质编码基因的表达量矩阵,进行降维聚类分群可以看到并不是严格的各个癌症泾渭分明。而去还别出心裁的引入了单细胞经典seurat流程,进行降维聚类分群。 Continue reading

25

2014年测了近600样品的转录组芯片但是仅发表在 PLoS One

最近逛GEO,居然发现了一个神奇的数据, 在:(accession number GSE50832). 之所以说它神奇,是因为它关联的文章是 PLoS One 2014;9(8):e106131. PMID: 25171249, 标题是:《Gene expression profiling reveals epithelial mesenchymal transition (EMT) genes can selectively differentiate eribulin sensitive breast cancer cells》。因为它这个数据集样本量超级大,使用的是最经典的芯片,Affymetrix Human Genome U133 Plus 2.0 Array,做了近600样品。
因为涉及到3个不同的癌症细胞系,所以这个数据集可以拆分成为下面的3个 :

GSE50811 Breast cancer cell lines treated with eribulin and paclitaxel
GSE50830 Endometrial cancer cell lines treated with eribulin and paclitaxel
GSE50831 Ovarian cancer cell lines treated with eribulin and paclitaxel

这600样品的转录组芯片,总共是67个细胞系,对照和2种处理,各自3个重复,如下所示: