一份单细胞数据多篇顶刊文章(这就是生信大神课题组实力吧)

最近看到了朋友圈很多小伙伴转发了美国德克萨斯大学MD安德森癌症中心的王凌华教授和Humam Kadara教授的合作团队在《Nature》在线发表了题为 《An atlas of epithelial cell states and plasticity in lung adenocarcinoma》的最新文章(2024年2月28日),也在各个交流群看到了大家发原文PDF,我就好奇打开看了看,发现人家里面的数据居然是三年前的单细胞转录组:

  • https://ega-archive.org/studies/EGAS00001005021
    是一个蛮简单的的空间多位点取样,探索 lung adenocarcinoma (LUAD) evolution,如下所示:
    空间多位点取样
    在上面的EGAS00001005021链接可以看到这个数据集它关联到了已经发表的两个《Cancer Discov 》文章:
  • 2021的:Resolving the Spatial and Cellular Architecture of Lung Adenocarcinoma by Multiregion Single-Cell Sequencing.
  • 2022的:The Single-Cell Immunogenomic Landscape of B and Plasma Cells in Early-Stage Lung Adenocarcinoma.
    而且都是美国德克萨斯大学MD安德森癌症中心的王凌华教授的大作,其中2021的文章还是 5 early-stage LUADs 病人的14个肿瘤取样以及其5个癌旁取样,总共是19个样品的186,916 cells , 如下所示的第一层次降维聚类分群:
    19个样品的186,916 cells,
    另外的2022的文章就扩充成为了 16 early-stage LUADs and 47 matching multi-region normal tissues ,但是分析着力点是第二层次降维聚类分群,关心的是 Tumor-infiltrating B and plasma cells (TIBs) ,如下所示:
    b细胞的降维聚类分群

    肿瘤多位点的研究范式在各个癌症都很普遍了

    多位点取样,可以查看几乎一切可以检测的指标,包括但不限于免疫组化等实验指标或者变异和表达量这样的组学指标,而且基本上在每个癌症都有成百上千的文章发表过,这个是研究空间异质性的最容易想到的方案了。
    另外一个就是时间异质性(疾病进展),比如还是上面的肺腺癌,它常见的不同进展时期包括:

  • atypical adenomatous hyperplasia (AAH),
  • adenocarcinoma in situ (AIS),
  • minimally invasive adenocarcinoma (MIA)
  • invasive adenocarcinoma (ADC).
    就有人在不同组学都发过文章:
  • 2021年1月 的看rrbs技术的,标题是:《 Evolution of DNA methylome from precancerous lesions to invasive lung adenocarcinomas 》
  • 2019年6月的看肿瘤外显子技术的,文章是《Multi-region exome sequencing reveals genomic evolution from preneoplasia to lung adenocarcinoma》

    虽然很多数据都并不公开

    比如上面的EGAS00001005021链接可以看到这个数据集是不公开的,但其实据我所知国内很多团队都有同样的实验设计的同样的规模的单细胞转录组数据,甚至是空间单细胞数据。但是呢,发顶刊实在是太难了,哪怕是他们的数据公开给大家,大家能挖一个普通预后模型就差不多了。数据分析技术完全是不等于科研能力。

Comments are closed.