TNBC分型研究的来龙去脉
早在2018年第46周文献分享,我就介绍过TNBC亚型的研究:https://zhuanlan.zhihu.com/p/49574829 研究团队通过贝勒医学院分两次 收集了 198个TNBC病人, (discovery set: n=84; validation set: n=114) 比较稳定的把TNBC分成了4个亚型,而且还分析了7个公共数据集来验证其结论。作者还整理的4个亚型以及其可能的靶点,作为研究亮点。
当时也展开对比了其它分类研究,因为目前TNBC是BRCA里面预后最差的, 所以关于它的研究比较火热,但是根据基因表达进行分子分型的到不多,值得系统性的通读一遍,争取完全掌握该小领域的研究脉络。
其实TNBC是临床病理分类(基于IHC结果),它与分子分型(PAM50)的 basel-like
组别重合度很高,如下:
名词解释
新辅助化疗
病理完全缓解(pCR)指标
最出名(2011)的分子分型研究
依据全局基因表达
进行分型最出名的是Lehmann的2011那篇JCI的芯片整合分析文章,还开发了网页工具:http://cbc.mc.vanderbilt.edu/tnbc/ 可以得到 7 subtypes (BL1, BL2, M, IM, MSN, LAR) , 1 unstable subtype (UNS).
Based on 3,247 gene expression profiles from 21 breast cancer data sets, we discovered six TNBC subtypes including 2 basal-like (BL1 and BL2), an immunomodulatory (IM), a mesenchymal (M), a mesenchymal stem–like (MSL), and a luminal androgen receptor (LAR) subtype from 587 TNBC samples with unique gene expression patterns and ontologies.
文献在:
TNBCtype: A Subtyping Tool for Triple-Negative Breast Cancer
Xi Chen, Jiang Li, William H. Gray, Brian D. Lehmann, Joshua A. Bauer, Yu Shyr, Jennifer A. Pietenpol
Cancer Informatics, 2012:11 147-156, doi:10.4137/CIN.S9983
Identification of human triple-negative breast cancer subtypes and preclinical models for selection of targeted therapies
Brian D.Lehmann
, Joshua A. Bauer, Xi Chen, Melinda E. Sanders, A. Bapsi Chakravarthy, Yu Shyr, Jennifer A. Pietenpol
J Clin Invest. 2011; 121(7):2750–2767 doi:10.1172/JCI45014
有趣的是,作者整理的公共数据集,其实并没有临床医生根据IHC结果来定义其为TNBC,只不过是他们使用了ER,PR,HER2的探针来定义表达量的阴性,这样划分了mRNA水平的TNBC,然后对其进行分子分型。
有了分子分型的理论基础,加上有简单方便的网页工具供大部分生物学家使用,而且是TNBC领域第一篇,该分型方法想不广为流传都难,这也就是它在不到10年就被引用超过2000次的原因。
而且后来的综述或者其它分型研究都会引用它:
- J Breast Cancer. 2016 Sep; 19(3): 223–230.
- Oncotarget. 2018 May 29; 9(41): 26406–26416.
- Breast Care 2017;12:8-14 https://doi.org/10.1159/000455820
通读几篇综述可以发现,其实值得业界认可的几个分类方法并不多,虽然Lehmann的2011那篇JCI的芯片整合分析文章最早,但是跟预后联系不紧密,以至于临床效果不好。 所以后来作者2016年在plos one 发文重新修订了 之前的6分类,变成4类: (TNBCtype-4) tumor-specific subtypes (BL1, BL2, M and LAR) ,也产出新的数据 GSE81838 来验证。
但是该分类依靠2188个基因表达
,不适合临床应用,所以发表于 Ring et al. BMC Cancer (2016) 的文章 DOI 10.1186/s12885-016-2198-0 使用一系列机器学习算法把基因数量减少到了101个
。分子分型的临床意义
因为该分子分型的深入人心,所以就有有大量的研究基于其来探索分子分型的临床意义
发表在 Clin Cancer Res. 2013 October的 文章 Differential response to neoadjuvant chemotherapy among 7 triple-negative breast cancer molecular subtypes , 纳入了146个TNBC的表达芯片数据,作者首先重复Lehmann的2011的研究,可以比较好的区分出 BL1, M, IM, MSL, and LAR 亚型,但是BL2 and UNS就比较模糊。奇怪是作者的数据在不同的GSE: GSE25066 , GSE25055, GSE25065, GSE43502 and GSE31519.
这些病人接受的新辅助化疗不一样:- 16 patients received an anthracycline regimen alone
- 3 patients received a taxane regimenalone
- 111 patients received both anthracycline and taxane regimens.
有趣的是2018年一篇oncotarget文章也是类似的实验,纳入了125个接受类似的新辅助化疗的TNBC病人,而且明明2011年那7个亚型已经进化成了 4 个亚型,但是作者依据旧的分组指标。数据在GSE106977,更诡异的是oncotarget文章声称他们招募的是TNBC患者,可是实际上走PAM50或者网页工具流程,都发现其招募的病人并不是basel-like居多。
(PS: 验证怀疑这篇文章的数据是有问题,欢迎大家联系我(邮件:jmzeng1314@163.com),一起来找bugs哈)其它分组
发表在Clin Cancer Res 2015 ,贝勒医学院研究小组的 Burstein 等人对自己的数据,198个TNBC病人芯片表达矩阵,使用80个核心基因进行分组,得到4个TNBC的亚型。这个就是我在2018年第46周文献分享,TNBC亚型的研究:https://zhuanlan.zhihu.com/p/49574829 其分组与PAM50对比,和与2011的分型结果对比如下:
还有另外一个值得一提的分子分型文章发表在 Breast Cancer Research (2015) :Gene-expression molecular subtyping of triple-negative breast cancer tumours: importance of immune response,数据在 GSE58812, 法国研究团队的等人使用 适应性的Fuzzy-clustering 把107个TNBC患者分成3类:
- luminal androgen receptor (22%)
- basal-like with low immune response and high M2-like macrophages (45%)
- basal-enriched with high immune response and low M2-like macrophages (33%).
同时也分析公共数据集,GSE21653 进行验证,效果非常好,如下:
展望
考虑到TNBC的临床定义是IHC marker的ER,PR,HER2,是蛋白水平的检测,而目前主流的表达数据,都是mRNA水平的,不管是芯片还是ngs的,这中间的gap总是有的,那有没有可能直接使用蛋白质组学数据来对TNBC进行聚类然后划分分子亚型呢?
另外,目前能拿得出手就我介绍过的3个团队的分型结果,有没有可能再来一个大队列,又出现一些新的分型呢?
比如中国人群的TNBC队列:(2020年2月份)第5周(总第101周 )- 全球最大的三阴性乳腺癌队列多组学数据说了什么 ,详解:https://mp.weixin.qq.com/s/wWFYLBIfexaP1PuhqgcA9w
有没有可能联合其它ngs组学技术进行深度分型呢?
不同分型之间是否可以互相找差异的mRNA,miRNA,lncRNA来构建ceRNA网络呢?