100篇泛癌研究文献解读之snoRNAs

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
本研究发表于 Cell Rep. 2017 Nov 的pan-cancer研究,题目是:A Pan-cancer Analysis of the Expression and Clinical Relevance of Small Nucleolar RNAs in Human Cancer.
这个研究已经属于第二代的pan-cancer研究,所以涉及的癌症肿瘤不只是之前的12种,本研究是 超过 10,000 samples across 31 cancer types,然后因为主要分析的是 small nucleolar RNAs (snoRNAs) ,所以是需要重新处理TCGA原始数据的。

关于 small nucleolar RNAs (snoRNAs)

核仁小 RNA(snoRNAs)是一类广泛存在于真核生物细胞核仁的小分子非编码RNA,长度60-300nt,能与核仁核糖核蛋白结合形成snoRNPs复合物,大多数snoRNAs 主要位于由 RNA 聚合酶 II 转录的基因的内含子区域。但 snoRNAs 也可以来源于长链非编码 RNA(lncRNA)的内含子区域。从内含子上脱离后,pre-snoRNAs进一步的被核酸外切酶处理去除两端的多余序列,进而形成成熟的 snoRNAs。
snoRNAs主要包含两个家族:C/D box snoRNAs 与 H/ACAbox snoRNAs,还有一个
早在2016,就有挖掘文章:The noncoding RNAs SNORD50A and SNORD50B bind K-Ras and are recurrently deleted in human cancer” Nature genetics 2016 研究人员比较了21种不同癌症类型中的5,473个肿瘤基因组及周围正常组织的基因组。链接 Nat Genet. 2016 Jan

本研究涉及的数据量

如下:
image-20190502225625407

有癌旁的病人的snoRNAs表达量比较

如下,可以看到整体来说,snoRNAs在病人的肿瘤组织表达量是高于其对应的癌旁组织的。
image-20190502225720380

snoRNAs的表达量与其它组学的相关性

要想发比较高分的文章,通常涉及到其它组学,做多组学整合分析是必不可少的。

基于snoRNAs表达量的分组和其它组学数据分组的一致性

这里只选取了200个snoRNAs,包括79% C/D box snoRNAs, 20% H/ACA box snoRNAs, and 1% scaRNAs; 组成 snoRNAs signatures来进行癌症分组,对大于100个病人的癌症的分组一致性进行卡方检验,结果如下:
image-20190502230502607

网页工具方便探索snoRNAs

地址是:snoRNA in cancer (SNORic) (http://bioinfo.life.hust.edu.cn/SNORic).
image-20190502230827411

SNORic includes the expression levels of 1,524 snoRNAs across >10,000 samples for browsing, analyzing, visualizing, and downloading, so that the users can further test their hypotheses. We

后记

第二代的泛癌研究要比第一代整体复杂很多。
本文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html

Comments are closed.