前面我们已经介绍过circRNA的基础概念: 首先了解一下circRNA背景知识,背景知识,以及 circRNA芯片分析的一般流程,还有circRNA-seq分析的一般流程。看起来好像是把circRNA都介绍完了 ,不过在ceRNA芯片里面,其实也有一部分circRNA。其实ceRNA(competing endogenous RNAs,竞争性内源RNA) 是一种假说,是指一种全新的基因表达调控模式,我们已知miRNA可以通过结合mRNA导致基因沉默,而ceRNA(lncRNA、circRNA…)可以通过竞争性结合miRNA来调节基因表达,从而影响细胞的功能。
什么是ceRNA-芯片呢
ceRNA-芯片,其实就是大杂烩,包含了mRNA、lncRNA、circRNA的基因芯片,可同时获得这三个层面的表达数据,同时作为lncRNA和circRNA两种非编码RNA调控功能研究的利器。
最出名的就是SBC human ceRNA array V1.0芯片,但是呢,因为他们委托Agilent公司生产,所以在GEO数据库里面,其实是https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL22120 Agilent-078298 human ceRNA array V1.0 4X180K [Probe Name Version]
可以看到,截止到(2019-12-11 )看到的已经发表,并且使用了Agilent-078298 human ceRNA array 的研究,还公开其芯片数据的研究并不多。(主要是,太多的研究并不公布其芯片数据)
产品特点:
▪ 超值:覆盖circRNA、lncRNA、mRNA,一份芯片数据同时得到三个层面的表达信息。circRNA和lncRNA作为典型的内源竞争性RNA,此款芯片可以让您畅游ceRNA调控研究。挑战性样本(血清、血浆、外泌体)同样适用。
▪ 高通量:包含88,371条circRNA,68,423条lncRNA、18,853条mRNA,让您的筛选范围更广。
▪ 精准:利用芯片碱基互补杂交的方式,能够对整体表达丰度较低的circRNA更灵敏、稳定地进行检测。
▪ 特异性高:环状RNA -特异的反向剪接位点探针设计,保证每个探针检测的特异性,避免与母基因之间的冗余影响。
▪ 简单快速:最快一周交付,数据分析简单、快速,报告图片文章化。
▪ 加送增值分析:疾病相关环状RNA预测。
其数据库来源: Circbase(88371)、GENCODEv21 /Ensembl(18,100)、LNCipedia v3.1 (40,621)、Lncrnadb (28)、Noncode v4 (2,608)、UCSC (25,919)
3个方向的差异分析
前面我们说到了ceRNA-芯片,其实就是大杂烩,包含了mRNA、lncRNA、circRNA这么多信息,那么就可以对不同的表达矩阵分开是走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub上,目录如下:
- 第一讲:GEO,表达芯片与R
- 第二讲:从GEO下载数据得到表达量矩阵
- 第三讲:对表达量矩阵用GSEA软件做分析
- 第四讲:根据分组信息做差异分析
- 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
- 第六讲:指定基因分组boxplot指定基因list画热图
仅仅是最后得到的差异分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起来很陌生罢了。感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ; - 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版+R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
我们分享的文章是发表 September 19, 2019 https://doi.org/10.3892/ol.2019.10880 的Changing expression profiles of lncRNAs, circRNAs and mRNAs in esophageal squamous carcinoma ,其3个差异分析结果热图如下:
差异分析的策略
很简单的,3个表达矩阵分别分析即可,如下:
所以就会有3个火山图
最后的数据库注释,也是可以从3个方面的数据来。也有公布芯片数据的研究
比如发表在 Front Genet. 2019 Sep 文章 CeRNA Expression Profiling Identifies KIT-Related circRNA-miRNA-mRNA Networks in Gastrointestinal Stromal Tumour ,就表明芯片数据上传到了在 GSE131481. 该研究使用的是 Agilent-078298 human ceRNA array V1.0 4X180K [Probe Name Version] ,就是 SBC human ceRNA array V1.0芯片,一回事。