你还认为普通转录组测序没有用吗?
最近看到群里有小伙伴在讨论一个数据集 GSE140275 ,我发现它这个简单转录组测序数据发两篇sci,是关于 acute ischemic stroke 这个疾病 , 急性缺血性脑卒中 ,我了解不多,就不过多班门弄斧的介绍它了。。。
更想介绍的是这个超级经济实惠的课题设计思路,先看看一个在GEO的数据集,链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE140275
真的是就6个简单的转录组测序样品:
GSM4158685 ctr_1
GSM4158686 ctr_2
GSM4158687 ctr_3
GSM4158688 stroke_1
GSM4158689 stroke_2
GSM4158690 stroke_3
普通的转录组测序大家应该是都不陌生了,而且我们有围绕它的一系列产品:
这样的6个样品已经是不到五千块钱,上下游分析合起来就1600,也就是说不到一万块钱你也可以有自己的两篇sci啦。
我看到了这个数据集关联了两篇sci文章,如下所示:
-
Expression Profile and Potential Functions of Circulating Long Noncoding RNAs in Acute Ischemic Stroke in the Southern Chinese Han Population. Front Mol Neurosci 2019;12:290. PMID: 31849604
-
Expression profile and bioinformatics analysis of circular RNAs in acute ischemic stroke in a South Chinese Han population. Sci Rep 2020 Jun 23;10(1):10138. PMID: 32576868
作者也提供了自己的定量结果:
Supplementary file Size Download File type/resource
GSE140275_Annotated_lncRNA_FPKM.txt.gz 104.7 Kb (ftp)(http) TXT
GSE140275_Novel_lncRNA_FPKM.txt.gz 114.3 Kb (ftp)(http) TXT
GSE140275_TUCP_FPKM.txt.gz 171.2 Kb (ftp)(http) TXT
GSE140275_Transcript_FPKM.txt.gz 2.1 Mb (ftp)(http) TXT
GSE140275_mRNA_FPKM.txt.gz 2.1 Mb (ftp)(http) TXT
第一篇文章就是差异分析
疾病组和健康人对照组比较,做一个简单的差异分析;
- 上调: 428 lncRNAs and 957 mRNAs
- 下调: 791 lncRNAs and 4263 mRNAs
所以是一个热图一个火山图啦:
差异分析相信大家都不陌生了,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;
- 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版+R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
超级弱的结果:ROC curve analysis showed that the area under the ROC curve (AUC) values of lncRNA-C14orf64 and lncRNA-AC136007.2 between AIS and healthy controls were 0.74 and 0.94, respectively.
第二篇文章居然是挖掘普通转录组里面的circRNAs
使用了CIRI2 and Find_circ 两个软件去寻找 circRNAs ,如下所示的结果:
- host genes of differentially expressed (DE) circRNAs was performed by gene ontology (GO) enrichment, Kyoto Encyclopedia of Genes and Genomes (KEGG) pathway analysis, KOBAS for pathway analysis and regulatory network analysis.
- miRNA-circRNA and miRNA-mRNA interactions were predicted by using TargetScan, miRanda and starBase.
- CircRNA-miRNA-mRNA interaction networks were created with Cytoscape.
主要是针对 差异的 circRNAs 的host基因进行功能注释,和各种调控关系的数据库查询而已,既然是差异分析,同样的火山图和热图而已!
关于CIRI2 and Find_circ 两个软件去寻找 circRNAs,这一点由我们的生信菜鸟团专栏周四作者(大吉/大力土豆)帮我补充。而且在他的影响下,我也系统性的总结了circRNA的相关背景知识:
不过,我毕竟是没有真正拿到过circRNA项目,我的总结,更像是纸上谈兵,仍然是推荐大家用心看完我们的生信菜鸟团专栏周四作者(大吉/大力土豆)的一年的总结。
生信菜鸟团专栏周四作者目录
circRNA部分
- 肿瘤学习笔记3-hepatocellular carcinoma
- CircSplice:一个简单好用的可变剪切事件预测软件
- circRNA学习专题-CIRI2使用手册
- miRNA海绵研究,一文就够了
- circAtlas:circRNA数据库大家族又添新丁
- 综述笔记-circRNA在心血管
- MapSplice3使用手册
- circRNA能够激活PKR参与天然免疫过程-cell文献笔记
- 非编码RNA也能启动翻译?-2种模式,5种预测工具都给你
- 第三十期-circRNA学习笔记系列目录
- 肿瘤学习笔记4-Breastcancer
- 植物杂志PP&PJ都在用的研究思路
- circRNA通过翻译微蛋白参与DCM过程-Cell文献笔记
- circRNA实验设计优化方案笔记