如果我们最后拿到的是蛋白编码基因,当然可以很容易的注释到各种数据库,比如:Gene Ontology terms, KEGG, Reactome, NetPath, PID, INOH and BioCarta pathways ,这些数据库本质上都是一些被定义好的基因集而已。
但是lncRNA本身没有蛋白编码基因那样长远的研究历史,也没有海量的生物学实验数据的积累,所以仍然是需要通过跟蛋白编码基因的表达相关性来间接推测lncRNA的功能,这就需要理论模型和算法支持,LncRNA2Function网页工具就是其中一个选择!
作为一个工具,这个不到100的引用量只能说是马马虎虎吧,当然了,本身这个杂志就是专门发生物信息学文章的杂志,影响因子都不到3,而这个工具的100左右的引用,其实是大大帮助了这个杂志。
The lncRNA2Function is freely available at http://mlg.hit.edu.cn/lncrna2function.
通过表达量相关性来关联lncRNA与蛋白编码基因
实际上,仅仅是凭表达量的相关性就认为某个lncRNA就一定是与它共表达的编码蛋白质的基因的功能一致或者类似,是一个假设而已。
文章里面的描述是
In this study, based on expression correlation between lncRNAs and protein-coding genes across 19 human normal tissues, we used the hypergeometric test to functionally annotate a single lncRNA or a set of lncRNAs with significantly enriched functional terms among the protein-coding genes that are significantly co-expressed with the lncRNA(s).
如果是想探索LncRNA在疾病研究方向的成果,还可以通过FARNA网页工具,依赖的是KEGG Orthology Based Annotation System (KOBAS)数据库,其也是多种数据库的整合,包括, KEGG DISEASE, GAD and NHGRI GWAS Catalog disease databases.
更多lncRNA相关数据库,我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过。
如果你这边lncRNA数据分析实战经验丰富,也欢迎分享你的个人见解,一起进步!lncRNA表达矩阵免费分析哦
春节前后活动,我们推文里面提到的数据分析环节都是我非常有经验的,比如我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过的那些图表, 对我来说是举手之劳,希望可以帮助到你!
- 转录组数据分析的4个维度认识(数据分析继续免费哦) RNA-seq数据的2个分组差异分析,热图,PCA图,火山图等等
- 根据感兴趣基因看肝癌免疫微环境的T细胞亚群差异 条形图或者箱线图
- 查看感兴趣基因的甲基化水平和RNA表达水平(数据分析免费做)相关性 散点图或者箱线图
- 我不相信kmplot这个网页工具的结果(生存分析免费做)
- 单基因GSEA分析策略(数据分析免费做活动继续)
发送数据分析要求,以及简短的项目描述到我的邮箱 jmzeng1314@163.com (活动时间仅限于春节前后一个月哈)
邮件正文最好是加上你是啥时候认识生信技能树的哦,或者其它一些寒暄的话,自我介绍也行。主要是考虑到可能想免费分析数据的朋友很多,所以会根据你的来信,我主观判定一个优先级哦。目前我有20多个愿意长期在我的指导下进行数据探索的学徒,等我的团队扩大到200人,我们应该是可以做到数据分析全部免费,敬请期待哈!