04

这5个miRNA组成的肺鳞癌诊断基因集在tcga数据库能复现吗

最近看到某公司宣传他们的科研服务产品,是miRNA的芯片,而且文章居然是2011发表的,那个时候我还不知道生信是啥子。(我一直以为自己足够老了)

该研究使用的是 CapitalBio 平台 (CapitalBio 公司) 芯片,非常清晰的研究思路;

04

这3个lncRNA组成的食管癌诊断分类器在tcga数据库能否复现

最近看到某公司宣传他们的产品,是lncRNA的芯片,文章是2015发表的,研究思路很清晰:

  • 119个食管癌病人的肿瘤组织和配对样品的lncRNA芯片数据,在GSE53624
  • 芯片平台比较老旧了,是Agilent human lncRNA+mRNA array V.2.0
  • 把119个食管癌病人数据拆分成为 training (n=60) and test (n=59) 数据集 Continue reading
04

肿瘤转移的4个理论模型

最近看到朋友圈有人分享了2020年4月24日,北京大学生物医学前沿创新中心(BIOPIC)、生命科学学院白凡与国家癌症中心、中国医学科学院肿瘤医学张海增课题组合作在Nature Communications杂志上在线发表了研究论文:Mapping the spreading routes of lymphatic metastases in human colorectal cancer(人类结直肠癌向淋巴系统转移的路径研究)。 Continue reading

04

新物种基因组组装

对人和鼠科研项目来说,各种NGS测序数据分析起来都是有成熟的流程和工具,但是并不是使用的物种都是有参考基因组和注释文件的,走流程的前提就需要先测定自己研究的物种的基因组,组装起来。 Continue reading

04

推荐几本生物信息学相关书籍

不知道多久以前在朋友圈看到转发分享:因为疫情,Johns Hopkins的Project Muse 限时免费,包括普林斯顿、康奈尔、乔治亚、哈佛、港中文、ACA、Early Theatre等40多家出版社基本都开放了自己的电子资料库,共有近24000本原版英文书,282本期刊。 链接是:https://about.muse.jhu.edu/resources/freeresourcescovid19/ Continue reading

31

通过IMGT数据库认知免疫组库

免疫组库测序(Immune Repertoire Sequencing,IR-Seq)是非常小众的产品,并不属于TCGA的7种数据(WGS,WES,RNA-seq,miRNA,450K等等),所以我并没有在B站录制公益教学视频。
有趣的是,最近突然接到了一些粉丝求助,关于免疫组库数据处理的。所以就系统性的整理一下相关知识点,并且带领大家实战演练一个完整的免疫组库测序数据项目分析流程哈。 Continue reading

31

生物信息学大百科全书

不知道多久以前在朋友圈看到转发分享:因为疫情,Johns Hopkins的Project Muse 限时免费,包括普林斯顿、康奈尔、乔治亚、哈佛、港中文、ACA、Early Theatre等40多家出版社基本都开放了自己的电子资料库,共有近24000本原版英文书,282本期刊。 链接是:https://about.muse.jhu.edu/resources/freeresourcescovid19/ Continue reading

31

什么,你连10块钱的云服务器都不想买

前些天为了帮助广大粉丝度过难关,所以开放了生信技能树全平台的招聘信息,见:还说啥呢,继续免费啊,而且里面还有一个是:购买入门级服务器免费送Linux直播培训服务,有粉丝留言说之前我们还赠送服务器的,现在居然还要自己购买,这免费活动不诚心啊!我连忙删除了这个留言还把它拉黑! Continue reading

31

谁说肿瘤高表达基因就是生存风险因子

非常多的粉丝在我们生信技能树后台留言询问,为什么他/她关注的基因明明是癌基因,明明是在肿瘤病人高表达(TCGA数据库搜索后的结果),但是却发现它对生存的影响居然是保护因子!(同样的网页工具)

所以我这里安排一个学徒作业,大家需要去下载TCGA数据库的BRCA这个癌症的芯片和RNA-seq的表达矩阵,分别进行差异分析,拿到统计学显著的上下调基因列表。 Continue reading

31

如果你问我R代码调试我就会告诉你head

任何一个编程语言, 要想足够好用,都必须要有完善的代码调试机制,毕竟谁写代码还不碰到几个bug呢。

比如R语言编程,简单的R代码调试,其实靠head,str,help函数即可。所以我从强调初学者应该是要至少把这3个函数敲1000遍以上。比如,群里有人问它的表达矩阵里面的探针ID,跟他准备好的探针ID与基因对应表格, 无法匹配,自己在Excel手动搜索,明明是每一个探针都存在于准备好的探针ID与基因对应表格里面。 Continue reading