熟悉DNA测序的朋友应该是知道对肿瘤病人进行WES或者WGS等基因组测序后,可以得到成百上千的somatic突变,而这些突变都是ATCG碱基直接变化,所以它们变化的组合情况就6种,而加上上下文碱基也就96种,这96种碱基变化的比例的特殊组成,就是mutation signatures,而且COSMIC数据库上面有着30种已知的signatures,我们可以把这些signatures当做是一个有意义的生物学功能,这样一旦我们拿到自己的突变数据, 就可以通过非负矩阵分解的方法把自己的突变数据分解为这30个signatures的组合,那么如果我们拿到的是表达矩阵呢? Continue reading
Category Archives: 未分类
CancerQuest(埃默里大学的一个癌症教育和外展项目)
有多少人做的是癌症相关研究,但其实对自己的研究对象了解很少,只是一些流行病学指标,全球各大国家地区的发病率和死亡率。所以前些天我推荐了:《高通量测序技术在肺癌领域的应用(书籍推荐)》 ,很多粉丝留言说看得非常过瘾,那就再推荐一些癌症背景知识学习资源。 Continue reading
这也怪我咯?
最近微信里“躺尸”四年的一个“好友”因为朋友圈点赞聊了几句,混的不太好,也抱怨了自己肿瘤液体活检数据分析遇到的疑难杂症在我生信技能树公众号找不到解决方案。提到了一个很新颖的观点:因为我这些年持续发布免费教程、免费视频,免费分享把这个行业利润搞低了,所以大家没有人研发高级收费课程,因为赚不到钱!而且他自己有一些想分享的经验也不好意思开课赚钱。 Continue reading
在clinicaltrials可以查询药物临床试验注册情况
最近看了一些综述,其中中国肿瘤生物治疗杂志 http://www.biother.org Chin J Cancer Biother, Jul. 2018, Vol. 25, No. 7的文献提到了研究者统计了临床试验,状态为文稿提交当天所统计(来源http://www.clinicaltrials.gov)其中免疫检查点的临床试验情况如下: Continue reading
一周内搞定基于Linux的NGS上游分析
距离公布要带500个优秀本科生入门生物信息学的活动不到一个月,虽然真正入选不到一百,但是培养成绩喜人,出勤率接近百分之百,大部分人在短短两个星期就完成了R基础知识学习,Linux认知,甚至看完了转录组实战水平,进而完成了一个自己的课题!如果你也感兴趣这个活动,那么,直达文末找到活动链接,申请加入吧! Continue reading
学徒作业-我想看为什么这几个基因的表达量相关性非常高
不知道多少人看完了全网第一个单细胞课程(免费基础课程),免费学习地址在B站:https://www.bilibili.com/video/av38741055 而且完成结业考核20题:https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w ,作业里面有一个头颈癌单细胞的:
课程配套资料(主要是代码和PPT)文档在:https://docs.qq.com/doc/DT2NwV0Fab3JBRUx0 Continue reading
学徒数据挖掘代码打包
其实公共数据库挖掘仅仅是你科研课题的前戏,避免你重复浪费科研经费去做一些明明可以通过分析公共数据库拿到的结论。 Continue reading
学会看IHC病理切片从HPA开始
人类蛋白图谱(Human Protein Atlas,HPA)数据库已经成为了数据挖掘标配,通常你定位到了感兴趣的有生存预后意义的基因,就会去HPA数据库看看!
比如发表在Front. Oncol., 11 September 2018 | https://doi.org/10.3389/fonc.2018.00374的文章,定位到了5个hub基因,就去HPA数据库看乳腺癌的tumor和normal组织的这些基因的比例切片情况。 Continue reading
需要5个步骤来说明你想研究的基因的重要性
大量的生物学研究都是基于单个基因,不管你是实验室祖传的明星基因还是自己通过文献积累凭感觉挑选到的基因,在完善自己的生物学故事的时候,都需要在开头加上一些引人入胜的证据来说明自己文章定位的基因的重要性。 Continue reading
下载R包却联网失败?初学者的痛
Windows电脑使用R语言有几个绕不过去的坑,就是管理员权限,中文用户名等等,所以我们开展R语言学习班,都需要重新发几次:Windows电脑使用Rstudio会有多少错误呢 ,有一个联网问题本来是疑难杂症,因为我们的讲师助教团队带了二十多场学习班才遇到过一次,也在生信技能树分享了BiocManager无法安装R包的经验,不就是修改options(download.file.method = ‘libcurl’),还需要加上options(url.method=’libcurl’)。 Continue reading
听说你想学scATAC
组学技术层出不穷,基本上都可以在单细胞水平实现,虽然大家接触的都是单细胞转录组,其实主要是因为10X仪器商业化的成功,目前10X在主攻scATAC和空间转录组解决方案,那么肯定会有人感兴趣scATAC的数据处理了。 Continue reading
使用miRNAtap数据源提取miRNA的预测靶基因结果
前面我们分享了:microRNAs靶基因数据库哪家强,提到了综合了12个网页工具的miRWalk,以及整合了7个工具的miRSystem,但是最后我们仍然是推荐R包multiMiR作为提取miRNA的预测靶基因结果的解决方案,除了因为它综合了14个网页工具,而且还是这个月更新过,还有一个很大的原因是,我喜欢编程,喜欢R语言! Continue reading
使用ESTIMATE计算肿瘤的免疫得分
虽然是生物学过程很多,但是免疫的重要性毋庸置疑,大家的肿瘤研究课题最后很喜欢定位到免疫这个话题。
计算肿瘤的免疫得分的软件算法不少,其中ESTIMATE是一个还算比较容易理解的,优秀的工具,但是我发现关于它的教程非常少,而且基本上都以我多年前在生信技能树分享教程为原型:使用ESTIMATE来对转录组表达数据根据stromal和immune细胞比例估算肿瘤纯度 Continue reading
十行代码完成circRNA多种ID相互转换
科研热点层出不穷,从技术层面来看miRNA,lncRNA,circRNA,ceRNA各领风骚一两年,现在又是m6A和单细胞。前面我们在生信技能树已经系统性的总结了circRNA的相关背景知识: Continue reading
什么,给了你这么多miRNA靶基因查询R包和网页工具你居然不知道怎么使用
前面,我们多次介绍了关于miRNA的靶向基因的查询工具,分别是:
三代(PacBio/Sequel/Nanopore)细菌完成图
前面我们在 单细胞转录组数据分析大放价 (疫情期间不打烊),里面提到了因为疫情原因,一些老同事不得不身兼多职,甚至下海接项目。 Continue reading
拼凑6个网页工具图表还不够那就再加上6个组学
学TCGA数据库并不是为了发“套路”文章,那些基本上是本科生毕业设计的水准,但是阅读这样的文章的确可以很大程度上帮助大家认识TCGA数据库,主要是了解它可以做什么,比如我昨天在生信技能树介绍的:[需要5个步骤来说明你想研究的基因的重要性] Continue reading
每月一生信流程之rnaseqGene
每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》,他那个时候介绍的主要是生信基础知识,包括数据结构,数据格式,数据库资源,计算机基础等等,所以每天都可以进步,每天都有成果。这些基础知识已经被分享的七七八八了,所以我这里推陈出新,来一个每月一生信流程,陪生信技能树的粉丝们一起进步! Continue reading
检查多个测序样本是否来源于同一个病人
多组学分析大行其道的今天,同一个病人我们可以对其做多次不同技术的测序,比如TCGA计划就有不下8种数据:
- DNA Sequencing
- miRNA Sequencing
- Protein Expression array
- mRNA Sequencing Continue reading
服务器被关机,不妨试试看用你的Mac电脑跑NGS流程
前面我在生信技能树提到过:没有docker我真的不想动这样的生信软件,引起了很多生信工程师的共鸣,大家基本上都在软件安装方面踩坑过,都是泪。在生信菜鸟团也有关于生物信息学环境搭建的讨论。 Continue reading