我在生信技能树的教程:《你确定你的差异基因找对了吗?》提到过,必须要对你的转录水平的全局表达矩阵做好质量控制,最好是看到标准3张图: Continue reading
Monthly Archives: 8月 2020
TCGA数据库的normal样本不够可以拿GTEx来凑
太多人问到:自己想挖掘的癌症,虽然是在TCGA数据库有数据,但是normal(癌旁样品或者血液)太少了,做差异分析什么的, 会面临样本数量不平衡问题,是否可以纳入GTEx数据库的正常组织转录组测序数据。 Continue reading
ID转换靠的是深厚的背景知识加上一点代码技巧
有学员提问:
请教老师,在分析一个芯片数据时候,遇到这个GPL16686平台,直接看平台信息里面的表格如图,找不到基因名,所以不知道该怎么办,ID转换就卡死了,后续的差异分析,火山图,热图等等都无从下手。 Continue reading
hg19转为hg38后居然会导致坐标排序发生变化
如果我们要比较的两个vcf文件的参考基因组版本不一致,就需要使用CrossMap等软件进行参考基因组版本转换,然后使用 SnpSift 软件的 Concordance 命令比较它们。其中CrossMap软件依赖pyBigWig,使用conda进行安装,代码如下: Continue reading
转录组高级分析之融合基因
一般来说,数据分析的任何一个点都会有成百上千个实验室在为之努力,比如比对,定量,可变剪切,融合基因这些步骤,那么同时也会有很多工具测评的文章,比如针对融合基因的随便搜一下,就可以发现下面两个: Continue reading
这样的诊断模型才优秀
前些天在生信技能树的教程:这样拿差异基因集做肿瘤诊断模型不是明知故问吗,我抛出来了一个开放性问题,也是抨击了一下那个简陋的诊断模型,有粉丝“挑衅”我说如果那个诊断模型不好,有本事我自己发一个好的啊!我就呵呵了,我是否具备抨击某事物的资格并不需要我有能自己创造那个事物的为前提,建议他回去好好学习逻辑学。 Continue reading
在R里面对三元一次方程求解
三元一次方程大家应该是不陌生的,形如 aX + bY + cZ = d
的就是,其中X,Y,Z是未知的变量,a,b,c,d 都是已知的常量,通常呢,需要至少3个没有线性关系的已知等式才能求唯一解。例如,已知: Continue reading
优秀本科生夏令营辅导群
暑假前的优秀本科生数据挖掘毕业设计课题辅导活动, 已经带领了近100多名优秀本科毕生了解生物信息学,并且完成了相关毕业设计,见:这120万我就不要了,送给500名优秀本科生,看到朋友圈的那些小朋友相继开启毕业照朋友圈刷屏模式,甚是欣慰。 Continue reading
五分钟搞定你的个人博客
因为众所周知的原因,大家在简书等平台分享自己的学习笔记经常会受限,包括莫名其妙的被删帖或者一段时间无法发帖,在其它平台包括CSDN,博客园,知乎也是如此,严苛的内容审查机制和防止外链的限制特别影响大家的发挥。 Continue reading
为什么不打折呢
这不618大促嘛,很多粉丝后台问我:期待我们的生信爆款入门学习班好久了,能不能在618大促打折搞活动啊!
为难你了,选择生信技能树
最近有粉丝发邮件咨询我单细胞问题的时候,我指出来其实是因为他R语言知识不牢固,所以没办法从特定的S4对象里面提取内容,转录组基础也没有学习所以不明白文库是什么,其实就是说并不是单细胞本身知识点问题,所以推荐他去听我B站的全网第一个单细胞课程(免费基础课程),过两天他回信说太感谢我的教程了,之前确实是基础知识不够所以单细胞数据分析的很勉强,一步一个坑。 Continue reading
同样的的单细胞研究,为什么发表的文章杂志等级差别那么大
新冠疫情期间,关于COVID-19病毒感染病人的单细胞研究很多,我看到《单细胞天地》解读了:COVID-19病人支气管免疫细胞单细胞测序分析,文章信息如下: Continue reading
使用SnpSift把vcf文件的变异位点注释到clinvar数据库
号外:生信技能树知识整理实习生招募,长期通知,也可以简单参与软件测评笔记撰写,开启你的分享人生!
遗传变异的数据库注释非常简单,就是从数据库里面下载记录文件,然后根据坐标对应一下即可,甚至很多成熟的工具都可以自动下载数据库以及比对,就跟我们前面讲到的把vcf文件注释到dbSNP数据库的ID一样简单。我在多年前的直播我的基因组讲过很多了: Continue reading
生信技能树知识整理实习生招募
在生信技能树,生信菜鸟团,单细胞天地分享了超1.3万篇教程后,越来越感觉时间与精力不够用,且不说每日都要维持多个公众号的教程原创笔记撰写,仅仅是把这些教程发布出去,都是不小的工作量。目前我的教程同步更新在知乎,博客,腾讯云社区,简书,B站,论坛等平台,而且还有二十多个微信学习交流群需要维护,见: Continue reading
生信技能树视频号诚邀您关注
我其实非常犹豫,是否应该把生信技能树视频号推荐给大家,并不是因为里面的内容不够丰富,也不是说视频号这样的短视频模式不适合学习,主要是因为技术教程天然就赢不了娱乐视频,尤其在传播性和获取用户注意力方面。 Continue reading
生信技能树的融合基因教程系列合辑
号外:生信技能树知识整理实习生招募,长期 通知,也可以简单参与软件测评笔记撰写,开启你的分享人生!
融合基因是由染色体重排而产生的,包括染色体的易位,插入,颠倒,缺失。基因融合也在肿瘤发生发展过程起重大作用,约2成的癌症患者死亡是因为有基因融合这样的突变。基因融合广泛发生在各种各样的的癌症,而且很多基因融合事件都具有癌症种类的特异性。非常知名的有: Continue reading
生信故事会之中年大妈的自我救赎
背景介绍
坐标:湖北省会,对,就是那个全世界都在给她加油、现在仍然在喊加油的地方,上半年抗疫,下半年抗洪。 Continue reading
什么,SRA测序数据要收费了
如果大家学过我免费共享在B站上不同的数据分析视频课程,见:
什么!!!超70G的NT数据库文件一个小时搞定?
还省掉了几百块钱的会员费!!!
最近有粉丝求助,说自己已经耗费十多天了还没有把一个NT数据库下载下来,不得已充值会员费希望可以加速,但是效果也很惨淡,如下图: Continue reading
舍近求远为哪般
有粉丝提问为什么我免费共享在B站那么多不同的数据分析视频课程,见: