我在生信技能树的教程:《你确定你的差异基因找对了吗?》提到过,必须要对你的转录水平的全局表达矩阵做好质量控制,最好是看到标准3张图: Continue reading
Daily Archives: 2020年8月16日
TCGA数据库的normal样本不够可以拿GTEx来凑
太多人问到:自己想挖掘的癌症,虽然是在TCGA数据库有数据,但是normal(癌旁样品或者血液)太少了,做差异分析什么的, 会面临样本数量不平衡问题,是否可以纳入GTEx数据库的正常组织转录组测序数据。 Continue reading
ID转换靠的是深厚的背景知识加上一点代码技巧
有学员提问:
请教老师,在分析一个芯片数据时候,遇到这个GPL16686平台,直接看平台信息里面的表格如图,找不到基因名,所以不知道该怎么办,ID转换就卡死了,后续的差异分析,火山图,热图等等都无从下手。 Continue reading
hg19转为hg38后居然会导致坐标排序发生变化
如果我们要比较的两个vcf文件的参考基因组版本不一致,就需要使用CrossMap等软件进行参考基因组版本转换,然后使用 SnpSift 软件的 Concordance 命令比较它们。其中CrossMap软件依赖pyBigWig,使用conda进行安装,代码如下: Continue reading
转录组高级分析之融合基因
一般来说,数据分析的任何一个点都会有成百上千个实验室在为之努力,比如比对,定量,可变剪切,融合基因这些步骤,那么同时也会有很多工具测评的文章,比如针对融合基因的随便搜一下,就可以发现下面两个: Continue reading
这样的诊断模型才优秀
前些天在生信技能树的教程:这样拿差异基因集做肿瘤诊断模型不是明知故问吗,我抛出来了一个开放性问题,也是抨击了一下那个简陋的诊断模型,有粉丝“挑衅”我说如果那个诊断模型不好,有本事我自己发一个好的啊!我就呵呵了,我是否具备抨击某事物的资格并不需要我有能自己创造那个事物的为前提,建议他回去好好学习逻辑学。 Continue reading
在R里面对三元一次方程求解
三元一次方程大家应该是不陌生的,形如 aX + bY + cZ = d
的就是,其中X,Y,Z是未知的变量,a,b,c,d 都是已知的常量,通常呢,需要至少3个没有线性关系的已知等式才能求唯一解。例如,已知: Continue reading
优秀本科生夏令营辅导群
暑假前的优秀本科生数据挖掘毕业设计课题辅导活动, 已经带领了近100多名优秀本科毕生了解生物信息学,并且完成了相关毕业设计,见:这120万我就不要了,送给500名优秀本科生,看到朋友圈的那些小朋友相继开启毕业照朋友圈刷屏模式,甚是欣慰。 Continue reading
五分钟搞定你的个人博客
因为众所周知的原因,大家在简书等平台分享自己的学习笔记经常会受限,包括莫名其妙的被删帖或者一段时间无法发帖,在其它平台包括CSDN,博客园,知乎也是如此,严苛的内容审查机制和防止外链的限制特别影响大家的发挥。 Continue reading
为什么不打折呢
这不618大促嘛,很多粉丝后台问我:期待我们的生信爆款入门学习班好久了,能不能在618大促打折搞活动啊!