巧妇难为无米之炊,我们作为生信工程师如果没有一个趁手的服务器,很多ngs上游分析都无从谈起。
但是生物信息学在我们生信技能树这些年的大力推广下,已经走入生命科学领域寻常百姓家,大量湿实验工作者开启了他们的编程人生,大大的超出了服务器的配置速度。其实不同实验室不同课题,对服务器的需求不一样,可以简单总结如下: Continue reading
根据基因表达数据预测药物作用
最近接到粉丝求助,他看到了一个很简单的肿瘤单基因数据挖掘文章:A TP53-associated gene signature for prediction of prognosis and therapeutic responses in lung squamous cell carcinoma**提到了一个药物预测分析: Continue reading
单细胞小提琴图自己画
小提琴图在单细胞领域应用非常广泛,能比较好地展现具体的某个基因在不同的单细胞亚群的表达量高低分布情况,如下: Continue reading
初次尝试中国区的GitHub,即码云(gittee)
我在GitHub有很多代码仓库,战绩还不错,帮助了十万生信工程师,地址是:https://github.com/jmzeng1314
不过,我比较懒,写代码仅仅是顺手而为,其实对代码本身并不感兴趣,编程这个东西,思维上没有挑战,太简单了,不想把时间花在上面。 Continue reading
差异基因没办法富集到通路你就放弃了吗
我在生信技能树分享了一个教程:不要怀疑,你的基因就是没办法富集到统计学显著的通路,强调了大家做生物信息学数据分析的同时,一定要加强统计学基础,比如把差异基因集(500个左右的基因)富集到KEGG数据库通路,本质上就是对每个通路单独做一次超几何分布检验罢了! Continue reading
比较不同的肿瘤somatic突变的signature
前面我们详细讲解过,sanger研究所科学家【1】提出来了肿瘤somatic突变的signature概念 ,把96突变频谱的非负矩阵分解后的30个特征,在cosmic数据库可以学习它。不同的特征有不同的生物学含义【2】,比如文章【3】 就是使用了 这些signature区分生存!主要是R包deconstructSigs可以把自己的96突变频谱对应到cosmic数据库的30个突变特征。 Continue reading
10X单细胞转录组理论上有3个文件才能被读入R进行seurat分析
我在单细胞天地教程:表达矩阵逆转为10X的标准输出3个文件,详细介绍过 10X文件的3个标准文件: Continue reading
10个小时搞定科目一
上周五在三亚摘完芒果就飞往上海见了一下学徒,本来计划是周一飞往山西太原,有意思的是他们防疫政策很高效,要求所有的广东人都需要做核酸检测以及隔离,我就呵呵一下,果断不去了。恰好我的教练发朋友圈说科目一考场开放了,就报名约考周三上午。这样我周一飞回去休息下,第二天有一整个白天时间备考科目一,完美! Continue reading
0元10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》
早在2015年,那时候我进入生信领域还不满两年,就看到了一则新闻,说百度CEO李彦宏将个人捐赠3000万元,支持百度与北京协和医学院针对食管癌基因组研究的合作。 Continue reading
WGCNA的TOM矩阵热图配色问题
我在生信技能树多次写教程分享WGCNA的实战细节,见:
TCGA数据库里面你的基因生存分析不显著那就TMA吧
最近看到文献里面提到了针对膀胱癌的METTL3基因的生存分析,我定睛细看,发现并不是TCGA里面的表达数据,而是IHC的结果,如下: Continue reading
Seurat包的findmarkers函数只能根据划分好的亚群进行差异分析吗
前面我已经把全网第一个单细胞课程(基础课程)免费公布在了B站:https://www.bilibili.com/video/av38741055
rmarkdown报表也可以很漂亮
我在B站阅读量10万+的视频合辑:【生信技能树】生信人应该这样学R语言 , https://www.bilibili.com/video/BV1cs411j75B?p=33 最后一讲,有一个彩蛋,里面其实是P33#福利# 使用rmarkdown制作转录组差异分析结题报告 ,这些年不间断推广,让这个rmarkdown报表走入了成千上万的粉丝! Continue reading
R语言公益课程之bioconductor
我在生信技能树公众号发的《生信分析人员如何系统入门R(2019更新版)》给初学者的六步系统入门R语言,知识点路线图如下: Continue reading
R语言公益课程之基础绘图
我在生信技能树公众号发的《[生信分析人员如何系统入门R(2019更新版).](https://mp.weixin.qq.com/s/xOT4QGQsBMwu6R38AE9Y6A》给初学者的六步系统入门R语言,**知识点路线图**如下: Continue reading
miRNAseq数据分析这么多年了它的流程也没有固定
五年前我在生信菜鸟团博客分享了 一篇文章学会miRNA-seq分析 ,使用 RNA expression profiling of human iPSC-derived cardiomyocytes in a cardiac hypertrophy model. PLoS One 2014;9(9):e108051. PMID: 25255322 文章里面的 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE60292 数据集,2个分组,共6个样本。 Continue reading
ggplot2绘图基础功不扎实?看完这5个资源
单细胞技术大热,其数据分析里面很重要的一个环节就是可视化,真的是五花八门了!我们在单细胞天地公众号分享过几百篇单细胞CNS文章阅读笔记,大家可以看得到: Continue reading
bowtie比对miRNA的reads时候参数的影响
有两个很重要的参数:
- -m,指定最大比对到基因组的次数(suppress all alignments if > exist (def: no limit))
- -v或者-n,允许最大错配数,为[0-3] Continue reading
Untitled
这样画热图,涉嫌操纵数据了吗
很多朋友都有这样的疑问,为什么别人绘制出来的热图,差异那么明显,除了首先他们本身就先做了差异分析,挑选出来了有差异的基因,然后才热图可视化外,其实还有一个步骤,就是按照基因(行)对表达矩阵进行zscore转换。 Continue reading