我的GEO芯片数据分析教程本来就是为粉丝写的,基本上就是生信菜鸟团QQ群的诸位问什么,我就临时搜索整理讲解那个知识点,非常融洽,目录如下: Continue reading
Category Archives: 未分类
对表型数据框进行去冗余
上次GEO课程回答了学员问题:使用R语言在向量的任何位置插入任何元素 实力演示了如何自定义函数,这样大家就可以无限制创造方法来解决自己特殊的需求,课后一个月的答疑期,发现大家还是有各式各样的问题,比如下面的表型信息: Continue reading
第一期单细胞视频笔记汇总
到底是批次效应还是真实生物学差异
因为10X仪器的商业化成功,目前大家的单细胞转录组课题基本上都是10X数据,所以我在单细胞天地分享了一系列相关教程,希望可以接地气的帮助大家,如下: Continue reading
当年被拒稿的bowtie如今获得近1.5万的引用
做生物信息学的我们很难不认识bwa和bowtie了,可以说是短序列(reads,NGS测序片段)比对领域第一第二了,在Twitter看到一个有趣的讨论,关于bowtie当年被拒稿: Continue reading
单细胞至少得培训3天及以上
单细胞成为了科研热点,是毋庸置疑的,所以很多商业培训机构跟风开始举办各式各样的培训班,粗略看了下课表,简直~~~ Continue reading
不同矫正批次效应方法的比较
前面我在生信技能树推文:你确定你的差异基因找对了吗? 提出了文章的转录组数据的60个样品并没有按照毒品上瘾与否这个表型来区分,而是不同人之间的异质性非常高,这个时候我提出来了一个解决方案,就是理论上就可以把人当做是一个批次效应,使用北京大学李程课题组开发的sva包的combat函数,把这样的效应去除一下,接着再找差异。 Continue reading
安装GitHub的R包困难解决方案
相信遇到这样的问题的朋友不在少数,在中国大陆做数据分析,下载软件数据文件遇到困难那是家常便饭。
比如安装GitHub的R包,因为并不是所有的R包都会被正式的发布在CRAN或者bioconductor,所以对于简简单单分享在GitHub的R包一般我们搜索到如下代码: Continue reading
30G的芯片数据怎么下载呢
最近接到学徒求助,在广州,导师给了她分析cnv芯片的任务,调研文献发现,数据集很可怕,30G的芯片数据感觉下到猴年马月都不一定能成功! Continue reading
Untitled
发表在免疫杂志October 2013,的文章Spatiotemporal Dynamics of Intratumoral Immune Cells Reveal the Immune Landscape in Human Cancer 根据公共数据库的 28 cell types ,定下来了 Five hundred seventy-seven cell-type-specific genes (681 Affymetrix probes) 。 Continue reading
8个CRC病人的多位点取样单细胞转录组数据分析建议
每个病人 5个以上的样品,每个样品是 SMART-SEQ2测序,约100个细胞左右。
第一个分析,CNV
搜索一下对SMART-SEQ2测序数据做CNV分析,绘制如下CNV全景图。 Continue reading
1折优惠征稿期又来啦
距离上一次我们生信技能树公开征稿已经过去一年半啦,见:生信技能树征稿启事 ,那个时候还在庆贺公众号粉丝数突破两万人大关,因为入场晚,所以那个时候还需要参加同领域各种排名。现在不一样了,技能树是众所周知的生物信息学领域第一,当之无愧的流量当担! Continue reading
R语言代码相关标准提问
关于如何提问,如何高效沟通,其实我们讲解非常多了,比如我一直推崇的邮件交流:如果你希望我回答你的问题 ,然后也会随机抽取粉丝提问进行解答:答读者问第一弹:R里面差异分析的limma包用法细节 。 也高度赞扬郭一些提问交流的模式,比如:求助:Zotero中添加Markdown插件失败 Continue reading
R包升级与降级
关于R语言本身的升级与降级我们多次写教程阐述了,其实在Windows和MAC都是可以多个R版本共存的,Linux那就更不用说了,一切皆文件,想存放多少就可以多少。它们只不过是把谁放在环境变量罢了的问题,优先使用哪个的问题。 Continue reading
R包降级也不全是那么简单
昨天写了,以为大家都可以很轻松做到,发现其实只是自己随心所欲罢了,第一因为自己的Mac电脑,其次因为自己看得懂R的提示,说缺依赖包,所以需要手动安装一些依赖包。
如果是Windows用户,会有一个make缺失这样的错误,如下: Continue reading
nature文章也要挖掘单细胞公共数据
我列过一个生物信息学入门200篇NGS文献解读计划,其中一个文献是发表于2018的NC,标题是:Unravelling subclonal heterogeneity and aggressive disease states in TNBC through single-cell RNA-seq 对6个TNBC病人
总共测了 超过1500个单细胞 ,质控后还剩下1189个单细胞进入下游分析。使用的是FACS加上Smart-seq2 ,非常中规中矩的分析,所以就发了同样中规中矩的NC。 Continue reading
KM生存曲线经logRNA检验后也可以计算HR值
最近根据基因表达量对病人进行分组后,使用KM生存分析的logRNAK法来检查两个组的病人的生存差异,得到了如下的图: Continue reading
HTA2.0芯片比较麻烦
表达芯片数据处理教程,早在2016年我就系统性整理了发布在生信菜鸟团博客:http://www.bio-info-trainee.com/2087.html 配套教学视频在B站:https://www.bilibili.com/video/av26731585/ 代码都在:https://github.com/jmzeng1314/GEO 早期目录如下: Continue reading
GEO和GitHub下载神器
大家都知道,我GitHub的各个项目代码基本上都是待发表的文章,比如我3年前的WGCNA的教程, 有人拿去发文章了 , 是不是很有趣,https://github.com/jmzeng1314/my_WGCNA
CRC稳定的分子分型
做乳腺癌研究的都是知道PAM50分型,以及TNBC内部继续各种算法分子亚型划分的,最近看到CRC的研究,分型就简单很多,最出名的应该是下面这个: Continue reading