昨天我在生信菜鸟团分享的学徒数据挖掘任务: 不一定正确的多分组差异分析结果热图展现 提到了可以使用单细胞转录组数据分析流程来处理文献的数据集。 Continue reading
全网第一个单细胞课程虽然没有满1000份但是我也不卖了
全网第一个单细胞课程陆陆续续运营两年了,基本上大家目前看到的市面上的公司或者培训机构的单细胞相关培训材料,讲师,都是看我们的教材慢慢出师的。期间我们进行了两次预售:
前面我们分享的3天单细胞培训是有免费的配套教学视频的
上个星期我们在单细胞天地公众号推出了: 单细胞至少得培训3天及以上,如何鉴别好的培训班 非常受大家欢迎,实力避免大家踩坑,很多粉丝表示仍然是没有看出来Single cell RNA-seq data analysis with R课程全套资料在哪,其实得批评,我给了关键词 《Single cell RNA-seq data analysis with R》 Continue reading
批次效应不得不防
在最近的生信技能树推文里面我提出来了一个开放性问题 你确定你的差异基因找对了吗? 指出来了,文章的转录组数据的60个样品并没有按照毒品上瘾与否这个表型来区分,而是不同人之间的异质性非常高,这个时候我提出来了一个解决方案,就是理论上就可以把人当做是一个批次效应,使用北京大学李程课题组开发的sva包的combat函数,把这样的效应去除一下,接着再找差异。 Continue reading
跑BWA比对测试一下酷睿I9的CPU
最近给学员买了一个CPU,非常的霸气:
查看测试数据,配对的肿瘤外显子数据,fq文件如下: Continue reading
拍卖会
因为11月23号周六到24号周日在上海,所以昨天公布了一个“义诊”的通知,响应者众多,大概收到了二十多封邮件,但是其中15个都应该批评,明知故犯,说好的需要自我介绍,课题详情,起码得300字以上吧。敷衍了事的态度让我心寒,所以剩余的粉丝不要着急,有的是时间慢慢酝酿你需要咨询的问题,而且我们名额足够,3个小时怎么着也可以诊断30个生物信息学疑难杂症啦! Continue reading
你知道吗?超1成的人类癌症跟病毒感染相关
最近看的一篇文章,提到了:Approximately 10.8% of human cancers are associated with infection by an oncogenic virus.
原文是:Oncogenes and RNA splicing of human tumor viruses Continue reading
你都不感谢我凭什么要求我帮你宣传
昨天的推文:发nature communications了不起吗 引起了不少读者的共鸣,揭露出来了社会一个比较普遍的现象,稍有成果就颐气指使,而且缺乏感恩的心态。 Continue reading
你的芯片数据结果跟已发表的完全不一致咋办
最近看的一个很有趣的文献,里面很直白的说自己的差异分析得到的基因集,跟前面两个研究的基因集,完全没有重合之处,但是作者给了比较合理的解释,所以想分享给大家。 Continue reading
你的单细胞分群数量太少可能就是因为你测的细胞数量不够
数据库构建也是生物信息学领域一个大方向,尤其是现在大热的单细胞领域,应该是不少团队在为单细胞数据库资源网页在踌躇满志了,不过单细胞数据之大,绝大部分实验室课题组是hold不住这个方向的数据这里的,最近看的一个预印本文章是:A curated database reveals trends in single-cell transcriptomics Continue reading
数据下载碰到的问题的小总结
全国巡讲南京站过去还不到一周,学员们课后练习都很拼,微信群答疑对话一不留神就几百条了,爱学习的你是最美丽的!
恰好看到一个学员开始主动思考,自行摸索,超出我们授课范围的知识点整理,主动投稿,下面请大家欣赏一下南京站学员分享: Continue reading
每月一生信流程之rnaseqDTU
每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》,他那个时候介绍的主要是生信基础知识,包括数据结构,数据格式,数据库资源,计算机基础等等,所以每天都可以进步,每天都有成果。这些基础知识已经被分享的七七八八了,所以我这里推陈出新,来一个每月一生信流程,陪生信技能树的粉丝们一起进步! Continue reading
每月一生信流程之RNAseq123
目前bioconductor社区有27个流程,早在2015/2016年我组织生信菜鸟团小伙伴建设bioconductor中文社区的时候就想系统性的学习和分享,一晃四五年过去了, 我们的bioconductor中文社区只有一个空荡荡的主页,我自己的几个笔记而已,很可惜没有能坚持下去,不过现在有数十万粉丝了,这些资料必须得强推给大家,系统性学习生物信息学的宝藏资源! Continue reading
每月一生信流程之maEndToEnd(传统的表达芯片技术数据就应该怎么处理)
每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》,他那个时候介绍的主要是生信基础知识,包括数据结构,数据格式,数据库资源,计算机基础等等,所以每天都可以进步,每天都有成果。这些基础知识已经被分享的七七八八了,所以我这里推陈出新,来一个每月一生信流程,陪生信技能树的粉丝们一起进步! Continue reading
没有生物学背景的数据分析很危险
前些天我在介绍GEO数据挖掘技术应用到RNA-seq数据分析的推文:GEO数据挖掘技术可以应用到表达芯片也可以是转录组测序 布置了一个作业:下载到GSE106292 数据集的 Excel表格如何读入R里面,做出作者文章的那样的图,可以参考关键问题答疑: Continue reading
3种方法注释你的甲基化探针
关于表达芯片的公共数据库挖掘我这边以及差不多把改写的推文在2年前就写完了,但表达芯片毕竟只占芯片市场的半壁江山,还有大量的非表达芯片,比如大名鼎鼎的甲基化芯片。关于甲基化,我们公众号教程非常少,主要是因为我本人在短暂的6年生物信息学工作经验中并没有实际负责过这样的项目,而我们公众号90%教程都是我写的,极少的投稿里面,只有 [850K甲基化芯片数据的分析] Continue reading
计算wes数据全部外显子的平均测序深度
如果学徒之后跑流程,那其实前途很有限,所以我安排了一个随机任务,考核他们查资料解决问题的能力。我在Published: 04 April 2012 文章, The clonal and mutational evolution spectrum of primary triple-negative breast cancers 看到了一个有趣的图。 Continue reading
基于star比对工具的单细胞转录组数据可变剪切流程来啦
前些天我在生信技能树介绍过star-fusion:最好用的融合基因查找工具终于正式发表了 ,然后在另外一个教程:一个好像没有做任何改变的参数 提到了目前大量的单细胞转录组数据出来了,却没有一个文章去探索融合基因,也没有人开发工具,是一个空白市场,大家可以试试看哦。虽然商业化很成功的10X仪器做单细胞其实找融合基因还是有点勉强的,毕竟它并不是转录组全长测序,所以基本上很难获得融合位点融合事件,不过,如果是smart-seq2技术实际上是可以的啊! Continue reading
基于bam文件做可变剪切的软件leafcutter和rMATS的比较
基于fastq测序数据可以做可变剪切,比如bioconductor流程rnaseqDTU 就说明了salmon软件和R包打配合,不过大多数情况下,我们其实已经采用了star或者hisat2软件对fastq测序数据根据参考文件已经进行了比对,这一个步骤非常耗时,所以我们做可变剪切理论上应该是从bam文件开始,省时省力哈! Continue reading
发NC了不起吗
刚才某上海地区的粉丝突然发信“责问”我为什么没有发他们课题组成果的宣传稿,我表示“一脸懵逼”,想起来原来是前些天他也是这样“随意”委托过我,说课题组刚刚发了一篇nature communications,其它公众号bioart,测序中国等等都会跟进报道宣传,“希望”我们生信技能树也同步宣传。 Continue reading