不知道大家是否还记得几年前我翻译和传播的一个新闻:一个MIT的博士要离开学术圈,结果······ 原作者的题目是:再见吧,我的学术生涯! 评论区众说纷纭,也确实给大家了一些启发。现在是2020年的第2天,我在朋友圈看到另外一个类似的故事,因为主人公是中国人所以会让我们更加有代入感,关键是不需要翻译,传递出原汁原味的人生感悟。希望能对正处于人生关键抉择路口的你有帮助。 Continue reading
眼馋Y叔的可视化函数却还想使用DAVID结果肿么办
昨天宣传了Y叔的clusterProfiler包之让人眼花缭乱的可视化炫技,见:为R包写一本书(向Y叔致敬) 。有趣的是粉丝留言提到:Y叔的图必须以富集出来的对象,比如enrichKK来画,如果是自己准备数据框的话,就不行,不知道作者有没有好的建议? Continue reading
芯片探针ID的基因注释以前很麻烦
最近在答疑群里收到一个很经典的提问,就是:
- 请问各位老师,GPL570芯片中应该有部分基因是LncRNA,能否通过基因重注释的方式把有意义的LncRNA筛选出来呢?R语言能否实现呢? Continue reading
芯片探针序列的基因注释已经无需你自己亲自做了
在整个生信技能树的历史上,就分享过两次价值一千元的:
为什么gpl信息里面的物种会错误呢
最近在对GEO数据库的全部GPL平台的芯片探针序列进行批量重新注释的时候,发现如果工具芯片自带的物种信息来自动化选择参考基因组,居然还会出现某个芯片探针比对率非常低的情况, 比如GPL21827这个平台: Continue reading
为什么肿瘤细胞具有病人异质性但是细胞系没有
在回顾2014的science关于GBM的单细胞转录组文章,DOI: 10.1126/science.1254257 标题是; Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma 在附件看到了一幅我当时忽略的图。我发现肿瘤细胞具有病人异质性但是细胞系没有: Continue reading
为什么不用TCGA数据库来看感兴趣基因的生存情况
为R包写一本书(像Y叔致敬)
最近收到粉丝求助,本来是询问富集分析的时候,我给的参考代码,为什么pvaluecutoff值和qvaluecutoff值设到0.9,其实是怕大家富集不到结果。然后Y叔在自己的微信公众号中提到“富集不到结果才是正确的结果”,采用了更加稳妥和可靠的方法来判断富集结果,而粉丝的数据在DAVID中能有结果,可在Y叔的包里,结果就少了一些,如何决定采取哪个?最后又讨论到DAVID结果可视化,网上资源少,他只能做成条图,需要我给指条方向! Continue reading
探讨生物信息学本科教育
因为我们生信技能树的名声在外,很多以前一起探讨生物信息学数据分析技巧的朋友都陆陆续续博士毕业成为了各大高校的青椒(听说是比较凄惨的)了,也有很多朋友本来就是经验丰富的生物信息学本科专业班主任,推荐了不少学生关注我们生信技能树。 Continue reading
使用R包判定CRC稳定的分子亚型
前面我们在生信技能树公众号系统性总结分享过:CRC稳定的分子分型,没有背景知识的朋友可以去深入读文献:October 2015 The consensus molecular subtypes of colorectal cancer。 Continue reading
使用平均值替换NA
最近学徒群在讨论一个需求,就是用数据框的每一列的平均数替换每一列的NA值。但是问题的提出者自己的代码是错的,如下: Continue reading
深度理解可变剪切的软件leafcutter的结果
前面我们介绍该软件用法很多了,而且也对基于bam文件做可变剪切的软件leafcutter和rMATS的比较
现在我们来根据MFF基因来深度理解可变剪切的软件leafcutter的结果! Continue reading
上次说的gmt函数
最近我们的学徒作业,都是以公众号推文的方式发布出来,希望更多人加入一起学习,前面两次的作业是: Continue reading
如何理解circRNA
我前面提到过,如果你确实是第一次接触circRNA芯片数据,完全不用担心, 你只需要把它看作是你不知道基因名字的mRNA芯片,最后得到的各种各样的分析结果,只不过是以circRNA的ID来表示而已。 Continue reading
如果一开始就奔着工业界去的呢
学术界OR工业界的讨论永无休止,前面我们推送的两个阅读量过万的人生抉择都是在科研圈奋斗很久后才做出离开它的选择,见: Continue reading
强烈推荐应该点击阅读原文的2019年终总结
我们一直有生信故事会栏目,虽然投稿的人不多: Continue reading
强烈建议你也去一趟马来西亚
马来西亚城市太多,差不多十年前我大学期间休学一年的间隙花了一个月在马来西亚的不同城市流浪,还有一些游记,如下: Continue reading
批量安装R包
我们周末班准备工作给的安装R包 http://www.bio-info-trainee.com/3727.html
首先配置中国大陆特色镜像 Continue reading
理解RNA-seq表达矩阵的两个形式
RNA-seq我们在生信技能树应该是至少推出了400篇教程,而且是我们全国巡讲的标准品知识点,其中还有一个阅读量过两万的综述翻译及其细节知识点的补充: Continue reading
基因类型注释根据基因ID就好了
生物信息学数据库种类繁多,其中基因ID是很多人比较困惑的,尤其是很多产品居然还不是基因ID的问题,比如表达芯片是探针,所以我策划了一系列ID转换教程,见文末!我的包里面有一个函数大家比较感兴趣,就是为什么可以根据基因ID拿到其染色体坐标呢?而且还可以得到其基因类型。 Continue reading