最近给学员新购置一台练习使用的云服务器,在上面测试我们的lncRNA-seq流程的时候,发现一个很有趣的现象。就是使用conda,如下所示创建LncRNA-seq的实战软件环境 Continue reading
Category Archives: 未分类
生信流程大全-基于nextflow的nf-core
最近看到很多人讨论基于nextflow的nf-core,里面存储了几十种NGS组学数据分析流程哦,而且文章发表在NBT。最早应该是生信技能树的学习大使《二货潜》发在朋友圈的,他同时也推荐了 加拿大生物信息学研讨会资源宝藏 。然后我看到生信技能树的宝藏男孩《唐医生》在 [菜鸟团一周文献推荐(No.50)] Continue reading
生信爆款入门全球听限量免费
我们生信技能树联盟的关注粉丝已经有十多万了,作为创始人的我非常开心看到这么多人认可我们生信技能树的努力,通过我们的教程提升了自己。虽然,绝大部分粉丝都已经跨越了这个入门阶段,但还是希望你花时间看完这个活动,推荐给有需求的朋友。 Continue reading
你真的需要这些R视频吗
刚才b站提醒我可以参加他们的《新星计划·垂直赛道寻找各品类5万粉以下的优质UP主》,原来我一直引以为傲的10万加视频播放量在b站连个星都算不上,O(∩_∩)O哈哈~ Continue reading
拿奖拿到手软的单细胞技术
单细胞水平的研究无疑是近些年(2018-2022)的科研热点,但是科研热点大家都明白,早期不投资的话那些低垂的果实就没有你的份。投资晚了,热点技术就会常规化,到时候还是比拼科研想法了。
- 2013年,单细胞测序就已经被Nature Methods 杂志评选为生命科学领域年度技术。 Continue reading
高通量测序技术在肺癌领域的应用阅读
昨天学徒推荐了一本书:《高通量测序技术在肺癌领域的应用》,觉得讲NGS应用实例挺好的,强烈要求我推荐给所有生信技能树的粉丝!
而且在微信读书APP里面可以免费浏览:https://weread.qq.com/web/reader/4df323307193c1ec4df6715 Continue reading
对新冠病毒核酸序列构建系统进化树
今天在群里看到一个提问,很有趣,好像是有一个网页工具可以把fastq格式转为phylip格式。我虽然没有使用过这个软件,但是我觉得这个提问,可能是忽略了计算过程,直接说结果。应该是问题本身就错误的。 Continue reading
对“不同数据来源的生存分析比较”的补充说明
前面我的学徒的一则推文:不同数据来源的生存分析比较 , 代码细节和原理展现做的非常棒,但是因为学徒对TCGA数据库知识不熟悉,所以被捉到了一个bug,先更正一下: Continue reading
单细胞转录组数据的个性化分析汇总
都介绍到单细胞转录组数据处理之细胞亚群比例比较部分了,10讲就告一段落了,大家可以回看仔细品读。后面的分析其实都是个性化的了,取决于课题设计,假说,生物学背景知识,而且需要学习大量的R包。 Continue reading
单细胞转录组数据处理之细胞亚群注释
前面我们一起学习到了单细胞转录组数据的降维聚类分群,基本上跑的都是标准代码,里面很多细节参数是需要自己慢慢摸索的。保证单细胞转录组表达矩阵质量ok啦,而且需要去除了各种混杂因素。 Continue reading
单细胞转录组数据处理之细胞亚群继续分群
前面我们一起学习到了单细胞转录组数据的降维聚类分群,而且拿到的亚群,也可以解释其生物学意义,见:单细胞转录组数据处理之细胞亚群注释 Continue reading
单细胞转录组数据处理之降维聚类分群
前面我们一起学习了单细胞转录组数据的上游分析,而且了解了自己的项目的样本数量和测序量,还过滤了不合格的细胞和基因, 系列教程目录如下:
去除细胞效应和基因效应
前面我们一起学习了单细胞转录组数据的上游分析,而且了解了自己的项目的样本数量和测序量,还过滤了不合格的细胞和基因, 教程目录如下:
并不是只有TCGA计划里面的癌症研究才做多组学
前列腺癌是一种相对惰性的恶性肿瘤,但是一旦其进入晚期,治疗将会变得十分棘手。虽然大多数晚期前列腺癌患者对内分泌治疗都有很好的反应,但在治疗18~24个月后几乎所有患者最终都将进展为去势抵抗性前列腺癌(CRPC),而一旦进展为CRPC,一半患者将难以活过两年。因此,识别哪种前列腺癌更易进入CRPC,并对此及早进行积极的综合治疗是延长生存期的重要环节。 Continue reading
表达矩阵逆转为10X的标准输出3个文件
本文首发于生信菜鸟团公众号,直达链接是https://mp.weixin.qq.com/s/NaZ5kz3ew2O01cFEnK8sXg
今天接到浙江大学的学徒求助,他在学习
TooManyCellsR
包和too-many-cells
软件的过程中遇到了一个很有趣的问题,就是这个软件的输入必须是 cellranger 的三个结果文件,matrix.mtx
,barcodes.tsv
和genes.tsv
。而有些公共数据并不会提供3个数据,比如: SE117988_raw.expMatrix_PBMC.csv.gz , 就是 10x的表达矩阵。 Continue reading
把一本R语言书看五遍还是看五本不同的书
我一直强调,编程基本功必须得看工具书,而且是需要看五本以上,甚至部分书籍需要看五遍以上!比如我在生信分析人员如何系统入门R(2019更新版) 里面给初学者的知识点路线图如下: Continue reading
49G的TCGA数据库给你下载好啦
昨天我们生信技能树分享了 TCGA数据库免疫相关文件下载大全,里面给出来了2018年4月Immunity杂志上发表的文章The Immune Landscape of Cancer 整理好的49G的TCGA数据库文件,其中一个是甲基化信号值矩阵,单个文件就39G。 Continue reading
8个10X单细胞转录组样本的数据合并
发表在2017年10月的NC文章:Differentiation dynamics of mammary epithelial cells revealed by single-cell RNA sequencing 用10X单细胞转录组测序来探索小鼠的乳腺发育情况,包括了4个发育阶段: Continue reading
4门统计学你选择哪个
统计学的重要性毋庸多说,基本上NGS数据分析的每个环节参数的把握,每个图表的理解背后都是统计学背景知识。当然了,对大量入门级别玩家,暂时可以不要考虑那么多,先跟着我在生信技能树的教程肝下去,走出一个完整项目再说。但是大量中高级玩家的需求我们也得满足啦,很久以前我们整理过:统计学回顾(精华目录收藏)(statquest+协和八+ NGSHotpot),可以说啃这块统计学硬骨头是提升自己的生信段位不二选择! Continue reading
TCGA数据库的各个癌症甲基化芯片数据重新分析
我们前面教程:450K芯片上面的甲基化探针到底需要进行哪些过滤 已经强调过了甲基化芯片数据分析的一些注意事项,以及标准代码,共享了大量的学习资料。也分享了一篇甲基化芯片文献的标准图表,现在需要进行数据挖掘了。 Continue reading