25

带着文件夹结构的拷贝

最近接了一个单细胞转录组项目,有80个10X样品,每个样品的单细胞测序数据都是100G左右的fq.gz文件,很不容易跑完了全部的cellranger流程,发现了一个很有意思的事情,每个样品的输出文件都很很复杂。这个时候我需要把各自样品的html文件拷贝并且改名后先给客户开卡,如下所示的结构: Continue reading

25

对单细胞表达矩阵做gsea分析

gsea分析这方面教程我在《生信技能树》公众号写了不少了,不管是芯片还是测序的表达矩阵,都是一样的,把基因排序即可。那在单细胞分析里面也是如此,首先对指定的单细胞亚群可以做差异分析,然后就有了基因排序,后面gsea分析全部的代码无需修改,我这里演示一个简单的例子给大家哈! Continue reading

25

复旦大学和广东省人民医院的肺癌队列比较

我注意到2019年,有两个肺癌队列多组学发布,挺有意思的。其实肺癌一直是全球发病率最高的癌症,而 2020 年最新数据显示,乳腺癌新增人数达 226 万,肺癌为 220 万,乳腺癌正式取代肺癌,成为全球第一大癌症。不知道未来会不会出现好几个单位同一时间发布不同的乳腺癌单细胞数据集呢? Continue reading

25

很多事情不一定有答案

很多交流群都有粉丝咨询文献的ngs数据下载问题,因为生信技能树在B站的绝大部分视频课程都是三五年前录制的,所以很多软件更新了,那个时候也不怎么流行conda和aspera高速下载!我那个时候也没有意识到在中国大陆的确的小伙伴使用sra-toolkit的prefetch命令下载sra数据文件居然是很慢!!! Continue reading

25

基于python的基因组组装课程

可能基本上没有多少《生信技能树》的粉丝知道,其实我的生物信息学技能也是从基因组组装开始的,大概是八九年前我本科还没有毕业就去北京实习,在西四环的青塔那边的水产所跟着大黄鱼等基因组团队做一些打杂工作,同时开启了自己的生物信息学笔记整理和分享生涯,让我甚是怀念啊。 Continue reading