singleR是目前单细胞转录组领域算是比较出众的自动化细胞类型注释系统,所以我分享的两个祖传代码里面都加上了它,成为标准流程:
Seurat标准流程之聚类分群(CNS图表复现02)
上个月我们组建了:《单细胞CNS图表复现交流群》,见:你要的rmarkdown文献图表复现全套代码来了(单细胞),也分享了单细胞转录组数据分析的流程:
RNA-seq数据可不只是表达量矩阵结果(CNS图表复现11)
前面我们提到了:表达矩阵是如何得到的(CNS图表复现10),有粉丝提问,既然都开始走RNA-seq数据的上游分析了,到Linux服务器操作了,难道仅仅是为了拿到表达矩阵文件吗?RNA-seq数据分析可以有很多啊,比如融合基因,可变剪切,甚至变异位点。
RNA-seq的3的差异分析R包你选择哪个
在2010-2015年间,RNA-seq本身就是跟现在的单细胞差不多的当红炸子鸡的地位,无数的软件工具,网页数据库,测评文章涌现出来。很多课题组导师都认为做一个RNA-seq项目就能发CNS啦,就跟这两年大家以为做一个单细胞转录组项目就可以发CNS的坚信程度是一模一样的!
R语言确实会蛮耗费磁盘空间哦
我们一直强调大家需要安装在C盘,主要是因为大家都是新手,怕大家各自折腾带来各种各样的稀奇古怪的报错,增加我们教学辅助团队的负担!
R语言奇淫巧技之pdftools包
我们前面讲解过了使用R语言做爬虫,处理图片,写网页应用等等,都在生信基石之R语言,B站的10个小时教学视频!
Continue reading
mskcc的vcf2maf极简解决方案
为了写这个教程,我特意在唐医生的共享云服务器上面测试了,从头到尾运行过,验证过,你一定可以follow成功的哈!
miRNA-seq数据分析其实大同小异
有粉丝咨询,他感兴趣的领域的一篇文章,提供了miRNA-seq数据,但根据我的GEO数据挖掘课程代码,没办法下载到表达量矩阵文件。如下:
Continue reading
inferCNV流程输入数据差异大揭秘(CNS图表复现15)
前面我提到了,我和文章都是取全部的上皮细胞,以及部分Fibroblasts和Endothelial_cells细胞来一起运行inferCNV流程。但是呢,自己的数据里面,是 366 genes and 7044 cells , 得到是CNV数量太少了(第18步写的是:Total CNV’s: 31 )计算量比较小,所以十几分钟就结束了。 Continue reading
inferCNV结果解读及利用之进阶(CNS图表复现17)
前面我们提到的inferCNV结果里面的CNV热图,虽然说可以肉眼简单看看不同的细胞亚群是否具有大面积的CNV事件来判定它是否是恶性细胞,但是这样的判定具有很大程度的主观性,所以理论上需要有更好的方法,也就是计算具体每个细胞的CNV score 。
inferCNV结果解读及利用(CNS图表复现16)
前面我们提到了因为细胞数量比较多,运行infercnv::run的时候,下面两个参数,都是默认值即可:
HMM参数 when set to True, runs HMM to predict CNV level (default: FALSE)
denoise If True, turns on denoising according to options below (default: FALSE)
GWAS宝刀未老
今年(2020)2月,解放军总医院放射治疗科的研究团队,在国际期刊《Journal of Cancer》 上发表了题为”Precise prediction of the radiation pneumonitis in lung cancer: an explorative preliminary mathematical model using genotype information”的科研论文。
Continue reading
GATK的FilterMutectCalls如何才能成功呢
因为有粉丝求助,他学习前面我分享的GATK的Mutect2流程都快奔溃了,总是各种报错。为了证明我教程没有错,所以我赶紧检查了代码,自己走了一遍,重新写了教程,了:最新最全的mutect2教程,提到了因为GATK的Mutect2流程更新太频繁,导致这个软件出现了一些无法解决的报错。走完了体细胞突变(somatic mutation)检测流程(Mutect2命令),这个时候拿到的文件仍然是需要过滤(走FilterMutectCalls命令)的,但是很多人就卡在了这一步。
FACS挑选前后会改变细胞亚群比例组成吗
单细胞转录组技术毫无疑问是目前科研界的“当红炸子鸡”,但绝大部分人使用单细胞转录组的数据其实就当做是了流式细胞仪看不同细胞亚群组成的比例而已。这也就是为什么绝大部分单细胞转录组分析教程就是:数据质控,降维,聚类,分群,细胞亚群生物学注释。只要你的实验设计ok,这样的分析绰绰有余了,可以拿到一个落脚点去做实验验证一下或者公共数据库的验证。
conda管理C源代码程序的时候总是出现库文件冲突或者缺失
现在初学者都喜欢使用conda来管理软件环境,安装方法代码如下:
CellPress对话科学家专栏推荐(生命科学领域)
生命科学领域的科研方向错综复杂,但是底层逻辑日渐清晰,就是数据分析(生物信息学)。但做数据分析的通常是在校生或者毕业一两年的工程师,太年轻了,所以在科研背景知识层面必然被老一辈科学家吊打。无论你的统计可视化做的多么好,各种机制图表信手拈来,也不可能代替生物学故事。而故事讲的好的,就不得不提CNS杂志啦。最近看到CellPress对话科学家专栏推荐非常值得大家学习,希望二十年后有你的名字!
最新最全的varscan 软件找somatic mutation
前面我分享了:最新最全的mutect2教程,提到了其实大家不必在一棵树上吊死,GATK的Mutect2流程跑不通就换一个软件咯,2018年文章:A review of somatic single nucleotide variant calling algorithms fornext-generation sequencing data 就囊括了十几款找somatic mutation的软件。当然了,绝大部分软件其实是没有尝试的价值。不过如果要是从安装和使用的简易性来考虑,varscan 软件必须值得一提。
最新最全的mutect2教程
GATK的Mutect2流程一直在变动,主要是GATK本身也更新频率有点高,所以基本上大家看到的教程很快就过时了,follow起来都是错误连连。现在这个教程的时间是:2020-09-22 (只能保证说未来半年内可能是ok的)
祖传的单个10x样本的seurat标准代码
最近有粉丝反映说我前年的单细胞转录组课程视频及代码被人拿到咸鱼上面在售卖,我···
珠海横琴新区博士后享80万到280万生活补贴
你不来吗
Continue reading