在教程 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这个第一次分群规则是 :
- immune (CD45+,PTPRC),
- epithelial/cancer (EpCAM+,EPCAM),
- stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)
Continue reading
在教程 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这个第一次分群规则是 :
一般来说, 遗传变异位点注释软件我会介绍ANNOVAR和VEP,以及snpEFF,他们三个的引用是最多的。并不是说就他们3个软件可以做遗传变异位点注释啦,比较知名的还有GEMINI以及SeqAnt,也是萝卜青菜各有所爱哈。
Continue reading
数据挖掘的本质是把基因数量搞小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列,通常是会跟生存分析进行交集,或者多个数据集差异结果的交集,比如:多个数据集整合神器-RobustRankAggreg包 ,这样的基因集就是100个以内的数量了,但是仍然有缩小的空间,比如lasso等统计学算法,最后搞成10个左右的基因组成signature即可顺利发表。
我在B站有一个microRNA测序数据分析实战演练,主要是从ebi下载,项目号是Project: PRJNA486534,共11个小RNA建库测序后样本的数据分析。但还是得找其它练习题给大家作为课程配套练习。看到一个发表于:Plasma extracellular RNA profiles in healthy and cancer patients. Sci Rep 2016 Jan 20;6:19413. PMID: 26786760,研究者纳入192人,涉及到3种癌症:
最近检查自己的谷歌Gmail邮箱,发现它推送了我感兴趣的一个教授的文章《A Spontaneous Aggressive ERa+ Mammary Tumor Model Is Driven by Kras Activation》,里面提到了小鼠的肿瘤免疫微环境的推断。这个教授就是biostar论坛的创始人,其 lab 链接是:https://griffithlab.org/team/
Continue reading
在几乎所有模式植物转录组测序技术都做烂的今天,始终有一些植物因为种种原因鲜有问津。例如小麦,就像是开在奢侈品商场的黄焖鸡:有钱的人未必瞧得上,没钱的也压根就不会去光顾。不过这么多年过去了,总有那么几个祖传数据躺在NCBI的数据库里供人挖掘,比如今天这个PRJNA293629。
Continue reading
在前面的教程 CNS图表复现05—免疫细胞亚群再分类 ,我提到到免疫细胞通常是以CD45阳性为标志,第一次分群规则是 :
单细胞进阶分析主要是拟时序分析,细胞通讯分析,以及SCENIC转录因子分析。但实际上随着越来越多单细胞研究从CNS正刊跌落到CNS子刊,再到普通的数据挖掘文章,所谓的进阶分析也要沦落为标准分析啦。
Continue reading
一般来说,建议大家直接读原汁原味的综述,比如2020年11月9日,Erick Armingol等在 Nature Reviews Genetics上发表了一篇综述《Deciphering cell–cell interactions and communication from gene expression》,我看到了解读:从基因表达解读细胞之间的相互作用和交流,读了一下发现确实超级适合作为细胞通讯分析的背景知识学习材料。
Continue reading
四年前我曾经分享过一个“故事”,详情见:起初听到这个,我是蒙圈的 。就有一个(或者一群人)倒买倒卖我的免费资料,非常有意思,让我不爽的是它的定价,以及把各种售后都丢给我的甩锅心态。
Continue reading
前段时间,腾讯的云+社区找到了我,纯粹的技术交流渠道,认可我在大数据方向孜孜不倦的创造。希望我尝试一下他们的新功能:《阅读清单》,有点类似于专辑。因为这七八年我写了1.3万篇教程,很多都是零零散散的笔记,但也有不少是成系统的,估摸着有500多个专辑,全部整理起来工作量太大了。为了应付这个《阅读清单》评审工作,我从500多个专辑里面精选了这3个参加评选,希望《生信技能树》的粉丝们能支持我!
看到2020年2月发表在nature cancer这个新杂志的文章《Single-cell analyses reveal increased intratumoral heterogeneity after the onset of therapy resistance in small-cell lung cancer》链接是:https://www.nature.com/articles/s43018-019-0020-z 里面有普通的18个样品的bulk转录组数据以及25个单细胞转录组数据。
Continue reading
教程:CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,我提到过肿瘤单细胞转录组数据的第一次分群规则是 :
Continue reading
众所周知,在肿瘤单细胞数据里面,对恶性细胞来说,病人的分类作用是远大于细胞类型的,不过其实肿瘤恶性细胞也说不出什么确切的细胞类型,目前仅仅是根据TCGA的bulk转录组数据进行分子分型。但是对免疫细胞或者其它并不恶性的单细胞来说呢,细胞类型的作用是远大于病人的个体异质性的。如下所示:
Continue reading
文章《BRCA1 Promoter Methylation Status in 1031 Primary Breast Cancers Predicts Favorable Outcomes Following Chemotherapy》,链接是:https://academic.oup.com/jncics/article/4/2/pkz100/5673392 我看到文章里面提到了乳腺癌患者的1031 primary tumors的测序数据,下意识的以为是一个TCGA数据库挖掘。
CoMutPlotter这个网页工具与2019年7月发表在 BMC Medical Genomics 杂志,文章标题是;《CoMutPlotter: a web tool for visual summary of mutations in cancer cohorts》选自第八届转化生物信息学会议: 医学基因组学,研究者是台湾长庚大学的。