前面我们在 为什么做拟时序 提到了其实可以把拟时序分析简化成为了主要是为了展示差异细节,比如CD14和CD16的两种单核细胞的差异细节,或者说说CD56和CD16这两种NK细胞的差异细节。
也就是说,我们做拟时序之前通常是要细分亚群到足够深入,需要确定被做拟时序分析的对象是有比较大生物学变化的可能性。但是也有很多文章在使用拟时序分析的时候其实忽略这个前提,就显得很“可笑”,接下来我们就用3个案例来说明一下拟时序的正确姿势,错误示范,还有创新型的应用场景。 Continue reading
Daily Archives: 2024年8月27日
拟时序的多种算法大比拼
前面我们在 为什么做拟时序 提到了其实可以把拟时序分析简化成为了主要是为了展示差异细节,然后在 拟时序的正确姿势 我们3个案例来说明一下拟时序的正确姿势,错误示范,还有创新型的应用场景。
而且这些案例文献都不约而同的使用了monocle2这个软件,但是并不意味着它是金标准,也不意味着非monocle2不可。这个纯粹就是生物信息学领域的“马太效应”,大家都用monocle2做拟时序,所以后来者就简单的追随即可,而且绝大部分人其实并不关心算法细节,仅仅是为了做拟时序而做,那么就无所谓选择哪个软件了。实际上,做拟时序确实是有很多软件和算法的选择,我们可以来看看两个经典的综述,借此机会系统性梳理一下这方面背景知识。 Continue reading
难道铁死亡数据库记录的基因都是人类未知基因吗
最近看到了2023的一个数据库挖掘文章《Identification of ferroptosis-related genes in the progress of NASH》,里面有一个韦恩图展现了作者自己的转录组定量流程拿到的表达量矩阵的全部基因去跟铁死亡数据库记录的基因做交集,但是居然交集很少,如下所示:
可以看到,铁死亡数据库记录的基因有接近40%都不在人类已经基因里面,非常的诡异。 Continue reading
男性和女性的乳腺癌患者肿瘤细胞表达量差异基因不是在性染色体吗
看到了2023发表在NC杂志的男性乳腺癌患者的单细胞转录组图谱文章,标题是:《Single-cell transcriptome analysis indicates fatty acid metabolism-mediated metastasis and immunosuppression in male breast cancer》
其中附件有一张图是男性和女性的乳腺癌患者肿瘤细胞表达量差异基因的热图,如下所示: Continue reading
明明是可以省下这两三百万科研经费
看到了一个新鲜出炉的肺癌( lung adenocarcinoma (LUAD) )单细胞转录组文章:Cancer Res . 2024 Feb ,标题有一点点长:《Single-cell analysis identifies NOTCH3-mediated interactions between stromal cells that promote microenvironment remodeling and invasion in lung adenocarcinoma》,但是实际上文章的内容非常简单,就是多样品的单细胞转录组数据的第一层次降维聚类分群后,取里面的 成纤维细胞亚群和内皮细胞亚群 进行细分即可!
但是让我没有想到的是这个研究仅仅是花费在单细胞转录组测序上面的的科研经费就高达两三百万,因为有多达89个的10x技术的单细胞转录组样品数据。详见: Continue reading
论单细胞数据造假的可能性
微信交流群有小伙伴提到了近五年来伴随着单细胞转录组数据的“大行其道”的一些科研乱象,大意就是不少课题组的金主们对单细胞背景一无所知也不愿意深入学习,仅仅是凭借着各个公众号推文的“只言片语”就贸然开启了自己的单细胞转录组项目。
比如大多数人就是做了两分组的六个样品,十万块钱左右的项目。但是呢,因为金主们的外行,所以很多公司走标准流程的过程中其实可以完全不做单细胞的建库测序出真实数据,可以凭空捏造数据。。。。 Continue reading
流式细胞筛选能保证多大程度的细胞亚群纯度呢
通常大家会选择流式细胞仪(Flow Cytometry)这种技术,来纯化特定单细胞亚群。但是流式细胞筛选并不能保证百分百的效率哦,甚至说有时候都达不到50%,我们来使用几个案例说明一下:
乳腺癌筛选t细胞接近百分百
首先看2018的cell杂志的文章:《Single-Cell Map of Diverse Immune Phenotypes in the Breast Tumor Microenvironment》
有两个流式细胞筛选操作,所以有两个单细胞转录组数据集: Continue reading
两个基因组合起来对样品分组后差异分析和生存分析
有很多小伙伴表示看到了我们的永久免费的生信进阶培训(线下)通知,但是不知道如何才算是有基础生物信息学数据分析能力是可以过来的,其实很简单的,就是可以独立完成下面的推文图表 : Continue reading
两个表达量矩阵去除批次效应之前是否需要归一化
前面我们视频号直播了一个表达量芯片数据处理,详见:这样去除表达量芯片的批次效应可能不妥,这个物信息学数据挖掘的标题是:《Novel ferroptosis gene biomarkers and immune infiltration profiles in diabetic kidney disease via bioinformatics》,直播回放的视频在: Continue reading
类器官培养物真的只有恶性肿瘤细胞吗
我看到了《肿瘤资讯》公众号发布了浙江省肿瘤医院泌尿外科副主任医师徐一鹏的《从模型出发看肿瘤药物研究》观点,里面提到了肿瘤细胞系,即Cell lines的两个缺点: Continue reading
类器官技术日新月异
六年前我组建过一个【生信文献200篇】活动,因为自己课题组背景偏好性导致大家一起读了很多肿瘤领域的类器官文献,如下所示: Continue reading
类器官还得继续卷单细胞
虽然早在2009年,荷兰Hubrecht研究所的Hans Clevers博士就证实 肠干细胞 能够形成类器官,开启了 类器官研究的时代。但是早期类器官并没有在肿瘤领域大放异彩,算起来单细胞也是2009年汤富酬博士开启的,但是也是在发育生物学领域“小步慢跑”。
我常见系统性梳理过 2014到2018期间的癌症领域的单细胞研究,可以说是少得可怜,都是broad研究所的基于smart-seq的,在脑瘤,黑色素瘤,头颈癌有CNS文章发表。同样的是这个时间段, 类器官也是在每个癌症领域都有了CNS文章,比如 : Continue reading
空间单细胞的上游定量流程(spaceranger,10x技术)
前面的教程里面 能从源头解决数据分析的瑕疵吗 ,我们重现了普通单细胞转录组数据分析的从fastq文件开始的走cellranger的定量流程。使用的是kingfisher进行了一行代码下载数据,但是针对同一个文章的空间单细胞转录组数据就总是失败,既然没办法直接下载fastq文件,就只能说是曲线救国啦,先现在ncbi数据库里面的sra文件然后转为fastq文件即可。 Continue reading
课题到底创新在哪里
看到了朋友圈好友转发了一个2024新鲜出炉的基于蛋白质组数据对阿兹海默症进行早期诊断的文章:《Alzheimer’s disease early diagnostic and staging biomarkers revealed by large-scale cerebrospinal fluid and serum proteomic profiling》,文章的摘要写的非常棒,很清晰,如下所示: Continue reading
绝大部分单细胞空间转录组数据都缺胳膊断腿
我们粗浅的认为空间单细胞约等于10x技术,虽然说确实是有很多其它空间单细胞技术可以产出各式各样的数据。但是前期我们还是着重于介绍10x的空间单细胞文件格式详解 ,里面 提到的几个案例其实并不是所有的数据集都是可以分析的,因为作者提供的文件本身就是缺胳膊断腿的。 Continue reading
教你白嫖一个项目预付款
刷小红书看到了一个线上兼职数据分析项目合作的难堪撕逼故事,不知道是不是大数据猜透了我的喜好,反正就是隔三差五就看到类似的撕逼大戏。
而且不知道为什么这个小伙伴会如此爽快的预付了全部的3000元的数据分析劳务报酬,这样的话基本上就受制于接单的工程师的良心了! Continue reading
“教”你白嫖一个生物信息学数据分析项目
最近很多生物信息学的小IP出来了,很多都是做了公众号才小半年,也不是日更频率的坚持吧,就开始接单甚至组建数据分析团队。
真的是很有意思,也不好说他们“急功近利”吧,但也确实有点“猴急”了,自己都还没有把ngs多组学流程吃透,也没有单细胞多组学项目经验,就学别人“空手套白狼”两头吃。真的是反面教材了: Continue reading
降维聚类分群的umap图真的重要吗
寒假期间安排了一些小伙伴练习单细胞,其中一个文献是:《A comprehensive single-cell map of T cell exhaustion-associated immune environ- ments in human breast cancer》,它配套的数据在 E-MTAB-10607 可以看到,但是小伙伴在降维聚类分群的时候实在是没办法达到原文的漂亮的结果:
文献里面提到了是标准的商业化的10x技术的单细胞转录组,After standard data pre-processing, 119,000 high-quality cell measurements remained in the dataset Continue reading
基于Seurat的TransferData函数自动化迁移单细胞转录组亚群的注释信息
前面我们推荐了方法学:使用singleR基于自建数据库来自动化注释单细胞转录组亚群,广受好评,然后马上就有小伙伴留言说这个功能跟Seurat的TransferData函数类似,我就马不停蹄的尝试了一下: Continue reading
合并两个不同物种的单细胞转录组数据集注意harmony的参数
学员在交流群反馈在处理一个2020的文章里面的GSE155513和GSE155512这两个单细胞转录组数据集遇到了两个物种数据集整合失败问题。
这两个数据集分别是人和鼠的SMC异质性探索的,文献标题是:《Single-Cell Genomics Reveals a Novel Cell State During Smooth Muscle Cell Phenotypic Switching and Potential Therapeutic Targets for Atherosclerosis in Mouse and Human》,可以看到GSE155513和GSE155512这两个单细胞转录组表达量矩阵是可以很好的整合: Continue reading