27

拟时序的正确姿势(拟时序一本通02)

前面我们在 为什么做拟时序 提到了其实可以把拟时序分析简化成为了主要是为了展示差异细节,比如CD14和CD16的两种单核细胞的差异细节,或者说说CD56和CD16这两种NK细胞的差异细节。
也就是说,我们做拟时序之前通常是要细分亚群到足够深入,需要确定被做拟时序分析的对象是有比较大生物学变化的可能性。但是也有很多文章在使用拟时序分析的时候其实忽略这个前提,就显得很“可笑”,接下来我们就用3个案例来说明一下拟时序的正确姿势,错误示范,还有创新型的应用场景。 Continue reading

27

拟时序的多种算法大比拼

前面我们在 为什么做拟时序 提到了其实可以把拟时序分析简化成为了主要是为了展示差异细节,然后在 拟时序的正确姿势 我们3个案例来说明一下拟时序的正确姿势,错误示范,还有创新型的应用场景。
而且这些案例文献都不约而同的使用了monocle2这个软件,但是并不意味着它是金标准,也不意味着非monocle2不可。这个纯粹就是生物信息学领域的“马太效应”,大家都用monocle2做拟时序,所以后来者就简单的追随即可,而且绝大部分人其实并不关心算法细节,仅仅是为了做拟时序而做,那么就无所谓选择哪个软件了。实际上,做拟时序确实是有很多软件和算法的选择,我们可以来看看两个经典的综述,借此机会系统性梳理一下这方面背景知识。 Continue reading

27

难道铁死亡数据库记录的基因都是人类未知基因吗

最近看到了2023的一个数据库挖掘文章《Identification of ferroptosis-related genes in the progress of NASH》,里面有一个韦恩图展现了作者自己的转录组定量流程拿到的表达量矩阵的全部基因去跟铁死亡数据库记录的基因做交集,但是居然交集很少,如下所示:

居然交集很少

可以看到,铁死亡数据库记录的基因有接近40%都不在人类已经基因里面,非常的诡异。 Continue reading

27

男性和女性的乳腺癌患者肿瘤细胞表达量差异基因不是在性染色体吗

看到了2023发表在NC杂志的男性乳腺癌患者的单细胞转录组图谱文章,标题是:《Single-cell transcriptome analysis indicates fatty acid metabolism-mediated metastasis and immunosuppression in male breast cancer》
其中附件有一张图是男性和女性的乳腺癌患者肿瘤细胞表达量差异基因的热图,如下所示: Continue reading

27

明明是可以省下这两三百万科研经费

看到了一个新鲜出炉的肺癌( lung adenocarcinoma (LUAD) )单细胞转录组文章:Cancer Res . 2024 Feb ,标题有一点点长:《Single-cell analysis identifies NOTCH3-mediated interactions between stromal cells that promote microenvironment remodeling and invasion in lung adenocarcinoma》,但是实际上文章的内容非常简单,就是多样品的单细胞转录组数据的第一层次降维聚类分群后,取里面的 成纤维细胞亚群和内皮细胞亚群 进行细分即可!
但是让我没有想到的是这个研究仅仅是花费在单细胞转录组测序上面的的科研经费就高达两三百万,因为有多达89个的10x技术的单细胞转录组样品数据。详见: Continue reading

27

论单细胞数据造假的可能性

微信交流群有小伙伴提到了近五年来伴随着单细胞转录组数据的“大行其道”的一些科研乱象,大意就是不少课题组的金主们对单细胞背景一无所知也不愿意深入学习,仅仅是凭借着各个公众号推文的“只言片语”就贸然开启了自己的单细胞转录组项目。

比如大多数人就是做了两分组的六个样品,十万块钱左右的项目。但是呢,因为金主们的外行,所以很多公司走标准流程的过程中其实可以完全不做单细胞的建库测序出真实数据,可以凭空捏造数据。。。。 Continue reading

27

流式细胞筛选能保证多大程度的细胞亚群纯度呢

通常大家会选择流式细胞仪(Flow Cytometry)这种技术,来纯化特定单细胞亚群。但是流式细胞筛选并不能保证百分百的效率哦,甚至说有时候都达不到50%,我们来使用几个案例说明一下:

乳腺癌筛选t细胞接近百分百

首先看2018的cell杂志的文章:《Single-Cell Map of Diverse Immune Phenotypes in the Breast Tumor Microenvironment》
有两个流式细胞筛选操作,所以有两个单细胞转录组数据集: Continue reading

27

类器官还得继续卷单细胞

虽然早在2009年,荷兰Hubrecht研究所的Hans Clevers博士就证实 肠干细胞 能够形成类器官,开启了 类器官研究的时代。但是早期类器官并没有在肿瘤领域大放异彩,算起来单细胞也是2009年汤富酬博士开启的,但是也是在发育生物学领域“小步慢跑”。
我常见系统性梳理过 2014到2018期间的癌症领域的单细胞研究,可以说是少得可怜,都是broad研究所的基于smart-seq的,在脑瘤,黑色素瘤,头颈癌有CNS文章发表。同样的是这个时间段, 类器官也是在每个癌症领域都有了CNS文章,比如 : Continue reading

27

空间单细胞的上游定量流程(spaceranger,10x技术)

前面的教程里面 能从源头解决数据分析的瑕疵吗 ,我们重现了普通单细胞转录组数据分析的从fastq文件开始的走cellranger的定量流程。使用的是kingfisher进行了一行代码下载数据,但是针对同一个文章的空间单细胞转录组数据就总是失败,既然没办法直接下载fastq文件,就只能说是曲线救国啦,先现在ncbi数据库里面的sra文件然后转为fastq文件即可。 Continue reading

27

课题到底创新在哪里

看到了朋友圈好友转发了一个2024新鲜出炉的基于蛋白质组数据对阿兹海默症进行早期诊断的文章:《Alzheimer’s disease early diagnostic and staging biomarkers revealed by large-scale cerebrospinal fluid and serum proteomic profiling》,文章的摘要写的非常棒,很清晰,如下所示: Continue reading

27

绝大部分单细胞空间转录组数据都缺胳膊断腿

我们粗浅的认为空间单细胞约等于10x技术,虽然说确实是有很多其它空间单细胞技术可以产出各式各样的数据。但是前期我们还是着重于介绍10x的空间单细胞文件格式详解 ,里面 提到的几个案例其实并不是所有的数据集都是可以分析的,因为作者提供的文件本身就是缺胳膊断腿的。 Continue reading

27

教你白嫖一个项目预付款

刷小红书看到了一个线上兼职数据分析项目合作的难堪撕逼故事,不知道是不是大数据猜透了我的喜好,反正就是隔三差五就看到类似的撕逼大戏。
而且不知道为什么这个小伙伴会如此爽快的预付了全部的3000元的数据分析劳务报酬,这样的话基本上就受制于接单的工程师的良心了! Continue reading

27

“教”你白嫖一个生物信息学数据分析项目

最近很多生物信息学的小IP出来了,很多都是做了公众号才小半年,也不是日更频率的坚持吧,就开始接单甚至组建数据分析团队。
真的是很有意思,也不好说他们“急功近利”吧,但也确实有点“猴急”了,自己都还没有把ngs多组学流程吃透,也没有单细胞多组学项目经验,就学别人“空手套白狼”两头吃。真的是反面教材了: Continue reading

27

降维聚类分群的umap图真的重要吗

寒假期间安排了一些小伙伴练习单细胞,其中一个文献是:《A comprehensive single-cell map of T cell exhaustion-associated immune environ- ments in human breast cancer》,它配套的数据在 E-MTAB-10607 可以看到,但是小伙伴在降维聚类分群的时候实在是没办法达到原文的漂亮的结果:

原文的漂亮的结果

文献里面提到了是标准的商业化的10x技术的单细胞转录组,After standard data pre-processing, 119,000 high-quality cell measurements remained in the dataset Continue reading

27

合并两个不同物种的单细胞转录组数据集注意harmony的参数

学员在交流群反馈在处理一个2020的文章里面的GSE155513和GSE155512这两个单细胞转录组数据集遇到了两个物种数据集整合失败问题。

这两个数据集分别是人和鼠的SMC异质性探索的,文献标题是:《Single-Cell Genomics Reveals a Novel Cell State During Smooth Muscle Cell Phenotypic Switching and Potential Therapeutic Targets for Atherosclerosis in Mouse and Human》,可以看到GSE155513和GSE155512这两个单细胞转录组表达量矩阵是可以很好的整合: Continue reading