02

蛋白质组学上游数据处理知多少

上游数据分析里面的蛋白质鉴定与定量是两个不同的过程,但是在实践中,蛋白质鉴定和定量通常是联合进行的。例如,在质谱实验中,首先通过MS/MS数据进行蛋白质鉴定,然后利用相应的肽段信号强度或特定的定量标签来量化蛋白质的表达水平。这种结合使用鉴定和定量的方法可以提供关于蛋白质在不同条件下表达模式的详细信息,从而有助于理解生物学过程和疾病机制。

  1. 蛋白质鉴定(Protein Identification)Continue reading
02

单细胞转录组差异分析的8大痛点

最近刷到了一个预印本的文章:《The curses of performing differential expression analysis using single-cell data》,是来自于美国的密西根大学和芝加哥大学的研究论文。他们提到了单细胞数据分析的“诅咒”(curses)。单细胞转录组差异分析之所以困难,主要是由于以下8个方面的原因: Continue reading

02

单细胞亚群合理命名是数据分析基石啊

前面我们diss了一个单细胞数据挖掘文章,详见:天啦,啥肿瘤有如此高比例的树突细胞,研究者们就是把单核细胞当做是了树突细胞,闹了个笑话。强烈建议新手如果是想利用好单细胞公共数据集,可以看我们的数据分析顾问服务哈, 否则很容易被diss,参考:单细胞,单细胞,我要diss你!

其实这样的笑话在单细胞数据挖掘文章里面层出不穷,比如另外一个数据挖掘文章;《Identification of Five Hub Genes Based on Single-Cell RNA Sequencing Data and Network Pharmacology in Patients With Acute Myocardial Infarction》,链接是: Continue reading

02

单细胞水平的差异分析是不是就会合理的产出这样的火山图呢

看到了一个新鲜出炉的单细胞数据挖掘文章,标题是:《Single-cell analysis of tumor microenvironment and cell adhesion reveals that interleukin-1 beta promotes cancer cell proliferation in breast cancer》,研究者重新处理了GSE176078这个数据集,里面是26个乳腺癌患者的单细胞表达量矩阵 (five HER2+, 12 ER+/PR+, and nine TNBC samples) 。
很简单的降维聚类分群后,可以看到是如下所示是的主要单细胞亚群 : Continue reading

02

单细胞GSVA分析专用R包

单细胞转录组数据分析最基础的就是给每个细胞一个身份,通常是降维聚类分群后然后对每个亚群进行描述,首先可以描述每个亚群的高表达量的特异性基因,然后可以对基因进行生物学功能数据库注释。也可以直接对亚群进行打分,比如gsea和gsva算法,针对免疫或者代谢等基因集进行打分,也是拿到每个亚群的特异性生物学功能。 Continue reading

02

拆分你的百万级别单细胞数据集后做降维聚类分群

有粉丝在交流群提问说看到了2022的一个泛癌文章但是数据量有点大以至于他自己的个人电脑或者课题组服务器都没办法hold住,标题是 :《Pan-cancer single-cell analysis reveals the heterogeneity and plasticity of cancer- associated fibroblasts in the tumor microenvironment》,这个泛癌单细胞数据挖掘文章纳入了很多不同癌症的单细胞转录组数据集做了一个汇总的降维聚类分群,如下所示: Continue reading

02

差异分析的时候到底是p值重要还是变化倍数重要?

我们的生物信息学在线互动授课的案例数据集一般来说是癌症等疾病相关的, 肿瘤组织和正常对照的差异是很明显的。所以,标准的代码,标准的阈值绰绰有余的,可以拿到合理的差异分析结果。目前简单的差异分析流程,基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异,公众号推文在: Continue reading

02

差异分析的火山图为什么不喷发呢

2024的一个单细胞数据挖掘文章:《Integration of single‐cell sequencing and bulk RNA‐seq to identify and develop a prognostic signature related to colorectal cancer stem cells》,链接是:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC11133358/ ,研究者们重新分析了2011的一个表达量芯片数据集(GSE33113),然后给出来了主要的差异分析结果,火山图就很奇怪: Continue reading

02

并不是得到文献那样的分群才是正确的单细胞分析

我发现初学者在入门单细胞转录组数据分析的时候会有很多“细枝末节”的过度纠结,比如过分的追求得到文献那样的分群。

学员给我反馈了一个2018的人类肝脏单细胞图谱研究:《Single cell RNA sequencing of human liver reveals distinct intrahepatic macrophage populations》,如下所示的单细胞转录组降维聚类分群图谱可以看到仅仅是肝细胞就可以分成6个群 : Continue reading

02

百万级别数量的单细胞数据在r里面如何更快处理呢

前些天在朋友圈看到了小伙伴分享了张泽民老师的一个最新单细胞文章:《Spatiotemporal single-cell analysis decodes cellular dynamics underlying different responses to immunotherapy in colorectal cancer》,数据集是GSE236581,是 primary tumor tissues, adjacent normal tissues, and peripheral blood of 22 CRC patients underwent neoadjuvant anti-PD-1 treatment. 总计 169 single-cell samples ,数据量确实是非常可观。

小伙伴表示如果是在r编程语言里面处理它, 仅仅是读取就耗费25分钟啦。我们可以在其GEO界面(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE236581) 看到研究者们公开的,如下所示的文件: Continue reading

02

癌症转移到肝脏后是肝细胞还是胆管上皮细胞会恶化呢

我们首先让人工智能代码帮忙整理一下肝脏器官原发性癌症的背景知识:
肝细胞癌(HCC)和胆管上皮细胞癌(ICC)虽然都被称为肝癌,而且是原发性的肝癌。它们在发病原因、症状、治疗方法以及病理特征上存在明显的区别。最起码肝细胞癌(HCC)应该是肝细胞的恶化,而胆管上皮细胞癌(ICC)是上皮细胞的恶化。因为肝脏是一个复杂的器官,由多种细胞类型组成,主要包括肝细胞和胆管上皮细胞(也称为胆管细胞)。 Continue reading