上游数据分析里面的蛋白质鉴定与定量是两个不同的过程,但是在实践中,蛋白质鉴定和定量通常是联合进行的。例如,在质谱实验中,首先通过MS/MS数据进行蛋白质鉴定,然后利用相应的肽段信号强度或特定的定量标签来量化蛋白质的表达水平。这种结合使用鉴定和定量的方法可以提供关于蛋白质在不同条件下表达模式的详细信息,从而有助于理解生物学过程和疾病机制。
- 蛋白质鉴定(Protein Identification): Continue reading
上游数据分析里面的蛋白质鉴定与定量是两个不同的过程,但是在实践中,蛋白质鉴定和定量通常是联合进行的。例如,在质谱实验中,首先通过MS/MS数据进行蛋白质鉴定,然后利用相应的肽段信号强度或特定的定量标签来量化蛋白质的表达水平。这种结合使用鉴定和定量的方法可以提供关于蛋白质在不同条件下表达模式的详细信息,从而有助于理解生物学过程和疾病机制。
我一直强调:数据挖掘的核心是缩小目标基因!
各种数据挖掘文章本质上都是要把目标基因集缩小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列, Continue reading
最近刷到了一个预印本的文章:《The curses of performing differential expression analysis using single-cell data》,是来自于美国的密西根大学和芝加哥大学的研究论文。他们提到了单细胞数据分析的“诅咒”(curses)。单细胞转录组差异分析之所以困难,主要是由于以下8个方面的原因: Continue reading
前面我们diss了一个单细胞数据挖掘文章,详见:天啦,啥肿瘤有如此高比例的树突细胞,研究者们就是把单核细胞当做是了树突细胞,闹了个笑话。强烈建议新手如果是想利用好单细胞公共数据集,可以看我们的数据分析顾问服务哈, 否则很容易被diss,参考:单细胞,单细胞,我要diss你!
其实这样的笑话在单细胞数据挖掘文章里面层出不穷,比如另外一个数据挖掘文章;《Identification of Five Hub Genes Based on Single-Cell RNA Sequencing Data and Network Pharmacology in Patients With Acute Myocardial Infarction》,链接是: Continue reading
通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
参考我前面介绍过 Continue reading
看到了首都医科大学的北京积水潭医院的一个2024的单细胞数据挖掘文章,标题是:《Single-cell RNA sequencing and transcriptomic analysis reveal the critical signatures involved in nonhealing diabetic foot ulcers》: Continue reading
看到了一个简单的单细胞转录组数据挖掘文章:《Single-cell analysis revealed that MTIF2 could promote hepatocellular carcinoma progression through modulating the ROS pathway》,这个研究就是针对GSE242889数据集进行了一个简单的降维聚类分群,然后进行合理的单细胞亚群的生物学命名,如下所示: Continue reading
看到了一个新鲜出炉的单细胞数据挖掘文章,标题是:《Single-cell analysis of tumor microenvironment and cell adhesion reveals that interleukin-1 beta promotes cancer cell proliferation in breast cancer》,研究者重新处理了GSE176078这个数据集,里面是26个乳腺癌患者的单细胞表达量矩阵 (five HER2+, 12 ER+/PR+, and nine TNBC samples) 。
很简单的降维聚类分群后,可以看到是如下所示是的主要单细胞亚群 : Continue reading
单细胞转录组数据分析最基础的就是给每个细胞一个身份,通常是降维聚类分群后然后对每个亚群进行描述,首先可以描述每个亚群的高表达量的特异性基因,然后可以对基因进行生物学功能数据库注释。也可以直接对亚群进行打分,比如gsea和gsva算法,针对免疫或者代谢等基因集进行打分,也是拿到每个亚群的特异性生物学功能。 Continue reading
最近有小伙伴反馈在做题的时候出现了一个百思不得其解的bug,是不同数据库的hallmark基因集的冲突,蛮适合我们的人工智能大模型答疑的专辑,所以我也视频演练了一下; Continue reading
有粉丝在交流群提问说看到了2022的一个泛癌文章但是数据量有点大以至于他自己的个人电脑或者课题组服务器都没办法hold住,标题是 :《Pan-cancer single-cell analysis reveals the heterogeneity and plasticity of cancer- associated fibroblasts in the tumor microenvironment》,这个泛癌单细胞数据挖掘文章纳入了很多不同癌症的单细胞转录组数据集做了一个汇总的降维聚类分群,如下所示: Continue reading
我们的生物信息学在线互动授课的案例数据集一般来说是癌症等疾病相关的, 肿瘤组织和正常对照的差异是很明显的。所以,标准的代码,标准的阈值绰绰有余的,可以拿到合理的差异分析结果。目前简单的差异分析流程,基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异,公众号推文在: Continue reading
2024的一个单细胞数据挖掘文章:《Integration of single‐cell sequencing and bulk RNA‐seq to identify and develop a prognostic signature related to colorectal cancer stem cells》,链接是:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC11133358/ ,研究者们重新分析了2011的一个表达量芯片数据集(GSE33113),然后给出来了主要的差异分析结果,火山图就很奇怪: Continue reading
前面我在笔记:作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢 提到了一个小技巧,是可以通过下面的r代码读取geo数据库里面的转录组测序表达量矩阵,这个矩阵来自于geo官方的转录组定量流程 ,如下所示的r代码 : Continue reading
大多数情况下,癌症组织里面的恶性细胞都是上皮细胞,比如:
整理多个癌症的多个单细胞转录组数据集,就是泛癌研究。聚焦到某个单细胞亚群,这样的汇总的文章北京大学张泽民课题组发了很多cns文章,包括髓系免疫细胞,t细胞以及nk细胞; Continue reading
通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
我发现初学者在入门单细胞转录组数据分析的时候会有很多“细枝末节”的过度纠结,比如过分的追求得到文献那样的分群。
学员给我反馈了一个2018的人类肝脏单细胞图谱研究:《Single cell RNA sequencing of human liver reveals distinct intrahepatic macrophage populations》,如下所示的单细胞转录组降维聚类分群图谱可以看到仅仅是肝细胞就可以分成6个群 : Continue reading
前些天在朋友圈看到了小伙伴分享了张泽民老师的一个最新单细胞文章:《Spatiotemporal single-cell analysis decodes cellular dynamics underlying different responses to immunotherapy in colorectal cancer》,数据集是GSE236581,是 primary tumor tissues, adjacent normal tissues, and peripheral blood of 22 CRC patients underwent neoadjuvant anti-PD-1 treatment. 总计 169 single-cell samples ,数据量确实是非常可观。
小伙伴表示如果是在r编程语言里面处理它, 仅仅是读取就耗费25分钟啦。我们可以在其GEO界面(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE236581) 看到研究者们公开的,如下所示的文件: Continue reading
我们首先让人工智能代码帮忙整理一下肝脏器官原发性癌症的背景知识:
肝细胞癌(HCC)和胆管上皮细胞癌(ICC)虽然都被称为肝癌,而且是原发性的肝癌。它们在发病原因、症状、治疗方法以及病理特征上存在明显的区别。最起码肝细胞癌(HCC)应该是肝细胞的恶化,而胆管上皮细胞癌(ICC)是上皮细胞的恶化。因为肝脏是一个复杂的器官,由多种细胞类型组成,主要包括肝细胞和胆管上皮细胞(也称为胆管细胞)。 Continue reading