长期更新~~~
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达) Continue reading
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达) Continue reading
一般来说看链接最后的文件名就知道这篇文章讲的是什么了:
MeDIP-seq 跟ChIP-seq的分析手段是一模一样的,同理hMeDIP-seq,caMeDIP-seq等等,都没有本质上的区别,只是用的抗体不一样而已,请自行搜索基础知识,我只讲数据分析。
看到了2022的一个单细胞文章:《Single-Cell RNA Sequencing Reveals the Temporal Diversity and Dynamics of Cardiac Immunity after Myocardial Infarction》,里面有表型性状特异性单细胞亚群的概念,详见:Characterization of MI Contribution in Different Macrophage Subsets,需要同时考虑伴随表型变化的单细胞亚群数量以及表达量差异,看起来是蛮复杂的数学公式,如下所示: Continue reading
有小伙伴在交流群问:自己的目标基因在做完表达量差异分析后发现它并不在上下调列表里面,感觉有点惶恐,如果是真实现象,那么: Continue reading
众所周知,实验室培养的癌症细胞系肯定是非常纯粹的恶性增殖的肿瘤细胞啦。
它被人诟病的一个缺点就是没办法代表真实的肿瘤病人的肿瘤部位的微环境,既然它缺失了肿瘤微环境,如果你测肿瘤细胞系培养物(药物处理前后)的单细胞转录组,就没办法follow我们分享的绝大部分的肿瘤领域的单细胞转录组的第一层次降维聚类分群以及生物学命名,详见之前的介绍 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则, 是 : Continue reading
出版社送了一本书(R语言)给我,这个《R语言实战》已经是R语言领域的“老兵”了,几乎是人手一本,目前是第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading
出版社送了一本书(R语言)给我,就是这个《R语言实战》第三版,它已经是R语言领域的“老兵”了,几乎是人手一本。
新鲜出炉的第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading
出版社送了一本书(R语言)给我,就是这个《R语言实战》第三版,它已经是R语言领域的“老兵”了,几乎是人手一本。
新鲜出炉的第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading
常规需求是文本文件交互,比如 文件打开、文件写入、文件内容刷新等等,如果默认的文件没有规则仅仅是里面有内容,就需要使用比较底层的函数:
file()
函数来打开一个文件。这个函数会返回一个连接,你可以通过这个连接来读取或写入文件。例如: Continue reading R语言基础函数很多都是超级简单的英文单词,以下是一些R语言中基础函数的简单英文单词举例:
学员给了一个2023的单细胞文章:《Single-cell RNA sequencing reveals a mechanism underlying the susceptibility of the left atrial appendage to intracardiac thrombogenesis during atrial fibrillation》里面的单细胞转录组数据集仅仅是公开了数据集的fastq文件,并没有表达量矩阵。我们就顺手下载并且处理了。
首先需要参考 小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码),走cellranger流程,主要是拿到服务器后配置自己的conda环境,以及下载项目对应的单细胞转录组数据集的fastq文件,如下所示: Continue reading
无意中看到了这个宝藏资源:https://bioinformatics.ccr.cancer.gov/btep/,是NIH的癌症中心每周常规生信培训,值得推荐:
每次培训都有全部的授课资源整理并且网络公开分享,比如:https://btep.ccr.cancer.gov/docs/data-visualization-with-r
一般来说,GEO数据库的每个GPL平台都有对应的网页,而且可以获取其详细信息的txt文本文件,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244
就是如下所示: Continue reading
做生物信息学的我们经常会接触到生物信息学相关数据库等网络资源,绕不开的就是EBI和NCBI,我们以前介绍的单细胞转录组项目数据通常是ncbi旗下的sra或者geo数据库,但实际上ebi旗下的ArrayExpress数据库的也是有部分单细胞数据资源。
EBI (European Bioinformatics Institute) 和 NCBI (National Center for Biotechnology Information) 都是全球领先的生物信息学研究机构,它们提供了大量的生物信息学数据库和工具,对全球的科研工作者开放。 Continue reading
一大早就看到了两个chatGPT在生物信息学的应用,感觉有必要参与到其中了。如果大家看完后也有同感,可以一起加入讨论组哈, 群策群力,看看如何更好的向chatGPT提问,如何更好的使用这个AI助手,在我们的生物信息学数据处理过程中。 Continue reading
我首先让chatGPT帮我根据fasta格式的蛋白质序列文件,使用Python语言计算里面的每个蛋白质的序列长度和分子量,它给了描述了解题思路。。。
看起来蛮厉害的,我怀疑它可能是对我的真正的需求不够了解,我其实就是想让他帮忙写代码,就继续追问它: Continue reading
如果你去openAI问chatGPT关于孟德尔随机化的流程,它是这样的回答:
是的,我可以为您提供一个孟德尔随机化的流程介绍。
孟德尔随机化是一种常见的生物信息学算法,用于评估基因对生物学过程的影响。该算法通过模拟随机基因重排来评估基因组和外显子组的对生物学目标的影响。
以下是孟德尔随机化的流程: Continue reading
隔三差五就有小伙伴在交流群里面问到他自己在进行CD4和CD8的T细胞细分亚群的时候非常纠结,根本就没办法确定下来到底应该是分多少群以及到底是应该按照什么顺序分。其实很正常,之前我们组建了CD4和CD8的T细胞的交流群就探讨失败,虽然说CD8 T和CD4 T细胞亚群 是一种分类方法,但是各自内部又是可以按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion。 Continue reading
最近在交流群看到了一个很有意思的讨论,就是他看到了他们领域的癌症高分文献,发现里面的差异分析结果跟之前的另外一个高分文献里面的基因很不一样,就以为我们生物信息学是万能魔法,可以让任意基因都有差异:
Continue reading
这两天看到了各种交流群以及朋友圈小伙伴都在转发和祝贺张泽民课题组的泛癌层面NK单细胞数据挖掘文章, 我简单看了看,类似的策略的数据挖掘居然一直可以发CNS级别杂志,让人膜拜:
众所周知,单个单细胞的转录组,如果是目前流行的10x这样的单细胞转录组技术,具体到每个细胞层面我们拿到的表达量信息通常是500到2000个基因的范围,也就是说如果我们的参考基因组注释文件里面是2万或者6万基因会出现起码90%的基因是缺失的,这个现象在单细胞转录组领域称作是drop-out (大家可以自行统计一下pbmc3k这个示例数据的drop-out情况 ) Continue reading
基本上每年我们都会在生信技能树等公众号写多个教程分享WGCNA的实战细节,比如: Continue reading