约等于办公技能(Excel,Word,PPT三件套),不同的人对它的需求不一样决定了大家需要不同程度的掌握它:
- 文员/秘书 约等于 科研助理
- 项目经理 约等于 课题组小老板
- 程序员 约等于 生信工程师
- 算法。。。
并不是所有人都需要学生信 Continue reading
约等于办公技能(Excel,Word,PPT三件套),不同的人对它的需求不一样决定了大家需要不同程度的掌握它:
之前写的很多单细胞笔记都是基于V4版本的Seurat系列包,其中SeuratData
是 R 语言中 Seurat 包提供的一个数据包,旨在为使用 Seurat 进行单细胞RNA测序分析的用户提供方便的测试数据。Seurat 是一款用于单细胞转录组学分析的强大工具,而 SeuratData
数据包则包含了一些用于练习和演示的标准数据集,帮助用户学习和熟悉 Seurat 的使用。
SeuratData
可以用于教学和演示目的。在学习 Seurat 的时候,用户可以使用这些数据集来尝试不同的分析步骤,了解 Seurat 包的各种功能。比如我们经常使用的是pbmc3k这个数据集: Continue reading
最近学徒在交流群里面点名了一个新鲜出炉( 2023年12月5日)的cell期刊的文章,因为里面有常规转录组,单细胞转录组,以及空间单细胞转录组,主流生物信息学技术都被囊括了,非常适合初学者练手。通讯作者是中山大学孙逸仙纪念医院的苏士成,他最近非常出名,被选为2023年“新基石研究员”,获2500万元资助。
这个文章标题短小精悍:《Choroid plexus mast cells drive tumor-associated hydrocephalus》,相关数据在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE207546
可以看到是常规转录组,单细胞转录组,以及空间单细胞转录组,如下所示: Continue reading
五年前我做了一些ngs数据分析教程,当时是为了给学徒演示数据分析的基础概念,也录屏上传到了B站:
最近看到了《单细胞天地》公众号介绍了一个2021年发表在NC的文章,标题:《Dissecting esophageal squamous-cell carcinoma ecosystem by single-cell transcriptomic analysis》 Continue reading
在过去的十多年里我本人坚持了在生物信息学知识点整理的笔记教程的日更,以至于在这个自媒体圈子里面还算是小有名气,如果我再坚持十年未必不是我们这个领域的一段佳话。 Continue reading
前些天我在 生物学功能注释三板斧,提到了简单的超几何分布检验,复杂一点可以是gsea和gsva,更复杂一点的可以是DoRothEA和PROGENy类似的打分。 Continue reading
有学徒在完成我布置的一个月前( 2023-12-01 )的学徒作业:任意癌症的任意基因突变与否分组后的转录组测序的差异分析的时候,选择了使用TCGAbiolinks包进行TCGA的somatic的突变信息下载,但是他失败了,所以我就帮忙debug了一下。 Continue reading
前面我们在 初试Seurat的V5版本 的推文里面演示了10x单细胞样品的标准3文件的读取,而且在使用Seurat的v5来读取多个10x的单细胞转录组矩阵 的推文里面演示了多个10x单细胞样品的标准3文件的读取。
但是留下来了一个悬念, 就是如果我们的单细胞转录组并不是10x的标准3文件,而是tsv或者csv或者txt等文本文件表达量矩阵信息,就有点麻烦了。接下来我们以2020的文章:《Single-Cell Transcriptome Analysis Reveals Dynamic Cell Populations and Differential Gene Expression Patterns in Control and Aneurysmal Human Aortic Tissue》举例说明,它的数据集是 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE155468 Continue reading
前面我们在 初试Seurat的V5版本 的推文里面演示了文章标题是:《CD36+ cancer-associated fibroblasts provide immunosuppressive microenvironment for hepatocellular carcinoma via secretion of macrophage migration inhibitory factor》,的数据集GSE202642的Seurat的v5读取方式。
前些天我在 生物学功能注释三板斧,提到了简单的超几何分布检验,复杂一点可以是gsea和gsva,更复杂一点的可以是DoRothEA和PROGENy类似的打分。
其中 GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是两个常用的生物学功能注释数据库,科学家通常是使用来超几何分布检验这个统计学算法做富集分析,即通过比较实际观察到的基因集合(几十个或者几百个)中特定功能或通路的基因数量与随机期望的数量来判断其是否富集。 Continue reading
前些天我在 生物学功能注释三板斧,提到了简单的超几何分布检验,复杂一点可以是gsea和gsva,更复杂一点的可以是DoRothEA和PROGENy类似的打分。
其中 GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是两个常用的生物学功能注释数据库,但是GO数据库 注释通常包括三个方面的信息:分子功能(Molecular Function)、细胞组分(Cellular Component)和生物过程(Biological Process)。而前面我们演示了:使用topGO增强你的GO数据库注释结果的可视化,是超几何分布检验的结果的可视化,主要是展示GO数据库的有向无环图结构。接下来我们聊聊使用clusterProfiler的GSEA方法针对GO数据库进行注释后的结果的可视化,所以是需要大家自己提前弄清楚GSEA方法和超几何分布检验方法的区别哦! Continue reading
学员做了一个时间序列转录组测序项目,我们帮忙处理了一下,实验设计如下所示:
可以看到是12d和48h处理的效果不一样,其中48h的处理跟control更接近,而12d的处理很明显影响很大:
最近很多行业交流群都被因渐冻症而备受关注的原京东副总裁蔡磊的视频刷屏了:
2024年1月27日,京东原副总裁、渐冻症抗争者蔡磊在微博发布消息称,与夫人将再捐助1亿元,用于支持渐冻症的基础研究、药物研发、临床医疗等科研项目。 Continue reading
最近是又搞文章数据分析的图表复现文字版教程,也有视频号的直播互动,详见:殊路同归的关键单细胞亚群鉴定算法,但是阅读量就是起不来。
我可能是悟了,其实大家感兴趣的应该是我本人,过去的七八年间一百多个实习生都有自己的生物信息学笔记公众号都在日更产出知识点,在知识输出这方面我其实并不是我早期的实习生了。而且现在没办法继续培养实习生,我的办公室就空下来了,之前是预留的生信共享办公室出租,也是无人问津,想了想可能是因为基本上很难有人下定决心换一个城市生活和工作。 Continue reading
昨天的视频号直播:踏入生物信息学海洋的必修课是什么,举办方精选出来的读者提问都是很精锐的辩论题,包括:狂敲代码和玩转思路的二选一,临床问题和基础科研孰轻孰重。安排到我和Y叔的一个共同讨论题是:生信分析和实验结果哪个更可靠? Continue reading
因为“众所周知”的原因,我们持续了五六年的实习生培养计划从此落幕了,但是这个事件让小红书走入了我的视线。隔三差五就打开看看里面的关于生物信息学学习和就业市场的真实分享,其中一个小伙伴(河北大学的2019届生信专业本科毕业生)分享了他最近五年的职场进阶之路,就是从研究所再到上市公司再到朝气蓬勃的小公司……
蛮有意思的,让我看到了十年前的我,也是大四就去帝都实习半年那个时候差一点就牺牲在2013的全城雾霾,也是工作三四年就年薪差不多30万了,不过我没有选择继续去涨工资到年薪50万而是蹉跎了七年在尝试科研路。 Continue reading
生物学功能注释是对特定的数量(几十个或者几百个)基因或蛋白的合集的功能进行描述和分类的过程。GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是两个常用的生物学功能注释数据库,科学家通常是使用来超几何分布检验这个统计学算法做富集分析,即通过比较实际观察到的基因集合(几十个或者几百个)中特定功能或通路的基因数量与随机期望的数量来判断其是否富集。 Continue reading
生物信息学领域涉及到大量的不同种类的数据的分析和处理工作,因此这个领域就必然产生许多不同类型的软件工具,比如处理DNA、RNA、蛋白质序列等不同层面的数据。但是我们这里并不想按照组学种类来对生物信息学软件工具进行分类,因为不同组学经常是有软件是交叉的,比如fastqc软件就可以针对不同ngs组学数据进行质量控制。我这里把生物信息学软件工具按照使用难易程度的大致分成3类: Continue reading
张雪峰最近在直播中又说出了让全网沸腾的“暴论”:“文科都是服务业,什么是服务业?总结成一个字就是‘舔’,就是‘爷我给你笑一个’,‘爷买一号链接吗’”。
张雪峰的意思应该是想说文科专业毕业后不仅仅工资低,而且还不受尊重吧。 Continue reading