28

一份单细胞数据多篇顶刊文章(这就是生信大神课题组实力吧)

最近看到了朋友圈很多小伙伴转发了美国德克萨斯大学MD安德森癌症中心的王凌华教授和Humam Kadara教授的合作团队在《Nature》在线发表了题为 《An atlas of epithelial cell states and plasticity in lung adenocarcinoma》的最新文章(2024年2月28日),也在各个交流群看到了大家发原文PDF,我就好奇打开看了看,发现人家里面的数据居然是三年前的单细胞转录组: Continue reading

28

我的巨噬细胞少了一个亚群吗,我错了吗

前些天在我们生信技能树视频号直播一个文章的单细胞转录组数据(GSE208706)处理,文章是:《Amphiregulin from regulatory T cells promotes liver fibrosis and insulin resistance in non-alcoholic steatohepatitis》,就是基本的降维聚类分群而已,几分钟就搞定了。
一般来说,麻烦的地方都是单细胞亚群的生物学命名啦,如下所示可以看到我在我们生信技能树视频号直播时候就是简单的分了大类,这个也是我常规的操作,代码在: Continue reading

28

为什么做拟时序(拟时序一本通01)

单细胞转录组已经火爆了五个年头,到如今的2024大家其实已经非常熟悉了它的标准数据分析思路。都是先整合全部的样品的表达量矩阵后走降维聚类分群,然后第一层次降维聚类分群先在低分辨率的条件下对各个亚群进行生物学命名。如果是肿瘤领域的我们通常是进行如下所示的分类: Continue reading

28

同时表达巨噬细胞和b细胞标记基因的亚群是全新亚群吗

看到了一个2023的单细胞转录组数据挖掘文章:《A novel phenotype of B cells associated with enhanced phagocytic capability and chemotactic function after ischemic stroke》,主要的结论就是同时表达巨噬细胞和b细胞标记基因的亚群是全新亚群。
其实他们挖掘的是他们课题组自己的2021的文章的单细胞转录组数据: ischemic mouse brains at 5 and 14 days after tMCAO (GSE171169) ,如下所示的4个样品: Continue reading

28

他说要带领100万人学生信

熟悉我们《生信技能树》的小伙伴可能有印象,我们之前有一个口号是培养十万生信工程师,在过去的十年间我们也确实做到了,从手把手的学徒和实习生培养到长达一个月的马拉松互动授课,再到b站的ngs多组学课程,陆陆续续也影响了约莫十万人吧!

但是有两个问题躲在后面,首先是我们的引导只能说是让生命科学领域的小伙伴跨行认识一下生物信息学,入个门而已。其次,三年疫情叠加生物医疗经济下行,实际上生物信息学工程师饱和了!!!所以我们就与时俱进换另一个口号:让百万生命科学领域从业者认识生信! Continue reading

28

使用singleR基于自建数据库来自动化注释单细胞转录组亚群

早期(可能是五六年前)我们的单细胞转录组数据分析教程确实是提到过singleR的方法,它可以依赖于singleR自己的数据库文件去自动化注释单细胞转录组亚群。

但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是: Continue reading

28

使用pacman包来批量管理各种r包

看到了之前的实习生离开后还在持之以恒学习做生物信息学基础知识整理,非常欣慰。而且是春节期间也在不间断更新,这一点就超过了我, 起码我春节前后两周都是在各种转载“混日子”了 。比如这2024-02-12 更新了:芯片代码实操(1)提前安装所需R包,里面提到的批量管理各种r包的小技巧是我十年前整理的。 Continue reading

27

# 生物人恭喜啦!2024拿下这个技术,马上就业

众所周知,生命科学领域的本科生或者双非研究生基本上不太可能在就业市场找到对口工作,要么去考公务员要么去做各种杂七杂八销售。有父辈资源的另说哈,毕竟你爸妈帮你“吃苦”了,你可以做点小本生意或者继承家业!

这一点,我们前些天转发的推文:学生物到底有什么出路?,讲解的很清楚啦,金字塔式的阶梯发展道路: Continue reading

27

上海市生物信息学会

在微信群看到了一个第三轮通知|2024年长三角第二届生物信息学学术大会,是4月的12到14日在上海衡山北郊宾馆举办的,然后主办单位是上海市生物信息学会,我第一次看到,所以就搜索了一下上海市生物信息学会。 Continue reading

27

如何整理好10x技术的单细胞转录组的表达量矩阵3文件

今天的单细胞天地公众号分享了:scanpy怎么分开读取GEO数据库的10X单细胞3个文件,使用Python的scanpy分别读取3个文件后,再组合起来。在R也是可以这样操作,但是会很麻烦。之前在在单细胞天地教程:表达矩阵逆转为10X的标准输出3个文件,详细介绍过 10X文件的3个标准文件。比如SRR7722939数据集里面,文件barcodes.tsvgenes.tsv,就是表达矩阵的行名和列名: Continue reading

27

如何让你的kegg注释结果图分门别类

KEGG数据库是一个综合性的生物信息数据库,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。它整合了基因组、化学和系统功能信息,旨在从分子水平上理解生物系统的高级功能和实用程序,特别是细胞、生物体和生态系统的功能。

KEGG数据库的分类情况相当广泛,它将信息分为三大类:系统信息、基因组信息和化学信息。进一步细分为16个主要的数据库。这些数据库包括: Continue reading