最近看到了朋友圈很多小伙伴转发了美国德克萨斯大学MD安德森癌症中心的王凌华教授和Humam Kadara教授的合作团队在《Nature》在线发表了题为 《An atlas of epithelial cell states and plasticity in lung adenocarcinoma》的最新文章(2024年2月28日),也在各个交流群看到了大家发原文PDF,我就好奇打开看了看,发现人家里面的数据居然是三年前的单细胞转录组: Continue reading
Monthly Archives: 8月 2024
样品分组都弄错了,数据分析结论还可靠吗
五年前大家做单细胞转录组的时候,三五万左右一个样品的收费让绝大部分课题组都望而却步,一般来说那个时候做少量的几个样品就足够发cns或者子刊级别的文章啦。 Continue reading
香港政府拨款60亿资助生物信息学等前沿生命科学研究
看到了香港多个媒体报道了这一笔拨款,就是今天( 2024年2月16日 星期五)的资讯,因为是繁体字,香港政府拨款60亿,这个资助将会聚焦包括細胞和基因治療、生物訊息學和生物學、生物醫學工程等前沿主題。 Continue reading
我的巨噬细胞少了一个亚群吗,我错了吗
前些天在我们生信技能树视频号直播一个文章的单细胞转录组数据(GSE208706)处理,文章是:《Amphiregulin from regulatory T cells promotes liver fibrosis and insulin resistance in non-alcoholic steatohepatitis》,就是基本的降维聚类分群而已,几分钟就搞定了。
一般来说,麻烦的地方都是单细胞亚群的生物学命名啦,如下所示可以看到我在我们生信技能树视频号直播时候就是简单的分了大类,这个也是我常规的操作,代码在: Continue reading
为什么做拟时序(拟时序一本通01)
单细胞转录组已经火爆了五个年头,到如今的2024大家其实已经非常熟悉了它的标准数据分析思路。都是先整合全部的样品的表达量矩阵后走降维聚类分群,然后第一层次降维聚类分群先在低分辨率的条件下对各个亚群进行生物学命名。如果是肿瘤领域的我们通常是进行如下所示的分类: Continue reading
为什么说可视化会欺骗你
最近实习生在跑我布置的单细胞转录组练习题的时候汇报给我了一个很有意思的“视觉效应”,使用的仍然是最经典的数据集,是来自于SeuratData包的ifnb数据集,详见;SCTransform真的能完美替代Seurat早期的3个函数吗。代码如下所示; Continue reading
为什么半月板有少量免疫细胞而软骨里面没有呢
看到了2023的一个文章:《A senescent cell population with ZEB1 transcription factor as its main regulator promotes osteoarthritis in cartilage and meniscus》做了正常人和OA病人的软骨(cartilage)和半月板(meniscus)这两个组织部位的单细胞转录组。 Continue reading
同时表达巨噬细胞和b细胞标记基因的亚群是全新亚群吗
看到了一个2023的单细胞转录组数据挖掘文章:《A novel phenotype of B cells associated with enhanced phagocytic capability and chemotactic function after ischemic stroke》,主要的结论就是同时表达巨噬细胞和b细胞标记基因的亚群是全新亚群。
其实他们挖掘的是他们课题组自己的2021的文章的单细胞转录组数据: ischemic mouse brains at 5 and 14 days after tMCAO (GSE171169) ,如下所示的4个样品: Continue reading
他说要带领100万人学生信
熟悉我们《生信技能树》的小伙伴可能有印象,我们之前有一个口号是培养十万生信工程师,在过去的十年间我们也确实做到了,从手把手的学徒和实习生培养到长达一个月的马拉松互动授课,再到b站的ngs多组学课程,陆陆续续也影响了约莫十万人吧!
但是有两个问题躲在后面,首先是我们的引导只能说是让生命科学领域的小伙伴跨行认识一下生物信息学,入个门而已。其次,三年疫情叠加生物医疗经济下行,实际上生物信息学工程师饱和了!!!所以我们就与时俱进换另一个口号:让百万生命科学领域从业者认识生信! Continue reading
数据处理过程中的合理的质量控制是很有必要的
单细胞转录组数据分析过程有几个难点:
- 去除双细胞
- 去除低质量细胞亚群
- 回归掉细胞周期等因素 Continue reading
使用singleR基于自建数据库来自动化注释单细胞转录组亚群
早期(可能是五六年前)我们的单细胞转录组数据分析教程确实是提到过singleR的方法,它可以依赖于singleR自己的数据库文件去自动化注释单细胞转录组亚群。
但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是: Continue reading
使用R或者Python编程语言完成Excel的基础操作
职场白领和学生通常都会对Excel有一定的熟悉度,原因如下: Continue reading
使用pacman包来批量管理各种r包
看到了之前的实习生离开后还在持之以恒学习做生物信息学基础知识整理,非常欣慰。而且是春节期间也在不间断更新,这一点就超过了我, 起码我春节前后两周都是在各种转载“混日子”了 。比如这2024-02-12 更新了:芯片代码实操(1)提前安装所需R包,里面提到的批量管理各种r包的小技巧是我十年前整理的。 Continue reading
生信数据分析合伙人招募(月薪五万不是梦)
前两天又又又上我们生物信息学领域的热搜了,我这招黑体质啊!!!详见:该不该一小时挣过万的数据分析费 Continue reading
# 生物人恭喜啦!2024拿下这个技术,马上就业
众所周知,生命科学领域的本科生或者双非研究生基本上不太可能在就业市场找到对口工作,要么去考公务员要么去做各种杂七杂八销售。有父辈资源的另说哈,毕竟你爸妈帮你“吃苦”了,你可以做点小本生意或者继承家业!
这一点,我们前些天转发的推文:学生物到底有什么出路?,讲解的很清楚啦,金字塔式的阶梯发展道路: Continue reading
两种让你的样品分组看起来更为合理的方法
我在生信技能树的教程:《你确定你的差异基因找对了吗?》提到过,必须要对你的转录水平的全局表达矩阵做好质量控制,最好是看到标准3张图: Continue reading
上海市生物信息学会
在微信群看到了一个第三轮通知|2024年长三角第二届生物信息学学术大会,是4月的12到14日在上海衡山北郊宾馆举办的,然后主办单位是上海市生物信息学会,我第一次看到,所以就搜索了一下上海市生物信息学会。 Continue reading
如何整理好10x技术的单细胞转录组的表达量矩阵3文件
今天的单细胞天地公众号分享了:scanpy怎么分开读取GEO数据库的10X单细胞3个文件,使用Python的scanpy分别读取3个文件后,再组合起来。在R也是可以这样操作,但是会很麻烦。之前在在单细胞天地教程:表达矩阵逆转为10X的标准输出3个文件,详细介绍过 10X文件的3个标准文件。比如SRR7722939数据集里面,文件barcodes.tsv
和 genes.tsv
,就是表达矩阵的行名和列名: Continue reading
如何整合10x和smart-seq2技术平台的单细胞转录组数据
Smart-seq2和10x这两个单细胞技术是现在初学者进入单细胞领域最需要掌握的,它们代表着单细胞的两个全然不同的发展策略。 Continue reading
如何让你的kegg注释结果图分门别类
KEGG数据库是一个综合性的生物信息数据库,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。它整合了基因组、化学和系统功能信息,旨在从分子水平上理解生物系统的高级功能和实用程序,特别是细胞、生物体和生态系统的功能。
KEGG数据库的分类情况相当广泛,它将信息分为三大类:系统信息、基因组信息和化学信息。进一步细分为16个主要的数据库。这些数据库包括: Continue reading