二 23

踏入生物信息学海洋的必修课是什么

Posted on 2024年2月23日 by ulwvfje

约等于办公技能（Excel，Word，PPT三件套），不同的人对它的需求不一样决定了大家需要不同程度的掌握它：

文员/秘书约等于科研助理
项目经理约等于课题组小老板
程序员约等于生信工程师
算法。。。

并不是所有人都需要学生信 Continue reading →

二 23

它想强迫我升级一系列seurat相关的单细胞R包

Posted on 2024年2月23日 by ulwvfje

之前写的很多单细胞笔记都是基于V4版本的Seurat系列包，其中SeuratData 是 R 语言中 Seurat 包提供的一个数据包，旨在为使用 Seurat 进行单细胞RNA测序分析的用户提供方便的测试数据。Seurat 是一款用于单细胞转录组学分析的强大工具，而 SeuratData 数据包则包含了一些用于练习和演示的标准数据集，帮助用户学习和熟悉 Seurat 的使用。

SeuratData 可以用于教学和演示目的。在学习 Seurat 的时候，用户可以使用这些数据集来尝试不同的分析步骤，了解 Seurat 包的各种功能。比如我们经常使用的是pbmc3k这个数据集： Continue reading →

二 23

数据分析有错误并不可怕，造假才不可饶恕

Posted on 2024年2月23日 by ulwvfje

最近学徒在交流群里面点名了一个新鲜出炉（ 2023年12月5日）的cell期刊的文章，因为里面有常规转录组，单细胞转录组，以及空间单细胞转录组，主流生物信息学技术都被囊括了，非常适合初学者练手。通讯作者是中山大学孙逸仙纪念医院的苏士成，他最近非常出名，被选为2023年“新基石研究员”，获2500万元资助。

这个文章标题短小精悍：《Choroid plexus mast cells drive tumor-associated hydrocephalus》，相关数据在：https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE207546

可以看到是常规转录组，单细胞转录组，以及空间单细胞转录组，如下所示： Continue reading →

二 23

数据备份要追溯到五年前

Posted on 2024年2月23日 by ulwvfje

五年前我做了一些ngs数据分析教程，当时是为了给学徒演示数据分析的基础概念，也录屏上传到了B站：

免费视频课程《甲基化芯片数据分析》交流群组建通知
免费视频课程《ChIP-seq数据分析》交流群组建通知
免费视频课程《外显子测序数据分析》交流群组建通知
免费视频课程《RNA-seq数据分析》交流群组建通知
同时也顺手帮一些粉丝处理了他们的数据，都是非常简单的流程化数据处理，比对+定量或者peaks，其中一个项目到投稿了才找我重新帮他检查数据。因为有计算机资源，而且流程都是写好了，所以跑代码就是自动化即可。不过这次发现其中一个样品的peaks既然是空文件，从我的个人经验来看肯定不是什么诺奖级别的发现，大概率就是样品文件有问题而已。所以我回溯到bam文件看比对情况： Continue reading →

二 02

是否有必要对癌症病人的血液采样做单细胞转录组呢

Posted on 2024年2月2日 by ulwvfje

最近看到了《单细胞天地》公众号介绍了一个2021年发表在NC的文章，标题：《Dissecting esophageal squamous-cell carcinoma ecosystem by single-cell transcriptomic analysis》 Continue reading →

二 02

是的，我不招人

Posted on 2024年2月2日 by ulwvfje

在过去的十多年里我本人坚持了在生物信息学知识点整理的笔记教程的日更，以至于在这个自媒体圈子里面还算是小有名气，如果我再坚持十年未必不是我们这个领域的一段佳话。 Continue reading →

二 01

使用topGO增强你的GO数据库注释结果的可视化

Posted on 2024年2月1日 by ulwvfje

前些天我在生物学功能注释三板斧，提到了简单的超几何分布检验，复杂一点可以是gsea和gsva，更复杂一点的可以是DoRothEA和PROGENy类似的打分。 Continue reading →

二 01

使用TCGAbiolinks包进行TCGA的somatic的突变信息下载整理有时候会失败

Posted on 2024年2月1日 by ulwvfje

有学徒在完成我布置的一个月前（ 2023-12-01 ）的学徒作业：任意癌症的任意基因突变与否分组后的转录组测序的差异分析的时候，选择了使用TCGAbiolinks包进行TCGA的somatic的突变信息下载，但是他失败了，所以我就帮忙debug了一下。 Continue reading →

二 01

使用Seurat的v5来读取多个不是10x标准文件的单细胞项目

Posted on 2024年2月1日 by ulwvfje

前面我们在初试Seurat的V5版本的推文里面演示了10x单细胞样品的标准3文件的读取，而且在使用Seurat的v5来读取多个10x的单细胞转录组矩阵的推文里面演示了多个10x单细胞样品的标准3文件的读取。

但是留下来了一个悬念，就是如果我们的单细胞转录组并不是10x的标准3文件，而是tsv或者csv或者txt等文本文件表达量矩阵信息，就有点麻烦了。接下来我们以2020的文章：《Single-Cell Transcriptome Analysis Reveals Dynamic Cell Populations and Differential Gene Expression Patterns in Control and Aneurysmal Human Aortic Tissue》举例说明，它的数据集是 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE155468 Continue reading →

二 01

使用Seurat的v5来读取多个10x的单细胞转录组矩阵

Posted on 2024年2月1日 by ulwvfje

前面我们在初试Seurat的V5版本的推文里面演示了文章标题是：《CD36+ cancer-associated fibroblasts provide immunosuppressive microenvironment for hepatocellular carcinoma via secretion of macrophage migration inhibitory factor》，的数据集GSE202642的Seurat的v5读取方式。

Continue reading →

二 01

使用pathview增强你的KEGG数据库注释结果的可视化

Posted on 2024年2月1日 by ulwvfje

前些天我在生物学功能注释三板斧，提到了简单的超几何分布检验，复杂一点可以是gsea和gsva，更复杂一点的可以是DoRothEA和PROGENy类似的打分。

其中 GO（Gene Ontology）和KEGG（Kyoto Encyclopedia of Genes and Genomes）数据库是两个常用的生物学功能注释数据库，科学家通常是使用来超几何分布检验这个统计学算法做富集分析，即通过比较实际观察到的基因集合（几十个或者几百个）中特定功能或通路的基因数量与随机期望的数量来判断其是否富集。 Continue reading →

二 01

使用aPEAR来增强clusterProfiler的GSEA分析结果

Posted on 2024年2月1日 by ulwvfje

前些天我在生物学功能注释三板斧，提到了简单的超几何分布检验，复杂一点可以是gsea和gsva，更复杂一点的可以是DoRothEA和PROGENy类似的打分。

其中 GO（Gene Ontology）和KEGG（Kyoto Encyclopedia of Genes and Genomes）数据库是两个常用的生物学功能注释数据库，但是GO数据库注释通常包括三个方面的信息：分子功能（Molecular Function）、细胞组分（Cellular Component）和生物过程（Biological Process）。而前面我们演示了：使用topGO增强你的GO数据库注释结果的可视化，是超几何分布检验的结果的可视化，主要是展示GO数据库的有向无环图结构。接下来我们聊聊使用clusterProfiler的GSEA方法针对GO数据库进行注释后的结果的可视化，所以是需要大家自己提前弄清楚GSEA方法和超几何分布检验方法的区别哦！ Continue reading →

二 01

时间序列转录组多次差异分析以及时序分析

Posted on 2024年2月1日 by ulwvfje

学员做了一个时间序列转录组测序项目，我们帮忙处理了一下，实验设计如下所示：

实验设计

首先是质量控制

可以看到是12d和48h处理的效果不一样，其中48h的处理跟control更接近，而12d的处理很明显影响很大：

而12d的处理很明显影响很大

Continue reading →

二 01

生信人该如何帮助蔡磊及50万名渐冻症患者

Posted on 2024年2月1日 by ulwvfje

最近很多行业交流群都被因渐冻症而备受关注的原京东副总裁蔡磊的视频刷屏了：

2024年1月27日，京东原副总裁、渐冻症抗争者蔡磊在微博发布消息称，与夫人将再捐助1亿元，用于支持渐冻症的基础研究、药物研发、临床医疗等科研项目。 Continue reading →

二 01

生信技能树一日游套餐

Posted on 2024年2月1日 by ulwvfje

最近是又搞文章数据分析的图表复现文字版教程，也有视频号的直播互动，详见：殊路同归的关键单细胞亚群鉴定算法，但是阅读量就是起不来。

我可能是悟了，其实大家感兴趣的应该是我本人，过去的七八年间一百多个实习生都有自己的生物信息学笔记公众号都在日更产出知识点，在知识输出这方面我其实并不是我早期的实习生了。而且现在没办法继续培养实习生，我的办公室就空下来了，之前是预留的生信共享办公室出租，也是无人问津，想了想可能是因为基本上很难有人下定决心换一个城市生活和工作。 Continue reading →

二 01

生信分析和实验结果哪个更可靠

Posted on 2024年2月1日 by ulwvfje

昨天的视频号直播：踏入生物信息学海洋的必修课是什么，举办方精选出来的读者提问都是很精锐的辩论题，包括：狂敲代码和玩转思路的二选一，临床问题和基础科研孰轻孰重。安排到我和Y叔的一个共同讨论题是：生信分析和实验结果哪个更可靠？ Continue reading →

二 01

生信本科毕业后年薪五十万但能跳过这份月薪1000的实习吗

Posted on 2024年2月1日 by ulwvfje

因为“众所周知”的原因，我们持续了五六年的实习生培养计划从此落幕了，但是这个事件让小红书走入了我的视线。隔三差五就打开看看里面的关于生物信息学学习和就业市场的真实分享，其中一个小伙伴（河北大学的2019届生信专业本科毕业生）分享了他最近五年的职场进阶之路，就是从研究所再到上市公司再到朝气蓬勃的小公司……
蛮有意思的，让我看到了十年前的我，也是大四就去帝都实习半年那个时候差一点就牺牲在2013的全城雾霾，也是工作三四年就年薪差不多30万了，不过我没有选择继续去涨工资到年薪50万而是蹉跎了七年在尝试科研路。 Continue reading →

二 01

生物学功能注释三板斧

Posted on 2024年2月1日 by ulwvfje

生物学功能注释是对特定的数量（几十个或者几百个）基因或蛋白的合集的功能进行描述和分类的过程。GO（Gene Ontology）和KEGG（Kyoto Encyclopedia of Genes and Genomes）数据库是两个常用的生物学功能注释数据库，科学家通常是使用来超几何分布检验这个统计学算法做富集分析，即通过比较实际观察到的基因集合（几十个或者几百个）中特定功能或通路的基因数量与随机期望的数量来判断其是否富集。 Continue reading →

二 01

生物信息学软件工具的大致分类

Posted on 2024年2月1日 by ulwvfje

生物信息学领域涉及到大量的不同种类的数据的分析和处理工作，因此这个领域就必然产生许多不同类型的软件工具，比如处理DNA、RNA、蛋白质序列等不同层面的数据。但是我们这里并不想按照组学种类来对生物信息学软件工具进行分类，因为不同组学经常是有软件是交叉的，比如fastqc软件就可以针对不同ngs组学数据进行质量控制。我这里把生物信息学软件工具按照使用难易程度的大致分成3类： Continue reading →

二 01

谁说文科专业本科学历不能年薪三五十万

Posted on 2024年2月1日 by ulwvfje

张雪峰最近在直播中又说出了让全网沸腾的“暴论”：“文科都是服务业，什么是服务业？总结成一个字就是‘舔’，就是‘爷我给你笑一个’，‘爷买一号链接吗’”。
张雪峰的意思应该是想说文科专业毕业后不仅仅工资低，而且还不受尊重吧。 Continue reading →

Page 16 of 92« First ‹ Previous 13 14 151617 18 19 Next ›Last »

生信菜鸟团

欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee

Category Archives: 未分类

踏入生物信息学海洋的必修课是什么

并不是所有人都需要学生信 Continue reading →

它想强迫我升级一系列seurat相关的单细胞R包

数据分析有错误并不可怕，造假才不可饶恕

数据备份要追溯到五年前

是否有必要对癌症病人的血液采样做单细胞转录组呢

是的，我不招人

使用topGO增强你的GO数据库注释结果的可视化

使用TCGAbiolinks包进行TCGA的somatic的突变信息下载整理有时候会失败

使用Seurat的v5来读取多个不是10x标准文件的单细胞项目

使用Seurat的v5来读取多个10x的单细胞转录组矩阵

使用pathview增强你的KEGG数据库注释结果的可视化

使用aPEAR来增强clusterProfiler的GSEA分析结果

时间序列转录组多次差异分析以及时序分析

首先是质量控制

Continue reading →

生信人该如何帮助蔡磊及50万名渐冻症患者

生信技能树一日游套餐

生信分析和实验结果哪个更可靠

生信本科毕业后年薪五十万但能跳过这份月薪1000的实习吗

生物学功能注释三板斧

生物信息学软件工具的大致分类

谁说文科专业本科学历不能年薪三五十万

2025年4月
一	二	三	四	五	六	日
« 九
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30