一般来说,想挖掘GEO数据库的公共数据集,最后发表时候都要引用该数据集的原始文献。一个GSE数据集会关联到一个原始文献,比如:
Category Archives: 未分类
上皮细胞可以区分为恶性与否(CNS图表复现09)
三阴性乳腺癌表达矩阵探索(公共数据库挖掘实战)
生信技能树联盟创始人jimmy手把手带你完成一个GEO数据库(GSE76275
)挖掘实例,从必备R包安装,表达矩阵下载,PCA/boxplot/heatmp的数据检查,探针ID到基因ID的转换,根据生物学分组进行差异分析并且绘制火山图、热图,还有简单的超几何分布检验的KEGG等数据库注释结果。也有一点表达矩阵进行GSEA/GSVA
分析,以及WGCNA分析。最后还根据TNBC(三阴性乳腺癌)
的生物学特征提取指定基因的表达量,使用genefu
这个R包进行PAM50
分类。
Continue reading
乳腺癌和结直肠癌的基因分型居然可以应用于前列腺癌
朋友圈选美大赛
半年前我做了一个课程:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》 ,有意思的是没有一个人提交课程笔记,让我非常伤心,计划国庆节就解散钉钉群,删除钉钉群里面的录屏啦。
你要的rmarkdown文献图表复现全套代码来了(单细胞)
有了生物信息学数据分析,生命科学领域研究从此大不一样,不再是玄学。而且很多高质量的CNS文章,还好把配套文章的图表的数据和代码全部开源。比如前些天我们公布了唐医生推荐的《这个20G的单细胞项目数据和代码的压缩包有什么(python数据分析典范)》,很多粉丝表示从来没有想过居然需要学python,不是说好的基于R语言的统计可视化吗?
你要的单细胞数据挖掘视频课程来啦(仅需?8元)
一个星期前,我们分享了:单细胞数据挖掘文章代码全放送!!!,并且在文末询问大家是否需要录制视频来讲解这方面代码,主要是单细胞数据处理的主线:质控 —— 降维 —— 聚类 —— 差异分析 —— 细胞注释 —— 轨迹分析。
你的2个10x数据可以整合公共数据库的2个一起分析
看到华大基因团队的课题组丢在GigaScience杂志的一篇文章:Single-cell transcriptomic landscape of nucleated cells in umbilical cord blood ,链接是:https://academic.oup.com/gigascience/article/8/5/giz047/5484799 ,该研究仅仅是2个志愿者的脐带血单细胞转录组而已,但是成功的跟10X官网的外周血单细胞转录组细胞分群进行对比描述,讲述了一个比较好的生物学故事!
Continue reading
模仿GEO-TCGA数据库挖掘文章的全套分析流程
这是一个学徒作业,首发于生信技能树公众号,见:《GEO数据挖掘课程》配套练习题
Continue reading
免疫细胞亚群再分类(CNS图表复现05)
我们的CNS图表复现之旅已经开始,前面3讲是;
免费视频课程LncRNA-seq数据分析实战
我这七年写了几万篇教程,制作了几百个小时的教学实战演练视频课程,都是免费分享在各大网站(B站,知乎,简书,博客,GitHub,微云),必然会出现部分教程过时,一些资料缺失(主要是链接失效)。而且很多平台都是生信技能树的各个志愿者帮忙打理,我不可能要求志愿者们在辛辛苦苦帮我整理和发布资料的同时还提供答疑。
Continue reading
免费视频课程-TCGA数据库分析实战
我这七年写了几万篇教程,制作了几百个小时的教学实战演练视频课程,都是免费分享在各大网站(B站,知乎,简书,博客,GitHub,微云),必然会出现部分教程过时,一些资料缺失(主要是链接失效)。而且很多平台都是生信技能树的各个志愿者帮忙打理,我不可能要求志愿者们在辛辛苦苦帮我整理和发布资料的同时还提供答疑。
免费视频课程-表观调控组学联合分析实战
我这七年写了几万篇教程,制作了几百个小时的教学实战演练视频课程,都是免费分享在各大网站(B站,知乎,简书,博客,GitHub,微云),必然会出现部分教程过时,一些资料缺失(主要是链接失效)。而且很多平台都是生信技能树的各个志愿者帮忙打理,我不可能要求志愿者们在辛辛苦苦帮我整理和发布资料的同时还提供答疑。
美国辛辛那提大学的商业分析专业R语言
R语言并不是生物信息学的专属编程语言,其实它在金融,商业,游戏,地理产业应用也很广泛。最近我就看到了美国辛辛那提大学的商业分析专业在讲授R语言,课堂一撇如下:
满满的都是感动
真的是不知不觉,我们生信技能树公众号就走入了第四个年头。我们从网页论坛走入公众号方向的时候就是红海,耕耘的好辛苦。四年过去了,看着公众号这个媒体形式的没落我也很心痛。不过,咱们是干实事的,长期主义者,其实到并没有那么受限于平台,流量红利能拿到就最好,拿不到也就那样,不影响我的艰苦奋斗。
马哥和鸟哥你选择谁
入门生物信息学,绕不过去的一个坎就是Linux系统的认知及各项操作。
以前我通常是建议大家看《马哥Linux》,看第2~9章节即可。B站链接是: https://www.bilibili.com/video/av40331948/ 就是学习到P30即可。不要全部看完,太复杂了,视频可能难度超纲,毕竟是专业程序员的知识点,看B站视频的标题是运维共208讲就明白了。
Continue reading
聊个天就把生存分析给做了?
前些天我和我的学徒们在生信技能树分享了教程:人人都可以学会生存分析(学徒数据挖掘),提到根据公共数据库(比如TCGA)的信息来检查具体的某个或者某几个基因的生存意义已经是非常简单了,只需要很简单的数据库网页工具认知,或者一点点代码能力。
空白云服务器的一些生物信息学设置
再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
剑桥大学5天功能基因组培训课程全套资料(含单细胞转录组)
前面我们分享了 《华盛顿大学8天的生物信息学培训全部资料大放送》 类似,超级受欢迎!然后昨天其实在:单细胞前沿进展讲座和技术教程分享哪个更受你喜欢提到了剑桥大学的一个暑期5天小课堂,链接是:https://bioinformatics-core-shared-training.github.io/cruk-summer-school-2020/ (文末阅读原文直达课程主页!)
检查原文的细胞亚群的标记基因(CNS图表复现12)
前面的教程里面,我们首先根据 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则进行了初步分群,如下所示:
immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM), and stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)