我在B站阅读量10万+的视频合辑:【生信技能树】生信人应该这样学R语言 , https://www.bilibili.com/video/BV1cs411j75B?p=33 最后一讲,有一个彩蛋,里面其实是P33#福利# 使用rmarkdown制作转录组差异分析结题报告 ,这些年不间断推广,让这个rmarkdown报表走入了成千上万的粉丝! Continue reading
Monthly Archives: 6月 2020
R语言公益课程之bioconductor
我在生信技能树公众号发的《生信分析人员如何系统入门R(2019更新版)》给初学者的六步系统入门R语言,知识点路线图如下: Continue reading
R语言公益课程之基础绘图
我在生信技能树公众号发的《[生信分析人员如何系统入门R(2019更新版).](https://mp.weixin.qq.com/s/xOT4QGQsBMwu6R38AE9Y6A》给初学者的六步系统入门R语言,**知识点路线图**如下: Continue reading
miRNAseq数据分析这么多年了它的流程也没有固定
五年前我在生信菜鸟团博客分享了 一篇文章学会miRNA-seq分析 ,使用 RNA expression profiling of human iPSC-derived cardiomyocytes in a cardiac hypertrophy model. PLoS One 2014;9(9):e108051. PMID: 25255322 文章里面的 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE60292 数据集,2个分组,共6个样本。 Continue reading
ggplot2绘图基础功不扎实?看完这5个资源
单细胞技术大热,其数据分析里面很重要的一个环节就是可视化,真的是五花八门了!我们在单细胞天地公众号分享过几百篇单细胞CNS文章阅读笔记,大家可以看得到: Continue reading
bowtie比对miRNA的reads时候参数的影响
有两个很重要的参数:
- -m,指定最大比对到基因组的次数(suppress all alignments if > exist (def: no limit))
- -v或者-n,允许最大错配数,为[0-3] Continue reading
Untitled
这样画热图,涉嫌操纵数据了吗
很多朋友都有这样的疑问,为什么别人绘制出来的热图,差异那么明显,除了首先他们本身就先做了差异分析,挑选出来了有差异的基因,然后才热图可视化外,其实还有一个步骤,就是按照基因(行)对表达矩阵进行zscore转换。 Continue reading
这5个miRNA组成的肺鳞癌诊断基因集在tcga数据库能复现吗
最近看到某公司宣传他们的科研服务产品,是miRNA的芯片,而且文章居然是2011发表的,那个时候我还不知道生信是啥子。(我一直以为自己足够老了)
该研究使用的是 CapitalBio 平台 (CapitalBio 公司) 芯片,非常清晰的研究思路;
- 60+88个肺鳞癌病人肿瘤组织和癌旁的miRNA芯片表达矩阵,数据集在:GSE15008 Continue reading
这3个lncRNA组成的食管癌诊断分类器在tcga数据库能否复现
最近看到某公司宣传他们的产品,是lncRNA的芯片,文章是2015发表的,研究思路很清晰:
- 119个食管癌病人的肿瘤组织和配对样品的lncRNA芯片数据,在GSE53624
- 芯片平台比较老旧了,是Agilent human lncRNA+mRNA array V.2.0
- 把119个食管癌病人数据拆分成为 training (n=60) and test (n=59) 数据集 Continue reading
肿瘤转移的4个理论模型
最近看到朋友圈有人分享了2020年4月24日,北京大学生物医学前沿创新中心(BIOPIC)、生命科学学院白凡与国家癌症中心、中国医学科学院肿瘤医学张海增课题组合作在Nature Communications杂志上在线发表了研究论文:Mapping the spreading routes of lymphatic metastases in human colorectal cancer(人类结直肠癌向淋巴系统转移的路径研究)。 Continue reading
学徒作业-两个基因突变联合看生存效应
我喜欢把TCGA数据库的应用划分为8个领域:
- 1、探索各类肿瘤不同临床特征(性别、年龄、种族、临床分期)的预后(生存曲线)
- 2、探索各类肿瘤与对照的单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(箱线图) Continue reading
学徒跟着B站ATAC-seq视频5天完成流程
前面我已经学习完了jimmy老师的B站单细胞水平并且提交笔记:处理单细胞? Bioconductor就够用了,希望对大家有帮助哈!
最近刷视频看到了b站jimmy老师又更新了ATAC-seq系列教学指引,赶紧花几天时间follow了一遍!而且把我自己学习笔记分享给大家: Continue reading
新物种基因组组装
对人和鼠科研项目来说,各种NGS测序数据分析起来都是有成熟的流程和工具,但是并不是使用的物种都是有参考基因组和注释文件的,走流程的前提就需要先测定自己研究的物种的基因组,组装起来。 Continue reading
芯片明明设计了近6万探针但是作者上传的表达矩阵仅1万多个
最近有粉丝表示,跟着我的最新lncRNA视频学习后,走她自己感兴趣的项目,惊奇的发现,GAPDH这个基因并没有表达量,怀疑是我的芯片探针ID注释有问题。
我勒个去,火都烧到家门口了,必须迎战。
首先,我花了几分钟查看了该文章和数据集 Continue reading
我想知道这个热图里面的约百个基因是什么
日常刷文献,看到一个热图,非常长!如下: Continue reading
我可能错怪了那个不适合做人的学徒
在分享我是如何培养学徒的时候,提到了一个很有意思的数据处理故事: Continue reading
为什么使用bowtie而不是bowtie2
昨天,我们在生信技能树讨论了miRNA-seq数据分析流程,并且提出来了一个问题,就是为什么现在很多流程仍然是使用bowtie而不是bowtie2,见:miRNAseq数据分析这么多年了它的流程也没有固定 Continue reading
推荐几本生物信息学相关书籍
不知道多久以前在朋友圈看到转发分享:因为疫情,Johns Hopkins的Project Muse 限时免费,包括普林斯顿、康奈尔、乔治亚、哈佛、港中文、ACA、Early Theatre等40多家出版社基本都开放了自己的电子资料库,共有近24000本原版英文书,282本期刊。 链接是:https://about.muse.jhu.edu/resources/freeresourcescovid19/ Continue reading