这个月初,我推出3个R包,
- 第一个是整合全部的bioconductor里面的芯片探针注释包。
- 第二个是整合全部GPL的soft文件里面的芯片探针注释包。
- 第三个是下载全部的GPL的soft文件里面的探针碱基序列比对后注释包。 Continue reading
这个月初,我推出3个R包,
接收到太多的粉丝求助,想下载个表达矩阵做一下数据挖掘偏偏第一步就卡住了,数据文件下载半天毫无动静,或者下载到99%就卡死了。如果我恰好在电脑旁,通常会帮忙下载后微云或者百度云传递给粉丝,但这毕竟不是长久之计,经过个把月的不懈努力,我终于把全部的GEO数据库里面的表达芯片数据都下载并且全部格式化处理成为r数据文件,并且购置一个2万块钱的腾讯云服务器来存放它们,供广大粉丝使用! Continue reading
featureCounts我们粉丝都耳熟能详了,我们转录组流程介绍的对比对后的bam文件基于基因注释文件定量的首选软件,用法非常简单,关键是速度飞快,吊打htseq-counts几条街,而用DEXSeq分析可变剪切,外显子差异表达呢,我们以前也分享过用法,那个时候是使用示例的表达矩阵。 Continue reading
一直听说Functional Annotation Tool DAVID Bioinformatics Resources 6.8, NIAID/NIH 是可以做GO/KEGG数据库注释的,只需要用户上传自己拿的的基因集就可以,大大的方便了生物学家对数据库的使用。 Continue reading
虽然我一直讲解的GEO数据挖掘,都是基于mRNA这样的表达芯片,但实际上miRNA,lncRNA,甚至circRNA芯片也是大同小异的分析流程。 Continue reading
前面我们已经介绍过circRNA的基础概念: 首先了解一下circRNA背景知识,背景知识,以及 circRNA芯片分析的一般流程,但是跟mRNA一样,不仅仅是芯片可以检测,也是可以使用NGS技术,就是circRNA-seq咯。 Continue reading
也许是一种缘分吧,现在我的视频教程里面,居然是表观调控相关内容最多,本来就有ChIP-seq数据处理和ATAC了,而且前两天还给大家发了表观调控整合教学视频: Continue reading
前面我们已经介绍过circRNA的基础概念: 首先了解一下circRNA背景知识,背景知识,以及 circRNA芯片分析的一般流程,还有circRNA-seq分析的一般流程。看起来好像是把circRNA都介绍完了 ,不过在ceRNA芯片里面,其实也有一部分circRNA。其实ceRNA(competing endogenous RNAs,竞争性内源RNA) 是一种假说,是指一种全新的基因表达调控模式,我们已知miRNA可以通过结合mRNA导致基因沉默,而ceRNA(lncRNA、circRNA…)可以通过竞争性结合miRNA来调节基因表达,从而影响细胞的功能。 Continue reading
最近在整理各个癌症的单细胞转录组数据,发现 Cell. 2018 Aug 23,题目是:Single-Cell Map of Diverse Immune Phenotypes in the Breast Tumor Microenvironment,文章的数据量本身就很大: Continue reading
每次开展R语言线下学习班,都需要重新发几次:Windows电脑使用Rstudio会有多少错误呢 ,虽然大部分同学都是可以根据我们的教程顺利解决问题,但是不幸的人各有各的不幸。一般来说就是Windows电脑的中文用户名需要修改电脑系统的环境变量,R包下载等等。 Continue reading
虽然说我的大部分教程是针对人类或者小鼠的数据分析,实际上这些分析很容易迁移到其它物种,可能比较麻烦的就是最上游的关于参考基因组和注释文件信息的选择吧,这里讲一下猫猫狗狗的数据分析吧! Continue reading
看到朋友圈很多人转发一篇研究,至少4个公众号跟踪报导分享了,我也简单阅读了一下,说说自己的感受哈!
外显子技术是仅次于转录组的热门 NGS 应用,尤其是在肿瘤研究方向,大量的癌症多组学队列其实就是转录组加上外显子而已。实际上并没有专门的肿瘤转录组教程系列,但是肿瘤外显子却不然,如果大家三年前追过我的直播基因组活动,就应该知道同样是DNA层面的测序,全基因组,外显子组还有捕获基因靶向测序,在肿瘤研究里面不仅仅是找跟参考基因组不一样的位点,就是所谓的变异位点而已。 Continue reading
2019年2月,在中山市第十五届人民代表大会第六次会议上,“积极筹建中山科技大学”的内容被写进了政府工作报告。同年12月19日,中山科技大学筹建办揭牌成立。
投入百亿,2025年建成新型研究型大学 Continue reading
使用下面的代码模拟数据 Continue reading
这周六,应多年好友罗鹏之邀来到《第四届南方肿瘤精准治疗论坛》做了一个分享,因为早早被告知听众都是临床医师,所以我特意把分享的形式通俗化,并不需要具备生物信息学基础知识也可以获得一些认知。 Continue reading
前些天我们在你都不感谢我凭什么要求我帮你宣传:有奖征集了发文章的规范化致谢格式!
考虑到投稿参与评选的人不多,而且时间也到了,我们直接就公布一等奖吧,由生信技能树VIP交流群-会咋眼的鱼获得,奖金2000元! Continue reading
我们说到过,安装R包基本上是缺啥就安装啥即可,但是总有一些让你头疼的,比如我们介绍过在Ubuntu安装单细胞的3大R包,就非常精彩,视频在:https://www.bilibili.com/video/av63988858 Continue reading
gene symbol 是非常官方的,由HUGO 组织负责维护,有专门的数据库HGNC database of human gene names | HUGO
以前分析数据的时候,有一些基因的symbol很奇怪,让我百思不得其解,比如: Continue reading
有一个数据框,第一列是探针ID,第二列是探针的碱基序列,第三列是芯片平台,模拟数据代码如下: Continue reading