基因组可以划分为基因区域和基因间区,其中基因区域有内含子,外显子,等等,基因间区有启动子,增强子。但是真正做完NGS测序,研究者往往会把基因组区域划分的更为细致,包括生物学功能划分。
我们这里简单介绍一下全基因组测序分区以及表观组学的分区例子,以后大家看文献的时候就需要多留意。 Continue reading
基因型的log2ratio测序深度散点图(CNV-seq 优于aCGH )
来自于2009发表在BMC Bioinformatics 的文章:CNV-seq, a new method to detect copy number variation using high-throughput sequencing ,这篇文章的重点是说明 CNV-seq 优于aCGH 在寻找拷贝数变异方面: Continue reading
基因名很奇怪就对了
最近参加我们生信爆款入门和数据挖掘课程的学员反复咨询一个基因ID问题,就是为什么得到的结果基因名字那么奇怪(全部以LINC开头),而且ID进行转换时候,经常是50%左右的成功率,如果你也有这个疑问,那么恭喜你,看完这个教程,你肯定就懂了! Continue reading
还说啥呢,继续免费啊
隔三差五在朋友圈看到有人感叹2020开局的艰难,同一个配图每个人说的话都不一样,比如今早起来看到的某位科研服务公司工程师应该是凌晨一点发的状态: Continue reading
购买入门级服务器免费送Linux直播培训服务
疫情期间,大家很难进入实验室做实验,这段时间总不能浪费掉,除了阅读文献,学习生物信息学数据处理是一个好的选择!
作为生物信息学知识分享领域的标杆,我们生信技能树有必要做一下表率,搞一个活动吧!凡是生信技能树,生信菜鸟团,单细胞天地的粉丝,均可以去购买入门级服务器,我们就会免费送Linux直播培训服务!(钉钉群直播互动教学,限额200人) Continue reading
烦请大家不要转发这样的辣鸡资源
看到我们辛辛苦苦组建群里的各个群聊,被这样的转发领取资源的辣鸡广告污染,真的是心痛! Continue reading
多个探针对应同一个基因到底该如何取舍
前些天我发现了乳腺癌领域的PAM50算法原理探索,在:PAM50的概念及分子分型算法原理 ,其实并不难,然后我注意到他们在挑选50个基因的时候,提到了多个探针对应同一个基因到底该如何取舍。 Continue reading
对miRNA进行go和kegg等功能数据库数据库注释
如果大家对go和kegg等功能数据库注释有一定了解,就应该是知道kegg里面其实就记录各个物种不到一半的蛋白编码基因功能,比如人类, 约2万个蛋白编码基因,也就七千多个是有kegg功能注释的。其它物种就更是惨不忍睹,没有那么多科研经费投入进去,实际上对它们的基因功能就无从得知! Continue reading
底裤价转录组产品线(还送数据分析培训)
for NGS, we only do RNAseq forever
最近,我们生信技能树五年前的直播编程活动的一个优秀学员找到了我,希望可以合作, 他依托这些年在各大科研服务公司工作经历,开始创业了。创立的公司名字是钱塘生科,提出的口号是:让监督及曝光成为信任的基础,让第三方质量检测成为实实在在的行业准则。 Continue reading
单细胞转录组数据分析并不一定要过于个性化
我在 有一种生意双方都觉得亏 提到过,专业的工程师觉得为客户学习一个R包收费2000合情合理,但是委托者觉得一个项目全套分析收2000才合理。也就是说大部分情况下,大家自己的课题的个性化需求,是很难找到合适的合作者来代替你完成的,不得不学习多种多样的R包算法,而且通常是找不到交流者。 Continue reading
从基因名到GO注释一步到位
大部分的生物学高通量数据处理后都是得到基因集,不管是上调下调表达基因集,还是共表达的模块基因集,都是需要注释到生物学功能数据库来看基因集的意义,最常见的是GO/KEGG数据库啦,还有很多其它在MsigDB的,比如reactome和biocarta数据库等等。 Continue reading
3种缺失值情况需要区别对待
有过数据处理经验的你们,一定是吃过缺失值的苦头,比如相关性分析,PCA分析,Mfuzz分析,甚至绘制热图啥的,一个缺失值都让你的分析全面崩盘!如果你的表达矩阵里面的基因数量超级过部分基因缺失问题,可以把整个基因都删除,但是如果基因缺失比例很大,这个时候强行删除就会带来偏差啦! Continue reading
TCGA数据库免疫相关文件下载大全
本文首发于生信技能树公众号,直达链接是:https://mp.weixin.qq.com/s/-amtbxvk0mC2Nv-bwt1BeQ
2018年4月Immunity杂志上发表了文章The Immune Landscape of Cancer ,由34个单位共同合作完成。文章对TCGA中33种癌症,超过10,000个肿瘤样本进行了免疫原性分析,将所有肿瘤分成6种免疫亚型,即: Continue reading
鉴定新的lncRNA之上游流程
好奇怪哦,我们前面的 lncRNA-seq数据分析之新lncRNA鉴定和注释视频课程众筹 ,感兴趣的人似乎不多额,免费的啊,既然感兴趣人不多,这个视频课程就取消免费了哈!那个群大家仍然是可以进入,拿资料和代码,视频我就不录制了,感兴趣的人不多,我搞自媒体图的就是一个名声,没有人看,我浪费时间干嘛! Continue reading
GitHub居然也会被劫持,OMICtools也会停摆
多事之秋啊!
GitHub被劫持
最近发现GitHub的一些pdf资料在网页浏览器无法打开,没有多想,以为是正常的墙。看到单细胞天地微信群聊有人提到了Github pages可能遭遇中间人攻击。中国 IP 访问会显示一个无效的证书,域名所有者使用了一个腾讯的邮箱“346608453@qq.com”,Github 显然不可能会用腾讯邮箱。使用境外 IP 访问则返回了 DigiCert 签发的有效证书,使用的名字都是 GitHub。目前不清楚中间人攻击范围有多大。 Continue reading
GEO数据库中国区镜像奔走相告啊
最近还是大量粉丝留言表示自己因为疫情困在家里,想做数据挖掘混个本科毕业论文,但是看完我的GEO数据挖掘视频后,想下载个数据集,就被卡死了,实在是巧妇难为无米之炊!
这个不怪大家,我给大家的GEO数据挖掘视频其实录制很早了,那个时候还没有写:GEO数据库中国区镜像 Continue reading
EMBL-EBI生物信息学培训界领头羊
早在3年前我就分享过:EMBL-EBI 持续十年提供免费的生物信息学培训,实际上当时仅仅是浏览了前面几个,错误的抽样调查得到错误的结论,并不是全部免费,他们机构提供一系列收费培训。包括小众的蛋白质组学和代谢组学。 Continue reading
有一种生意双方都觉得亏
生意这样的商业活动,理论上可以激励创造,让参与交易的双方都受益,才有可能持续。比如你不可能花费半年时间去系统性学习R语言和Linux操作,处理fastq的单细胞测序数据,做统计可视化图表,就为了一辈子的一个项目。所以理论上你的最优解决方案是委托专业的生信工程师,比如我们就在单细胞天地发布过:[单细胞转录组下游分析这样报价合理吗?] Continue reading
学徒作业-指定基因在指定组织里面的表达量热图
昨天我在生信技能树发布了一个学徒作业:在CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵 , 真的是非常简单,只需要下载CCLE数据库的RNA-seq表达矩阵,然后在R里面根据指定基因在指定细胞系里面提取表达矩阵即可。所以今天就有学徒完成了,作业发在生信菜鸟团,见:[学徒带你一步步从CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵进行热图可视化] Continue reading
学徒作业-在CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵
本文首发于生信技能树公众号,直达链接是:https://mp.weixin.qq.com/s/wY79Lkb0mzYNtZj2R2vLLQ
看到发表在 Cell. 2020 Mar 4. 的文章的研究项目里面有 4个10X样本,题目是:Complement Signals Determine Opposite Effects of B Cells in Chemotherapy-Induced Immunity. (PMID:32142650,DOI:10.1016/j.cell.2020.02.015) ,我没有细看,注意到附件有一个图表很有趣: Continue reading