前面我们的教程讲到了,自己取全部的上皮细胞,以及部分Fibroblasts和Endothelial_cells细胞来一起运行inferCNV流程,但是得到的结果很诡异,明明是作为二倍体正常细胞参考集的Fibroblasts和Endothelial_cells细胞居然也是在某些染色体上面有明显的CNV情况。为了解决这个问题,让我们一起看看文献自己的inferCNV流程是如何使用的,以及对应的数据集。
Category Archives: 未分类
甲基化基础补充
写在前面
最近我在《生信技能树》安排了两个甲基化相关的学徒作业:
有学徒表示虽然看了我在B站免费分享的视频课程《甲基化芯片(450K或者850K)数据处理 》,详见:免费视频课程《甲基化芯片数据分析》,但是课程过于强调实操,很多背景知识大家比较缺乏,所以学徒自告奋勇补充了一些甲基化基础知识,供大家学习!
加州大学圣地亚哥分校的7门生物信息学公开课(让你一次性学个够)
看到VIP群里大家在讨论是否有必要参加coursera的生物信息学课程, 然后我简单搜索了一下,发现加州大学圣地亚哥分校居然有7门生物信息学公开课,列表如下:
几百年来全世界就一个人用了它
前面我们在《生信技能树》平台举办了各种ID转换相关的公开课,而且有几十个教程详细介绍了我们的一个综合性的包:
机器学习加深度学习资料大放送(附上资料群)
关于机器学习,在肿瘤数据库挖掘里面,主要是生存模型构建最广泛。比如我在B站免费共享TCGA肿瘤数据库知识图谱视频教程中共使用了四种算法构建模型(都是R语言实现):
Continue reading
基于R语言的统计可视化视频课双十一大促销(打包价仅需11元)
华盛顿大学8天的生物信息学培训
我们前面介绍了中国大学mooc的一些生物信息学相关课程,给大家做基础知识补充:
- 生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 ,
- 生信菜鸟团分享了:中国大学MOOC的生物信息学之华中农业大学
以及最热门的:中国大学MOOC的生物信息学之山东大学 (第7次开课,时间: 2020年09月14日 ~ 2021年01月31日)
很多时候你就是不知道如何提问
最近分享的两个祖传的单细胞转录组数据分析代码,是标准流程:
关于搜索,你不知道的是
我们很多交流群,太多的朋友都喜欢重复提问,而且并不是那么友好的先搜索后提问。哪怕是我单独指出来一下,抨击一下这个现象,确实也无济于事。
但,努力还是得努力的,日拱一卒嘛,先影响那些能看到此推文的三五千人。
Continue reading
狗也有乳腺癌(居然也有人研究)
我们都知道狗的英文单词是dog,最近看了个2019年8月文章:Whole-exome and whole-transcriptome sequencing of canine mammary gland tumors ,是多组学哦,关键是标题里面有一个陌生的单词 canine,我还在奇怪canine mammary gland tumors难道说是一种新的乳腺癌吗?等我细看文章,出现:dog genome, as provided in CanFam3.1这些让我很熟悉的名词,所以去查单词才发现是 犬乳腺癌,居然还有人研究这东西!
Continue reading
共享云服务器又来了(这次足足有50个名额)
前面和公司合作,推送了8折促销的《共享云服务器》已经是非常实惠了,解决了广大生信粉丝的切实需求,产品列表:
- 学习型(共享24核64G内存)-海外,8折抢购价 400元
- 进阶型(共享36核128G内存)-国内,8折抢购价 960元
- 进阶型(共享36核128G内存)-海外,8折抢购价 1152元
- 专业型(共享48核256G内存)-国内,8折抢购价 1920元
- 专业型共享48核256G内存)-海外,8折抢购价 2400元
Continue reading
根据CNV信号对细胞系分组后看表达量差异(这就是多组学)
后台有一些粉丝留言好奇怪,说怎么没看到我们分享多组学教程,我们会不会多组学联合分析啊!可能是因为看到我在B站的免费NGS数据处理视频课程合辑,都是单一组学数据吧!
根据CellMarker网站进行人工校验免疫细胞亚群(CNS图表复现06)
我们的CNS图表复现之旅已经开始,前面3讲是;
根据CCDS数据库信息拿到全部外显子坐标
CCDS数据库团队居然在2018年又又又发表文章了,题目是:《Consensus coding sequence (CCDS) database: a standardized set of human and mouse protein-coding regions supported by expert curation》,链接在:https://academic.oup.com/nar/article/46/D1/D221/4595661
根据坐标在基因组上面拿到碱基序列来设计引物
做DNA测序的朋友们一般来说,都会拿到突变位点信息,不管是SNV还是INDEL,都是一个基因组上面的坐标而已。而高通量测序的结果通常是需要做一下实验验证,最常见的就是sanger测序啦,需要设计引物来捕获一下突变位点附近的序列信息,查看是否该位点真的具有突变信息。一般来说,sanger测序能验证过的高通量测序的结果就不会受到审稿人的质疑啦!
《简单高效LaTeX》读后感/读书笔记
前些天,合作了两年多的图灵出版社的编辑邢璐兴冲冲地找到了我,说将会上新一本书:《简单高效LaTeX》,估摸着我肯定会喜欢。可能是因为看到我们生信技能树公众号的排版非常优美,觉得我肯定是同道中人。但是实际上我的排版水平仅限于简单的markdown语法,LaTeX我一直望而生畏。但是我的好友列表躺着一位LaTeX高手,他博士毕业后从教《生物信息学》近10年,课件讲义都有LaTeX的身影,所以我马上想到了他,帅气的小伊老师,见:
Continue reading
非常羡慕你,有人帮助
收到粉丝邮件求助:
健明老师,你好!我最近在阿里云服务器中安装Rstudio server的时候,按照生信技能树微信公众号中的“在Ubuntu下安装单细胞3大R包”文章步骤来,但是在验证Rstudio server是否安装成功时,总是显示没有激活(图1);重启的时候,显示没有libssl.so.1.0.0(图2)。我也查了许多资料,按照他们给的方法,但是并没有解决,困扰许多天了。我是临床医学专业的,学习生信没有多长时间,烦请健明能够解惑,谢谢!!!
Continue reading
二十年前做科研你只需要检测一些基因在一些癌症细胞系表达量情况即可
看到一个比较古老的生物学领域的研究文献,文章标题是:《Analysis of CUL-5 expression in breast epithelial cells, breast cancer cell lines, normal tissues and tumor tissues》,于2003年发表在 Molecular Cancer 杂志,如题,研究者就分别在乳腺癌和正常乳腺的细胞系里面测定了几个基因的表达量情况。
多分组的甲基化差异分析之QDMR
前面我们的学徒作业:学徒任务-探索DNA甲基化的组织特异性,大家完成的不多,可能是甲基化芯片数据处理对大家来说不紧急也不必须吧。不过最近刷文献看到了,另外一个策略,可以做多分组的甲基化差异分析,而不是一对多的差异分析策略。
Continue reading
读入csv文件的表达矩阵成为Seurat对象(CNS图表复现01)
上个月我们组建了:《单细胞CNS图表复现交流群》,见:你要的rmarkdown文献图表复现全套代码来了(单细胞),也分享了单细胞转录组数据分析的流程: