文章是 Immune recognition of somatic mutations leading to complete durable regression in metastatic breast cancer 发表于 Nature Medicine (2018) 重点在实验设计环节,但是现在的大文章或多或少都引入多组学数据,本文也不例外,实验纳入的唯一一个病人既做了全外显子又做了转录组测序,还有单细胞测序。不过数据公开的是 PRJNA342632 for exome data and PRJNA243084 for RNA-seq data Continue reading
Category Archives: 未分类
第26周-韩国人的乳腺癌队列
发表于2018年的NC,文章是:Multi-omics profiling of younger Asian breast cancers reveals distinctive molecular signatures 文章特色就是测了 187 primary tumors from a Korean BC cohort (SMC) 的转录组和外显子组数据。数据上传在:EGAS0000100262 和 GSE113184 . Continue reading
Best practice for mRNA microarray
Best practice for mRNA microarray
文章代码在:https://github.com/jmzeng1314/GEO
Note : Please don't use it if you are not the fan of our biotrainee, Thanks. Continue reading
生信人的20个R语言习题的答案
把rstudio的project或者package同步到自己的GitHub
首先在 rstudio里面新建project或者package,需要了解Rstudio Continue reading
生信人的20个R语言习题
2433个乳腺癌患者的173个基因的突变全景图
2433个乳腺癌患者的173个基因的突变全景图
发表于2016年的NC,The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes 可以说后续做乳腺癌人群队列突变研究的都需要引用这篇文章的数据结果,里面涉及到的分析要点也比较多,都是比较容易重现的。
第24周-类器官助力CRPC-NE的治疗
终于看到了一个完整的mutect2使用脚本
【直播】我的基因组89:看看那些不在gnomAD数据库出现的常见人群变异位点是什么
前面我们说到了对3784343个的SNP位点来说,3353921个因为人群频率大于了0.05会被过滤掉,还剩下430304值得我好好研究一下。 Continue reading
TCGA下载系列教程终章
TCGA的28篇教程往期目录如下:
使用R语言的cgdsr包获取TCGA数据 (cBioPortal)
TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
TCGA的28篇教程- 使用R语言的RTCGAToolbox包获取TCGA数据 (Broad Institute FireBrowse portal)
TCGA的28篇教程- 批量下载TCGA所有数据 ( UCSC的 XENA)
用了旧的CNV芯片还用旧的参考基因组
用了旧的CNV芯片还用旧的参考基因组
文章发表在 Breast Cancer Res. 2017; 19: 30.
Published online 2017 Mar 16. doi: 10.1186/s13058-017-0825-6
样本量并不少: case-control study of breast cancer diagnosed before age 40 years (200 cases, 293 controls) Continue reading
把TCGA的乳腺癌患者按照年龄分层来比较突变情况
看起来只是一个摘要,并没有相关文章出来: http://ascopubs.org/doi/abs/10.1200/jco.2015.33.15_suppl.579 Continue reading
这可能是我见过最简单的一篇SCI了
多批次WES数据该肿么办
批次很多时候无法避免,比如文章 Biomed Res Int. 2014 . doi: 10.1155/2014/319534 就提到:
In large WES studies, some samples are occasionally sequenced twice or even more times due to a variety of reasons, for example, insufficient coverage in the first experiment, sample duplication, and the rest. It is challenging how to best utilize these duplicated exomes for SNP discovery and genotype calling, especially with batch effects taken into consideration.
TPM格式搜索错了,好尴尬
网上的答案经常不靠谱
通常情况下我会使用 featureCounts 得到表达矩阵是 raw counts, 但总是有人需要我转换成各种形式,比如 RPKM, FPKM and TPM Continue reading
癌症细胞系药物敏感性数据库
会持续收集
broad的 CTRP Cancer Therapeutics Response Portal (CTRP) Continue reading
由germline结果发现新的癌症易感基因
文章是: Exome sequencing and case-control analyses identify RCC1 as a candidate breast cancer susceptibility gene, International Journal of Cancer, 2018.6, Int J Cancer. 2018 影响因子6.5
关键词: 全外显子测序,家系
一定要区分germline和somatic的,本文并没有做N-T配对测序,所以只能是germline突变分析。
多位点取样测序看肿瘤异质性的文章合辑
There are at least three types of intratumoral genetic heterogeneity Continue reading
GATK4的mutect2流程
逆向收费读文献社群
刻意练习,10万小时定律,相信大家都有所了解。
我们生信技能树平台最近开始做生物信息学入门培训,感触良多,虽然大家相比我入门摸索生信的姿势来说是幸运很多,但对真正的科研来说,仍然不够,科研不是简单的分析一套数据拿到变异位点,或者差异基因,进行注释即可,而是要完整的讲好一个故事。而一个生物学故事是由背景知识+前人工作总结+方法+自己的结果+展望组成,大量的已经完成的好的故事值得我们学习和借鉴。 Continue reading