首先使用bowtie2软件自带的测试数据生成sam/bam文件,还有vcf文件
Category Archives: 未分类
sam和bam格式文件的shell小练习
首先使用bowtie2软件自带的测试数据生成sam/bam文件,代码如下:
mkdir -p ~/biosoft
cd ~/biosoft
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zip
unzip bowtie2-2.3.4.3-linux-x86_64.zip
cd ~/biosoft/bowtie2-2.3.4.3-linux-x86_64/example/reads
../../bowtie2 -x ../index/lambda_virus -1 reads_1.fq -2 reads_2.fq > tmp.sam
# samtools view -bS tmp.sam >tmp.bam
Continue reading
fasta和fastq格式文件的shell小练习
这个是有机结合生物信息学的linux和数据格式的练习题:
下载bowtie2软件后拿到示例数据:
linux基础命令12讲视频学习心得
第42周-小细胞肺癌组学特性与化疗抵抗相关性
与2018发表在NC上面,文章是:Recurrent WNT pathway alterations are frequent in relapsed small cell lung cancer 同样是发NC,相比上次分享的韩国人的乳腺癌队列,还有之前的台湾人队列来说,本研究成本要低很多。
第41周文献分享-肝癌复发的CpG甲基化信号特征
发表于2017年,杂志是 JOURNAL OF CLINICAL ONCOLOGY 影响因子26.303 , 文章是 CpG Methylation Signature Predicts Recurrence in Early-Stage Hepatocellular Carcinoma: Results From a Multicenter Study 亮点应该是自己的数据,然后使用了两个机器学习算法:
- LASSO, Least Absolute Shrinkage and Selector Operation;
- SVM-RFE, Support Vector Machine-Recursive Feature Elimination;
前面我们讲解了一篇2013年多组学数据探索乳腺癌细胞系药物敏感性使用的也是两个机器学习算法,不过是LS-SVM和RF,但是也有借鉴意义。Continue reading
第40周文献分享-多组学数据探索乳腺癌细胞系药物敏感性
也是公共数据的挖掘,但是不是对TCGA数据库的挖掘,不过其整合的多组学又恰好是TCGA计划纳入的7种数据。
第39周文献分享-探索BRCA1基因全部可能的突变的功能
2018年9月朋友圈刷屏的nature文章,题目是:Accurate classification of BRCA1 variants with saturation genome editing 字面意思是探索了BRCA1基因上面的全部可能的突变位点的生物学意义,但事实上只是探索了96.5% of all possible single-nucleotide variants (SNVs) in 13 exons that encode functionally critical domains of BRCA1.
卵巢癌类器官研究
这应该是卵巢癌领域的第一个类器官研究,发表于 September 13, 2018,题目是:Prediction of DNA Repair Inhibitor Response in Short Term Patient-Derived Ovarian Cancer Organoids
查看几个KEGG的通路的overlap情况
发现自己的基因集使用KEGG数据库进行分析的时候,很多免疫相关通路被富集,所以怀疑是不是这些免疫通路互相交叉很多,就试着探索一下,是一个蛮好的练习题:
第37周-药物反应可以由基因组特性预测
2015发在BMC Cancer的文章:Anticancer drug sensitivity prediction in cell lines from baseline gene expression through recursive feature selection
主要就是整合了 Cancer Cell Line Encyclopedia (CCLE) 和 Cancer Genome Project (CGP) 这两个数据库,使用 支持向量机来预测药物反应。
第36周-时间序列表达矩阵揭示肿瘤转移的动态过程
时间序列表达矩阵揭示肿瘤转移的动态过程
肝癌很可怕,尤其是转移后,很多关于其转移前后对比的研究,但是缺乏中间过程数据,特别是转移临界点。
作者通过肝癌模型,在不同时间点取样做芯片转录组,试图分析 non-metastatic (or normal) and pre-metastatic (or critical) 这两种状态区别。顺利找到了临界点及其相关调控网络,而且还重点分析了其中一个网络的最重要的节点基因:CALML3
To discover early warning signals of pulmonary metastasis in HCC, we analysed time-series gene expression data in the spontaneous pulmonary metastasis mouse HCCLM3-RFP model with our novel dynamic network biomarker (DNB) method.
构建了 xenograft HCCLM3-RFP mice , 20只小鼠分成4组,即4个时间点(W2, W3, W4, W5)取样。
pan-cancer系列之肿瘤纯度
发表于: 2015 Dec 4. doi: 10.1038/ncomms9971
众所周知,肿瘤样品纯度是很有限的,包括围绕在肿瘤细胞周围的各种免疫细胞,还有肿瘤微环境其它细胞。
作者团队在这里对TCGA计划的21种癌症的超过10000个样本系统性的分析了肿瘤纯度
SIRT6敲除的食蟹猴模型
物种:cynomolgus monkey (Macaca fascicularis)
新闻都很劲爆,比如:
- 祝贺!中国团队成果登Nature,颠覆“长寿基因”认知
- Nature:中国科学家颠覆“长寿基因”认知
- NATURE重大突破:世界首例长寿基因编辑猴模型在中科院诞生
- Continue reading
第33周-sirt6和sirt1调控昼夜节律
本次解读的文章是:Partitioning circadian transcription by SIRT6 leads to segregated control of cellular metabolism. Cell 2014 PMID: 25083875
全文基于设计完善的基因表达芯片实验数据展开。
第32周-食道腺癌的类器官
文章亮点
文章 Published: 30 July 2018 :Organoid cultures recapitulate esophageal adenocarcinoma heterogeneity providing a model for clonality studies and precision therapeutics
作者成功培养了EAC(食道癌的一种)的organoid ,证明了organoid可以保留肿瘤患者的原位癌 Continue reading
第31周-乳腺癌病人的转移瘤多点采样测序看异质性
于2017年发表在 Nature Communications 杂志,标题是:Phylogenetic analysis of metastatic progression in breast cancer using somatic mutations and copy number aberrations ,主要完成单位来自于比利时:
第30周-乳腺癌病人的原位癌多点采样测序看异质性
乳腺癌病人的原位癌多点采样测序看异质性
于2015年发表在 Nature Medicine杂志,标题是:Subclonal diversification of primary breast cancer revealed by multiregion sequencing 来自于:Cancer Genome Project, Wellcome Trust Sanger Institute, Hinxton, UK.
对50个患者取了303个样进行测序,其中13个是WGS,剩余的290个取样只是特定基因的捕获测序。偏偏是没有WES的数据。
第29周-FGFR3-TACC3基因融合机制探究
FGFR3-TACC3基因融合机制探究
文章发表于2018年1月,在大名鼎鼎的nature杂志上面,题目是;A metabolic function of FGFR3-TACC3gene fusions in cancer, 美国哥伦比亚大学医学中心(CUMC)的研究人员发现两个相邻基因的融合能够导致线粒体过度运转和增加细胞疯狂生长所需的燃料数量,从而导致癌症产生。他们也发现在人癌细胞和一种脑癌类型的小鼠模型中,靶向这个新鉴定出的癌症通路的药物能够阻止肿瘤生长。
全文的重点应该是实验探索及验证FGFR3-TACC3基因融合机制。
第28周-单细胞转录组探索乳腺癌来源的内皮细胞
发表于:Oncotarget. 2018; 文章是:Single-cell RNA sequencing reveals gene expression signatures of breast cancer-associated endothelial cells 作者使用scRNA-seq手段量化了人类乳腺癌来源的内皮细胞与正常的内皮细胞的表达量,找差异基因并且使用GSEA方法注释。