13

sam和bam格式文件的shell小练习

首先使用bowtie2软件自带的测试数据生成sam/bam文件,代码如下:

mkdir -p ~/biosoft
cd ~/biosoft
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zip 
unzip bowtie2-2.3.4.3-linux-x86_64.zip 
cd ~/biosoft/bowtie2-2.3.4.3-linux-x86_64/example/reads
../../bowtie2 -x ../index/lambda_virus -1 reads_1.fq -2 reads_2.fq > tmp.sam
# samtools view -bS tmp.sam >tmp.bam

Continue reading

30

第41周文献分享-肝癌复发的CpG甲基化信号特征

发表于2017年,杂志是 JOURNAL OF CLINICAL ONCOLOGY 影响因子26.303 , 文章是 CpG Methylation Signature Predicts Recurrence in Early-Stage Hepatocellular Carcinoma: Results From a Multicenter Study 亮点应该是自己的数据,然后使用了两个机器学习算法

  • LASSO, Least Absolute Shrinkage and Selector Operation;
  • SVM-RFE, Support Vector Machine-Recursive Feature Elimination;
    前面我们讲解了一篇2013年多组学数据探索乳腺癌细胞系药物敏感性使用的也是两个机器学习算法,不过是LS-SVM和RF,但是也有借鉴意义。

    Continue reading

30

第39周文献分享-探索BRCA1基因全部可能的突变的功能

2018年9月朋友圈刷屏的nature文章,题目是:Accurate classification of BRCA1 variants with saturation genome editing 字面意思是探索了BRCA1基因上面的全部可能的突变位点的生物学意义,但事实上只是探索了96.5% of all possible single-nucleotide variants (SNVs) in 13 exons that encode functionally critical domains of BRCA1.

Continue reading

12

第36周-时间序列表达矩阵揭示肿瘤转移的动态过程

时间序列表达矩阵揭示肿瘤转移的动态过程

肝癌很可怕,尤其是转移后,很多关于其转移前后对比的研究,但是缺乏中间过程数据,特别是转移临界点
作者通过肝癌模型,在不同时间点取样做芯片转录组,试图分析 non-metastatic (or normal) and pre-metastatic (or critical) 这两种状态区别。顺利找到了临界点及其相关调控网络,而且还重点分析了其中一个网络的最重要的节点基因:CALML3
To discover early warning signals of pulmonary metastasis in HCC, we analysed time-series gene expression data in the spontaneous pulmonary metastasis mouse HCCLM3-RFP model with our novel dynamic network biomarker (DNB) method.
构建了 xenograft HCCLM3-RFP mice , 20只小鼠分成4组,即4个时间点(W2, W3, W4, W5)取样。

Continue reading

09

第30周-乳腺癌病人的原位癌多点采样测序看异质性

乳腺癌病人的原位癌多点采样测序看异质性

于2015年发表在 Nature Medicine杂志,标题是:Subclonal diversification of primary breast cancer revealed by multiregion sequencing 来自于:Cancer Genome Project, Wellcome Trust Sanger Institute, Hinxton, UK.
对50个患者取了303个样进行测序,其中13个是WGS,剩余的290个取样只是特定基因的捕获测序。偏偏是没有WES的数据。

Continue reading

30

第29周-FGFR3-TACC3基因融合机制探究

FGFR3-TACC3基因融合机制探究

文章发表于2018年1月,在大名鼎鼎的nature杂志上面,题目是;A metabolic function of FGFR3-TACC3gene fusions in cancer, 美国哥伦比亚大学医学中心(CUMC)的研究人员发现两个相邻基因的融合能够导致线粒体过度运转和增加细胞疯狂生长所需的燃料数量,从而导致癌症产生。他们也发现在人癌细胞和一种脑癌类型的小鼠模型中,靶向这个新鉴定出的癌症通路的药物能够阻止肿瘤生长。
全文的重点应该是实验探索及验证FGFR3-TACC3基因融合机制。

Continue reading

13

第27周-过继性T细胞治疗(adoptive T-cell therapy,ACT)

文章是 Immune recognition of somatic mutations leading to complete durable regression in metastatic breast cancer 发表于 Nature Medicine (2018) 重点在实验设计环节,但是现在的大文章或多或少都引入多组学数据,本文也不例外,实验纳入的唯一一个病人既做了全外显子又做了转录组测序,还有单细胞测序。不过数据公开的是 PRJNA342632 for exome data and PRJNA243084 for RNA-seq data Continue reading