转录组cufflinks套装的使用
cufflinks套装有很多,我们主要使用的只有三个
Cufflinks是用来处理tophat的输出的bam文件然后输出gtf文件
cuffmerge把多个样本的gtf文件合并的,也没啥子用,主要是测多个样本可能会需要
cuffdiff算出分组的bam文件里面的差异基因。
一:下载安装该软件
是二进制版本,找到网址,然后用wget下载,解压即可使用
转录组cufflinks套装的使用
cufflinks套装有很多,我们主要使用的只有三个
Cufflinks是用来处理tophat的输出的bam文件然后输出gtf文件
cuffmerge把多个样本的gtf文件合并的,也没啥子用,主要是测多个样本可能会需要
cuffdiff算出分组的bam文件里面的差异基因。
一:下载安装该软件
是二进制版本,找到网址,然后用wget下载,解压即可使用
转录组比对软件tophat的使用
为什么要用这个软件?:因为转录组reads比对到基因组reads用bwa和bowtie的效果都不够好,所以我们选择tophat
它做了什么?:tophat把测序的转录组的原始reads比对到了参考基因组上面,并且输出了bam(二进制的sam)文件比对结果给我们。(fastq--->bam)
一:下载安装该软件
其实一般的生信服务器自然会有高手给安装好了,你只需调用即可,这里我给大家演示一下如何安装。
wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.0.13.Linux_x86_64.tar.gz
仿写fastqc软件的部分功能(上)
前面我们介绍了fastqc这个软件的使用方法 http://www.bio-info-trainee.com/?p=95 ,这是一个java软件,但是有些人服务器没有配置好这个java环境,导致无法使用,这里我贴出几个perl代码,也能实现fastqc的部分功能
统一测试文件是illumina的phred33格式的fastq文件,共100000/4=25000条reads,读长都是101个碱基
程序名-fastq2quality.pl
使用命令:perl fastq2quality.pl SRR504517_1.fastq >quality.txt
功能: 把fastq格式的每条原始reads的第四行ascii码质量值,转换为Q值并输出一个矩阵,有多少条reads就有多少行,每条reads的碱基数就是列数。