针对高通量测序数据,包括WGS,WES
我这里主要讲根据bam文件里面的chrX和chrY的reas比例来判断性别,大家可以自己处理数据得到bam文件!
主要是读取bam文件,选择chrX上面的记录,统计genotype即可:
也可以统计测序深度,samtools depth $i |grep 'chr[XY]'
如果chrX和chrY的reads比例超过一定值,比如50倍,就判定为女性!
脚本很简单,就统计bam文件的第三列就可以啦,第三列就是染色体信息
samtools view $i | perl -alne '{$h{$F[2]}++}END{print "$_\t$h{$_}" foreach sort keys %h}' >$out.chromosome.stat
对于Sample3,
chrX 1233061
chrY 140506
对于Sample4,很明显,这个是女性!
chrX 2734815
chrY 51860
对于Sample5
chrX 1329302
chrY 156663