查某个基因家族在某物种的具体信息
我很伤心,不知道是不是我写的教程还是不够人性化,一个朋友在群里面问如何知道NAC基因家族在拟南芥里面的105个基因信息,我随便给他示范了一下在人类里面如何找,希望他能触类旁通,结果他不会linux,啥生信基础都没有,我只会诱导他简单学习一下,希望他至少明白什么的taxid。所以我给了他我之前写的教程,只希望他告诉我拟南芥的taxid我就帮他把那105个基因找出来。
http://www.bio-info-trainee.com/?p=84
结果好半天都不回信息了,我还以为他自己解决了,我礼貌性的再问一次,才知道他没看懂我的教程,我实在不明白,那么通俗的教程为嘛还是不能亲民呢???
拟南芥的拉丁名是Arabidopsis thaliana,在NCBI的Taxonomy里面搜索可以看到
然后点击进去
就简单的两个步骤呀,就可以看到taxid的呀!!!
然后我只需要简单一个命令就可以解决题目的问题了!
grep -w NAC gene_info |perl -alne '{print if $F[0] == 3702}'
其中gene_info在NCBI的ftp里面可以下载!!我前面也提到过,是所以物种的基因信息
我只需要查找基因名字是NAC的,然后物种代码是3702的就是他拟南芥的呀!!!
正好105个基因,达到了他的要求!!!