17

读书笔记-核酸&蛋白序列分析

核酸序列分析:
一.DNA基本序列分析:bioedit、DNAman、DNAstar
a)    组成成分分析
b)    序列转换分析
c)    酶切位点分析(REBSASE,NEBCutter2)
二.DNA序列特征分析
a)    开放阅读框分析
b)    启动子和转录因子结合位点(数据库EPD,TRANSFAC,DBTSS,TRRD)(软件Promoter Scan,TfBlast,TESS)
c)    CpG岛识别(在线工具:EMBOSS,CpG Island searcher,CpG cluster)
三.重复序列分析
a)    常用数据库(RepBase,RepeatMasker,LINE-1,STR)
四.基因识别,
a)    同源序列比对
b)    组成统计学特征预测(UTR,EXON,INTRON,)
c)    GENESCAN,GRAIL,geneMarkS,Glimmer
五.mRNA可变剪切分析
a)    常用数据库(ASTD,ASD,ASAP)
b)    在线工具(ASPicDB,ESEfinder,RESCUE-ESE)
六.miRNA与靶基因预测
a)    预测方法(同源片段搜索,比较基因组学预测,序列结构特征打分,靶标预测,机器学习)
b)    数据库资源(miRNA,miRBase,TarBase,miRGen,MIRSCAN,MiPred,miRFinder,miRanda,Targetscan,PicTar)

蛋白序列分析
一.蛋白基本序列分析
a)    氨基酸组成(ExPASy)
b)    电荷性质,疏水性(ProtScale)
c)    理化性质(ProtParam)
二.序列特征信息
a)    跨膜区预测(TMpred)
b)    信号肽分析(signalP)
c)    卷曲螺旋分析(COILS)
三.功能信息分析
a)    PROSITE蛋白质功能数据库
b)    结构域和功能位点分析InterProScan
c)    基于蛋白同源性的功能分析(blastp等)
四.蛋白质结构分析
a)    二级结构预测-(Chou-Fasman,GOR,PHD,NNSSP以及多元预测方法)
b)    三级结构预测-(同源建模。重头预测)