举报文档 收藏
/31
帮帮创意 > 其他文档 > 【2017年整理】paml 中文说明.doc

【2017年整理】paml 中文说明.doc

【2017年整理】paml 中文说明.doc
内容要点:
例子。当假定替代速率在不同位点之间不同时,那么控制文件中的变量Malpha将会指定所有的位点使用同一个gamma分布(Malpha=0)还是不同的基因(或不同密码子位点)使用不同的gamma分布。不同基因的不同的c s值表示由不同基因估计的不同分支长度是成比例的。参数π表示核苷酸频率的平衡,这种平衡用观察到的频率得来(nhomo=0) 。在HKY85模型中的转换-颠换比κ可以用TN93或者REV 个密码子位点)(Yang 1996a; pages 116-8 in Yang 2006)。这些模型也被成为位点模型,当数据文件中选项G没有使用,请将这个变量设置为 0。以上的描述主要是适用于多基因,但是对于任何一个特定的位点都是适用的,例如密码子位点等等。在codeml程序中也使用相似的模型分析密码子和氨基酸序列。表1中概述了各种模型的意义。最简单的模型是基于这样一个假设:所有不同基因都可以表树开始;如果runmode=1将从树结构文件中读取多叉树,并估算一个最合适的双叉树;runmode=3则表示累计加和(stepwise addition);runmode =4表示初始树用简约算法NNI扰动;runmode =5表示初始树来自树结构文件的NNI扰动。树查找操作并不完善,所以尽可能的设置runmode=0。对于相对较少的数据,累计加和算法似乎是没用的。model 这个变量规定了核苷图21. 一个典型的baseml.ctl文件seqfile、outfile和treefile 这三个变量分别定义了序列数据文件、结果文件和树结构文件的文件名。在文件名中千万不要出现空格,另外文件名中请不要出现一些特殊字符,因为他们可能对于OS有特殊的意义。noisy 这个变量控制输出到屏幕上的内容。如果拟合一个模型需要大量的计算,你可以选择一个较大的noisy值,这样可以避免过多的行。另外一个变量图20. baseml程序中可用的碱基替代模型4.2 控制文件对于baseml程序,系统默认的控制文件是baseml.ctl,一个典型baseml的控制文件如下所示(图21)。请注意,1)在等号的左侧和右侧都必须有一个空格;2)空行以及以“*”起始的行都会被软件识别为注释文件;3)有些用不到的选项,可以从控制文件中删除;4)变量的顺序不重要。图中控制变量的意义将在下面予以详细解释。阵如下(图20):4、baseml 程序4.1 核苷酸替代模型(Nucleotide substitution models)详细的马尔可夫核苷酸替代模型可以参考以下的文献:Whelan et al. (2001), Felsenstein (2004) or Yang (2006: Chapter 1)。在PAML中使用的模型包括JC69 模型(Jukes and Cantor 1969)、K80模型(Kimu图18.树的节点用自然数依次表示,其中1,2,3,……,s表示数据中s 个已知的序列,数值顺序于数据中序列顺序相同。如果树的数值大于s,则表示居间序列,居间序列的序列未知。所以在图18的树中,节点5是节点6、3、4的祖先序列,节点6是节点1、2的祖先序列。这种符号对于描述一个特定的树上序列之间的进化关系是十分方便的。例如,下面的树中(图19),序列5是序列1、2、3、4的共同祖先序列:图19警告:图15.我发现这样的做法是比较方便的:首先用标记来创建一个树文件,然后用Rod page’s TreeView检查树以及标记是否正确。上面的这些树的实例对于TreeView都是可读的。但是对于 TreeView X,你必须把标记放到单引号里面,如下所示(图16)。图16.这样,树文件既可以被TreeView 读取,也可以被TreeView X读取(同时也可以被baseml/codeml读取)。注

发表评论

暂无评论,赶快抢占沙发吧。

lo****1

在线客服