reciprocal_smallest_distance

软件截图:
reciprocal_smallest_distance
软件详细信息:
版本: 1.1.5
上传日期: 20 Feb 15
许可: 免费
人气: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance是使用全局序列比对和序列之间的最大似然进化距离准确地检测基因组之间的同源基因成对直向算法。
安装从压缩包
下载并解压最新版本github上:
CD〜
卷曲-L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz |焦油xvz
安装reciprocal_smallest_distance,确保使用Python 2.7:
CD reciprocal_smallest_distance-VERSION
蟒蛇setup.py安装
使用RSD查找Othologs
下面的例子演示的命令运行rsd_search的主要方式。 rsd_search每次调用需要指定一个FASTA格式的序列文件的位置为两个基因组,称​​为查询和受试者的基因组。他们的顺序是任意的,但如果你使用--ids选项,IDS必须来自查询的基因组。您还必须指定一个文件写入的RSD算法找到同源基因的结果。输出文件的格式,每行包含一个同源。每行包含序列之间的查询序列的id,主题序列id和距离(由codeml计算)。您可以选择指定包含使用--ids选项IDS的文件。那么RSD只会寻找同源基因的那些标识。使用--divergence和--evalue,你必须使用不同的阈值从默认的选项。
获取有关如何运行rsd_search,rsd_blast或rsd_format帮助:
rsd_search -h
rsd_blast -h
rsd_format -h
查找查询并受基因组全部序列之间同源基因,使用默认的分歧,安勤阈值
rsd_search -q例子/基因组/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject基因组=例子/基因组/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
使用多个非默认的分歧,安勤阈值找到同源基因
rsd_search -q例子/基因组/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject基因组=例子/基因组/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0.2 1E-20 --de 0.5 0.00001 --de 0.8 0.1
这是没有必要格式化的BLAST一个FASTA文件或计算BLAST命中因为rsd_search会为你。
但是,如果你打算在同一基因组运行rsd_search多次,特别是大型基因组,你可以通过使用rsd_format到preformatting的FASTA文件和rsd_blast到预先计算的BLAST命中节省时间。当运行rsd_blast,请务必使用--evalue一样大,你打算给rsd_search最大的安勤门槛。
下面是如何在地方格式化对FASTA文件:
rsd_format -g例子/基因组/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g例子/基因组/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
这里是如何格式化FASTA文件,把结果在另一个目录(当前目录在这种情况下)
rsd_format -g例子/基因组/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d。
rsd_format -g例子/基因组/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d。
下面是如何计算前向和反向鼓风命中(使用默认安勤):
rsd_blast -v -q例子/基因组/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject基因组=例子/基因组/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-命中q_s.hits --reverse,命中s_q.hits
下面是如何计算正向和反向爆炸击中了rsd_search,使用已经被格式化爆炸的基因组和非默认安勤
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject基因组= Mycobacterium_leprae.aa
--forward-命中q_s.hits --reverse-命中s_q.hits
--no格式--evalue 0.1
发现在该查询已经被格式化为高炉全部序列,并使用基因组受试者的基因组之间的直系同源物
rsd_search -q Mycoplasma_genitalium.aa
--subject基因组= Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no格式
找到查询中的所有的序列,并使用该已计算出的命中受试者基因组之间的直系同源物。注意到--no格式被包括,因为自鼓风命中已计算出的基因组不需要被格式化为鼓风。
rsd_search -v --query基因组Mycoplasma_genitalium.aa
--subject基因组= Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-命中q_s.hits --reverse-命中s_q.hits --no格式
找到同源基因在基因组中查询特定序列。为了找到同源基因只有短短数序列,使用--no-BLAST-缓存可以加快计算。情况因人而异。
rsd_search -q例子/基因组/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject基因组=例子/基因组/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o例子/ Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids例子/ Mycoplasma_genitalium.aa.ids.txt --no-BLAST-缓存
输出格式
直向同源物可以保存在几种不同的格式使用rsd_search的--outfmt选项。默认的格式,--outfmt -1,是指--outfmt 3. UNIPROT dat文件的启发,一组同源基因的启动与参数线,然后有0个或多个同源的线条,然后有一个端线。该指标的影响是查询基因组名称,主题基因组的名字,发散门槛,安勤门槛。每个直向同源物是在一行中,列出查询序列的id,主题序列的id,以及最大似然距离估计。这种格式可以代表在单个文件中的直向同源物的不带直系同源参数的多组参数,以及集。因此,指定多个分歧,安勤的阈值时,是适用于rsd_search使用。
下面是含有2参数组合,其中的一个具有没有直向同源物的例子:
PA tLACJO tYEAS7 t0.2 T1E-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 T1E-15
//
RSD的原始格式,--outfmt 1,提供了向后兼容性。每一行都包含的同源物,表示为主题序列号,查询序列号,和最大似然距离估计。它只能代表在一个文件中的单组的直向同源物。
例如:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
还提供向后兼容性是综述内部使用的格式(http://roundup.hms.harvard.edu/),这是像原来的RSD格式,除了查询序列ID列的主题序列号之前。
例如:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

要求

  • 在Python中
  • 在NC​​BI BLAST 2.2.24
  • 在PAML 4.4
  • 在Kalign 2.04

类似的软件

RFLP planner
RFLP planner

3 Jun 15

checkmyclones
checkmyclones

11 May 15

AHREA
AHREA

11 May 15

意见 reciprocal_smallest_distance

评论没有发现
添加评论
打开图片!