挖洞轮车定位仪(BWA)是对齐针对长期参考序列比较短的碱基序列,例如,人类基因组的高效程序。
该软件实现了两个算法,BWA-短期和BWA-SW。前者作品查询序列比200bp的短,达到约100kbp后者为更长的序列。
两种算法做跳空对齐。它们通常更精确和更快的具有低错误率的查询。请参阅BWA手册页了解更多信息。
BWA是否对齐454读取?
 是的,没有。 BWA的BWA-SW部分运作良好,在454读取约200个基点以上。它实现了类似的对准精度来SSAHA2而快得多。 BWA-SW也适用于较短的读取,但灵敏度降低。此外,BWA-SW不支持配对末端对齐。
什么是最大的查询序列长度对齐?
 建议只使用BWA短的读取比200个基点短。虽然BWA-短篇作品多达原则几个KBP查询,其性能下降。对于长时间阅读,BWA-SW是更好的。
 在BWA-SW组件可以对齐BAC序列(约150kbp)对人类基因组。在每个时间单位对准碱基而言速度媲美的1kbp读取对准的速度。原则上,BWA-SW应该能够调整一些MBP查询序列相似的速度,但我没试过。
什么是测序错误的宽容?
  BWA短,主要针对低于2%的测序错误率。尽管用户可以要求它容忍调整命令行选项更多的错误,它的性能迅速下降。请注意,对于Illumina的读取,BWA-短可任选修剪从对准之前的3'末端的低质量的碱,从而能够调整多与在尾高错误率,这是典型的Illumina的数据读出。
  BWA-SW容忍给予更长的调整更多的错误。仿真表明,BWA-SW可以很好地工作给予2%的误差为100bp的对准,3%的误差为一个200bp的,为500bp的5%和10%为1000bp或更长对齐。
是否BWA发现嵌合读?
 是的,BWA-SW组件是能够找到嵌合体。 BWA报告通常一次调整为每读取数据,但输出,如果读/重叠群是一个嵌合体两个或两个以上的路线。
是否BWA调用的SNPs就像MAQ?
 不,BWA只做对齐。尽管如此,它输出在所支持几个通用的SNP呼叫者如samtools和GATK在SAM格式比对。
我看到一个读一对具有高品质的映射,但对方读为零。这是正确的?
 这是正确的。映射质量被分配给个人的读,而不是用于读对。这可能是一个读可以明确地映射,但它的对偶落在tandom重复,因此,其精确的位置不能确定。
我看到一个读脱颖而出染色体的末端,被标记为未映射(标志为0x4)。这里发生了什么?
 内部BWA符连接所有参考序列合并为一个长的序列。读可以被映射到两个相邻的参考序列的交界处。在这种情况下,BWA将标志改为未映射,但你会看到的位置,雪茄和所有的标签。一个更好的解决办法是选择一个备用位置或修剪对准出端的,但是这是在编程相当复杂,并非是在该时刻执行。
是否BWA工作总?的参考序列比4GB长
 否,这是不可能的,并且将不会在不久的将来,由于所涉及的技术复杂性的支持。
勘误表
一个空字符串的后缀阵列间隔应[0,N-1],其中n是数据库字符串[-1 N 1,]作为Li和德宾(2009年和2010年)的规定的长度,不。与此相对应,我们需要定义O(一,-1)= 0和修改伪图3,从Li和德宾(2009年)。 BWA的实施实际上是正确的。该错误只发生在纸张上。我们深表歉意的混乱和感谢尼尔斯荷马和亚伯安东尼腐尸科利亚多指出了这一点
什么在此版本中是新的:
- 修正:在XA标签替代重复点击
- 修正:启用修剪时,BWA-AlN的微调1BP少 。
- 在残疾人士的色彩空间调整。 0.6.x工作不凭借雄厚的读取当前。
- 修正:段错误是由于过多的暧昧基地
- 修正:在SE模式不正确的队友位置
- 修正:在PE模式下难得的段错误
- 当宏观_NO_SSE2在使用中,回落到标准的史密斯 - 沃特曼
- 而不是SSE2-SW。
- 可选标记分命中较低的定位分数作为次要的。
- 修正:引起歧义基地无限循环
- 可选输出查询序列。
评论没有发现