AREM是一款基于MACS(基于模型分析的ChIP-SEQ数据)。
高通量测序耦合到染色质免疫沉淀(芯片起)被广泛用于表征基因组范围的转录因子,辅因子,染色质改性剂,和其它DNA结合蛋白结合模式。在芯片起数据分析的一个关键步骤是由映射高通量测序短读取到参考基因组,并确定富含短读取峰值区域。
虽然有几种方法已经被提出用于芯片起分析,大部分现有ACTUAL方法仅考虑读取,可以唯一地放置在参照基因组,并因此具有低的功率,用于检测峰值LO-重复序列内cated。在这里,我们介绍一种概率进近的芯片起的数据分析,利用所有的读取,提供真正的全基因组结合模式的观点。
读取使用对应于k富集区域和一个空的基因组背景的混合模式为蓝本。我们使用最大似然估计富集区域的位置,并执行一个期望最大化(EM)AL- gorithm,称为AREM,更新每个的取向概率读取到不同的基因组位置。
有关更多信息,请参阅我们的文章在2011 RECOMB或访问我们的网站:http://cbcl.ics.uci.edu/AREM
AREM是基于流行MACS峰呼叫者,如下所述:
用的测序技术的改善,染色质免疫沉淀接着通过高通量测序(芯片起)越来越流行,研究的全基因组蛋白-DNA相互作用。为了解决缺乏强大的芯片-SEQ分析方法,提出了一种新的算法,命名为芯片-SEQ(MACS)基于模型的分析,识别转录因子结合位点。
MACS捕获的基因组的复杂性,以评估富集芯片区域的意义的影响,和MACS提高了通过结合两种测序标签的位置和方向的信息的结合位点的空间分辨率。 。MACS可以很容易地用于芯片序列数据单独或与具有特异性的增加控制样品
要求:
- 的Python
评论没有发现