speedparser是通用饲料解析器的黑盒重新实现。它使用lxml的饲料解析和可选的HTML清洗 与feedparser speedparser的兼容性是场严格的子集,非常好,但差的子集外场。见测试/ speedparsertests.py的更多信息,哪些场是或多或少相容的,哪些不是。
在Intel酷睿i5 750,只在一个内核上运行,feedparser管理2.5饲料/秒的试验饲料组(大约4200“饲料”,在测试/ feeds.tar.bz2),而speedparser管理约65供稿/秒,HTML 。在清洗和200饲料/秒,清洗过
要求:
- 在Python中
- LXML
评论没有发现