它沿用了原先的WHATWG官方HTML5规范。
分析器是专门用来处理HTML的所有口味和分析利用公义与主要的桌面Web浏览器的行为兼容的错误处理规则无效文件。
输出地点理想的树结构的内部。
它支持输出到ElementTree的,DOM和LXML树格式以及一个简单的自定义格式。
HTML5Lib包装用的distutils。
HTML5Lib也可用于:
红宝石 - 下载HTML5Lib为Ruby的这里。
蟒蛇 - 下载HTML5Lib为Python的这里。
PHP - 下载HTML5Lib为PHP的这里
什么是此版本的新:
- 解析。有效和无效的HTML文档树
- 支持minidom命名,ElementTree中(包括cElementTree和lxml.etree),BeautifulSoup(不建议使用)和自定义simpletree输出格式
- DOM到SAX转换
- 报告分析错误
- 字符编码检测
- 过滤和树木串行化
- HTML + CSS消毒剂
- 在许多单元测试
评论没有发现