lxml

软件截图:
lxml
软件详细信息:
版本: 3.4.4 更新
上传日期: 12 May 15
开发: infrae.com
许可: 免费
人气: 70

Rating: nan/5 (Total Votes: 0)

LXML结合这些库的Python语言的简洁的速度。
兼容从2.4 CPython的所有版本的3.2

什么在此版本中是新的

  • 在lxml.html.iterlinks现在返回元刷新标记中的链接。
  • 新XMLParser的选项collect_ids = false来禁止ID哈希表的创建。这可以基本上加快文件解析与未使用的许多不同的ID。
  • 解析器使用每个文件的哈希表的XML标识。这减少了全局分析器字典的负荷并加速解析为许多不同的ID的文档。
  • ElementTree.getelementpath(元素)返回给定的元件,其可用于查找后的结构ElementPath表达
  • 在XMLFILE()接受关闭= true一个新的说法,关闭文件(样)写在他们之后的对象。之前,XMLFILE()只关闭,如果它已经在内部打开该文件。
  • 允许"字节组"类型ASCII文本输入。

什么是3.4.2版本,新的

  • 在lxml.html.iterlinks现在返回内部链接元刷新标签。
  • 新XMLParser的选项collect_ids = false来禁止ID哈希表的创建。这可以基本上加快文件解析与未使用的许多不同的ID。
  • 解析器使用每个文件的哈希表的XML标识。这减少了全局分析器字典的负荷并加速解析为许多不同的ID的文档。
  • ElementTree.getelementpath(元素)返回给定的元件,其可用于查找后的结构ElementPath表达
  • 在XMLFILE()接受关闭= true一个新的说法,关闭文件(样)写在他们之后的对象。之前,XMLFILE()只关闭,如果它已经在内部打开该文件。
  • 允许"字节组"类型ASCII文本输入。

什么是3.3.2版本,新的

  • 在属性解析器和版本,还有方法set_element_class_lookup()和makeelement(),从iterparse对象丢失了。
  • XML模式,Schematron的和RelaxNG的实例没有运行验证之前清除当地的error_log。
  • lxml.doctestcompare混合起来"预期"和"实际"在属性值。

在什么版本3.3.1新是

  • 在错误修正:
  • 解析与parser.feed HTML文档()未能找到标签迭代中的元素。
  • 在大厦PyPy由于*()在PyPy的C-API失踪PyUnicode_Compare()和PyByteArray _支持失败。
  • 编纂MSVC失败,原因是缺少" stdint.h"标准的头文件。
  • iterparse()无法解析BOM前缀的文件。

在什么版本3.3.0新是

  • 在错误修正:
  • 区别于文件的URL路径的启发式收紧,产生更少的假阴性。

什么是3.2.3版本,新的

  • 修正为Python 2.4的支持而被丢在3.2 0.2。

什么是3.2.1版本的新

  • 在该方法apply_templates()和process_children(中) XSLT扩展元素已经获得了两个新的布尔选项elements_only和remove_blank_text,从结果列表中丢弃或者所有字符串或仅空白字符串。

什么是3.2.0版本的新

  • 在领先的空白可以改变字符串解析行为功能lxml.html。
  • 在字符串中的解析函数lxml.html在像框架集或丢失body标签少见的HTML内容的脸部更加坚固。
  • 在I / O错误,而试图访问文件包含非ASCII字符可能引发的UnicodeDecodeError路径,而不是正确地报告IO错误。
  • 从内存字符串解析在默认解析器禁用的网络接入,并提出后续尝试从URL解析失败。

什么是3.1.2版本,新的

  • 在穿过的命名空间,不知道属性的API萨克斯桥(即handler.startElement()方法)失败,一个TypeError。
  • 修正了系列化的XSLT转换的输出结果树为Unicode字符串时的错误。

什么是3.0.2版本,新的

  • 在翻译过程中关机修正了切换到用Cython 0.17 .3楼。

什么是3.0版本中新的

  • 在C14N允许指定的包容性前缀晋升为自上而下在专属的序列化水平。
  • 在PyPy建设(通过cpyext)的初步支持。
  • 在DTD对象获得了API,允许其申报读取权限。
  • xpathgrep.py获得解析线逐线(例如从grep的输出)和环绕输出一个新的根标签的支持。
  • 在电子厂lxml.builder接受已知数据类型的亚型(如串亚型)建筑周围元素时。
  • 树迭代和iterparse()与选择性标签参数通过支持一组标签。树节点将被迭代器返回如果他们匹配任何标签。

在什么版本2.3.5新是

  • 在合并中element.remove文本节点时崩溃( )。
  • 在报告空当DOCTYPE在崩溃萨克斯/目标解析器。

什么是2.3.4版本,新的

  • 在崩溃建设nsmap(元素属性)同当空空间URI。
  • 螺纹XSLT处理期间,当错误(或用户信息)发生碰撞,由于竞争状态。
  • 在XSLT样式表汇编可以忽略编译错误。

在什么版本2.3.3新是

  • 在功能的加入:
  • lxml.html.tostring()获得了新的序列化选项with_tail和DOCTYPE。
  • 错误修正:
  • 在使用iterparse()时,对HTML解析和请求启动事件修正了崩溃。
  • 修正的cssselect更多的选择解析。前伪元素和伪类是空白因为显著它是一个后代组合子。 " E:伪"应该分析一样" E *:伪",&不QUOT; E:伪"
  • lxml.html.diff不再打“IMG”标签没有'SRC“属性时,会引发异常。

什么2.3.2版本新

  • 在功能的加入:
  • lxml.objectify.deannotate()有一个新的布尔选项cleanup_namespaces除去客观化名称空间声明(一般清理命名空间声明)删除类型标注后。
  • lxml.objectify获得它自己的子元件()函数作为etree.SubElement的副本,以避免用户侧lxml.etree的否则冗余导入。
  • 错误修正:
  • 修正了"后裔"臭虫在cssselect第二次(在LXML 2.3.1首次定位之后)。以前的更改导致的翻译表达的基于XPath的评价严重的性能下降。注意,这打破了一些以前在2.3.1工作所生成的XPath表达式作为XSLT位置路径的使用。
  • 修正了一些cssselect选择的解析。空格组合子&QUOT后;>"," +"和" QUOT〜&;现在可以正确地忽略。此前被被解析为后代组合子。例如," DIV> .foo"被解析一样" DIV> * .foo"而不是" DIV> .foo"

在什么版本2.3.1新是

  • 在功能的加入:
  • 在新选项kill_tags在lxml.html.clean去除特定的标记及其内容(即自己的整个子树)。
  • pi.get()和pi.attrib上从处理指令的文本内容解析伪属性处理指令。
  • lxml.get_include()返回包括可用于编译针对lxml.etree外部的C代码路径列表。这是专门针对需要静态链接LXML构建代码的时候需要对编译完全相同的头文件作为版本本身LXML
  • Resolver.resolve_file()需要一个附加选项CLOSE_FILE说,如果配置文件(状)对象将读取或后没有关闭。默认情况下,该文件将被关闭,因为用户不期望继续对它的引用。
  • 错误修正:
  • HTML清洁并没有消除“数据:”链接
  • 的html5lib解析器整合现在使用的html5lib本身的“官方”的实施,这使得它与库更新版本的发布工作。
  • 在lxml.sax,endElementNS()可能会错误地拒绝时,相应的启动事件推断为默认命名空间相同的纯标签名纯标签名称。
  • 当一个开放的类文件对象传递到解析()或iterparse(),解析器将不再关闭它后使用。这在恢复2.3 LXML的变化,所有的文件将被关闭。这是用户的责任妥善关闭文件(状)的对象,也是在错误情况。
  • 在lxml.html.cleaner断言错误丢弃的顶级元素时。
  • 在lxml.cssselect,而不是使用“A /后裔:: B'中的XPath”A // B'(简称'A /后代或自身::节点()/ B')的CSS后代选择器(“A,B”)。这使得一些边缘情况是在WebKit和Firefox中,选择行为一致,使更多的CSS表达式有效的位置路径(在XSL使用:模板匹配)。
  • 在lxml.html,非选择<选项>标签不再显示在收集的形式值。
  • 添加/删除<选项>值/从多个选择表单域正确选择它们并取消选择他们。
  • 其他变化:
  • 在静态建立可以指定与--download-dir选项下载目录。

在什么2.3版本是新的

  • 在功能的加入:
  • 当寻找儿童,lxml.objectify以“{}标记”为意指一个空的命名空间,相对于母体命名空间。
  • 错误修正:
  • 当完成了从一个类文件对象中读取,解析器立即调用它。关闭()方法。
  • 在完成后的解析,iterparse()立即关闭输入文件。
  • 在解决类似的错误libxml2的解析severly破碎的文件(固定libxml2的2.7.8),之后可以将HTML解析器在非功能状态。

  • 在HTML清理代码
  • 在马凯标签正确命名字幕。
  • 其他变化:
  • 在用Cython级别的C-API中的一些公共职能有更明确的返回类型。

什么版本2.3beta1是新的

  • 在错误修正:
  • 动了对更换的XInclude节点属性的文件之间的元素碰撞时,在新的libxml2版本。
  • XMLID()函数缺少可选解析器和BASE_URL参数。
  • 搜索通配符标签iterparse()PY3中被打破。
  • lxml.html.open_in_browser()没有在Python 3由于使用os.tempnam的工作。现在有一个可选的'编码'参数。

类似的软件

3to2
3to2

12 May 15

demjson
demjson

12 May 15

python-magento
python-magento

6 Jun 15

psd-tools
psd-tools

1 Mar 15

意见 lxml

评论没有发现
添加评论
打开图片!