2014-03-25 43 views
0

我tryint截至http://effbot.org/zone/element-iterparse.htm#incremental-parsing蟒蛇lxml的iterparse失败含有命名空间

描述解析大文件(> 100MB)的大文件,但如果文件中包含的命名空间,LXML失败,错误

lxml.etree.XMLSyntaxError: Namespace default prefix was not found 

它如果我删除elem.clear(),但使用大量内存,则工作正常。 xml文件的 例

<?xml version="1.0" encoding="utf-8" ?> 
<feed xmlns="NS"> 
    <offer> 
    <type>type1</type> 
    <name>name1</name> 
    </offer> 
</feed> 

lxml的版本是3.2.0,因为解析

+1

你能提供示例代码吗? – maxbublis

+0

我试过lxml> 3.3,现在一切正常 – vitalii

回答

0

你看过this结束后的新版本出现segfaults? 在我使用100MB +文件的经验中,您使用的内存超过2GB(例如,我的160MB的内存我高达4.5GB)您是否使用64位Python?