我挣扎解析ATOM XML文件,从一个API来,到公共数据结构,如dict
,Pandas dataframe
或JSON
,的Python 3.X:解析ATOM XML并转换为字典
我明白XML文件比JSON文件更复杂,因此不会有一个非常简单的通用解决方案。我希望,鉴于我处理ATOM结构的事实可能有助于将文件解析为更一般的数据结构。
的XML数据的结构:http://opendata.cbs.nl/ODataFeed/OData/70266ned/TypedDataSet 而对于JSON这里类似:http://opendata.cbs.nl/ODataFeed/OData/70266ned/TypedDataSet
我不能使用JSON文件的原因是,它常常是不可用的。
我打得四处像xml.etree
,xmltodict
,lxml
,xmljson
和feedparser
库,但我不断收到错误。
例如,使用feedparser
:
r = requests.get('http://opendata.cbs.nl/ODataFeed/OData/70266ned/TypedDataSet')
tree = ElementTree.fromstring(r.content)
息率
xml.etree.ElementTree.ParseError: not well-formated (invalid token): line 1, column 0
帮助将高度赞赏错误!