2010-12-20 77 views
3

如果我需要促进从各种(非API)互联网源提取数据,是否有一个框架类型的解决方案,可以简化开发人员大规模编写可重用但特定于源的解析器的过程?Python解析框架

+3

你需要解析HTML吗? – 2010-12-20 15:57:54

+0

是的,在某些情况下,但它也是文本,所以直接的html解析器不会是一个完整的解决方案 - 理想情况下,它将类似于html模板引擎,但相反 - 所以你会有像:high潮流:{{time}},但也可以使用html,以及更复杂的循环。 – NFicano 2010-12-20 16:03:58

回答

5

Pyparsing是一个Python库,我发现它对解析自定义域特定语言非常有用。