2013-03-14 46 views
0

我想解析一个html页面并从中提取标签。我需要一些好的算法在C语言中做这些建议?我试图寻找库,但多数人似乎支持Python和Ruby或Java但遗憾的是没有什么是有C.通用标记语言解析器

+0

看看libxml2,htmltidy,expat等 – 2013-03-14 07:37:01

+0

谢谢你的帮助,我确实研究过它们,看起来它们可能很有用,但是我想从头开始编写我自己的解析器,然后递归下降的方式来编写它好。?我不想一次解析文件一个字符,任何更好的方法来提高解析速度。 – user2164540 2013-03-14 08:55:50

回答