0
我需要一些建议,以了解我需要在正在处理的项目中实现的功能的最佳方法。从HTML页面中提取可本地化的内容
基本上,我需要能够从HTML页面中提取所有可本地化的内容(即所有字符串)。我真的不想去写HTML解析器。该应用程序是用C#编写的。
有没有人有这方面的经验,或任何人都可以推荐一个现有的图书馆,我可以用它来完成?
谢谢。
我需要一些建议,以了解我需要在正在处理的项目中实现的功能的最佳方法。从HTML页面中提取可本地化的内容
基本上,我需要能够从HTML页面中提取所有可本地化的内容(即所有字符串)。我真的不想去写HTML解析器。该应用程序是用C#编写的。
有没有人有这方面的经验,或任何人都可以推荐一个现有的图书馆,我可以用它来完成?
谢谢。
您不必编写自己的解析器。幸运的是,其他人已经这样做了。
要解析HTML文件,您可以使用HTML Agility Pack。
在这种情况下,您将收到文档对象模型,您可以像任何其他DOM一样走路。请找到这些例子:
http://www.4guysfromrolla.com/articles/011211-1.aspx
http://htmlagilitypack.codeplex.com/wikipage?title=Examples&referringTitle=Home
而且这个问题:
谢谢,我会看看这个。顺便说一句,您的链接上面的HTML敏捷包看起来内部的赛门铁克;-) –
@Jimmy C:Yeap,不知何故,我犯了一个错误。幸运的是,这不是什么敏感的东西:) –