有很多时候我需要从HTML页面中提取元素的值。类似这样的:字符串操作,如何轻松提取HTML元素值?
<!-- many html here -->
<input type="hidden" name="id" value="ExtractMe!">
<!-- many html here -->
怎样才能轻松提取这个值?
有很多时候我需要从HTML页面中提取元素的值。类似这样的:字符串操作,如何轻松提取HTML元素值?
<!-- many html here -->
<input type="hidden" name="id" value="ExtractMe!">
<!-- many html here -->
怎样才能轻松提取这个值?
看一下HTMLAgility pack,它使得这种类型的任务非常简单并且无正则表达式。
如果你需要你的C#应用程序中解析HTML考虑使用HTMLAgilityPack从这里http://htmlagilitypack.codeplex.com/
为什么你不使用正则表达式?这MSDN Regular Expression Documentation,在那里你可以找到部分Extracting a Single Match or the First Match
。
有更快的解决方案吗?目前我使用'indexOf'。 – Xaqron 2011-05-10 14:37:10
@Xaqron正则表达式或您自己的解析器是两个最快的选项。如果你有XHTML,你可以尝试LINQ到XML – 2011-05-10 16:31:26