2012-09-05 137 views
1

我想解析一个html页面并从中获取特定值。我如何使用Linq或C#中的字符串解析来做到这一点?Linq解析html字符串

-------------更多HTML ----------

 <span class="date"> 
     04.09.2012 
    </span> 
    <table cellspacing="0"><tr><th scope="row">1 EUR</th><td><span>**4,4907**</span></td><td><span class="rise">+0,0009</span></td><td><span class="rise">+0,02%</span></td></tr><tr><th scope="row">1 USD</th><td><span>3,5635</span></td><td><span class="fall">-0,0093</span></td><td><span class="fall">-0,26%</span></td></tr></table> 

-------------更多HTML ----------

我有兴趣获得价值4,4907以粗体显示!

任何想法如何实现这一目标?

谢谢!

+2

使用'Html Agility Pack' – adatapost

+2

是的,使用[Html Agility Pack](http://htmlagilitypack.codeplex.com/)。 Linq在这里没有业务,字符串解析将是一场噩梦 – Steve

回答

1

试图解析HTML时要小心。

我认为显而易见的方法是将其加载到XDocument(作为XML),但是由于HTML通常是不明确的或者包含语法错误,所以这肯定会失败。

这里的人在堆栈溢出,而不是建议使用http://htmlagilitypack.codeplex.com/这被认为是一个伟大的工作解析HTML。然后你可以使用xpath来查询你的文档中的各种内容。