2012-10-17 29 views
0

我正在尝试使用HTML解析器ASP.NETC#解析/从新闻网站上的文章获取评论时报印度。这里是一个示例url:http://timesofindia.indiatimes.com/tech/tech-news/software-services/Infosys-CEO-SD-Shibulals-letter-to-employees/articleshow/16832881.cms如何使用HTML解析器获取评论?

我试图获取它的HTML,然后使用WebGet,DocumentNode.SelectNodes()等来获取评论。但它没有在页面的HTML中显示任何评论。

(通常所有的数据中获取成立嵌入一些<div>标签等,但这里没有这样的标记可用这给意见。)

如何获取该网页上的评论?

+2

这可能会有所帮助:http://htmlagilitypack.codeplex.com/它使得从html中解析特定信息变得非常容易。 – MisterIsaak

+1

你有一个网址有实际的评论,你的文章中的网址没有评论?可能的话,评论会在网站上动态更新。这就是为什么如果你读取html代码,它没有评论。 – urlreader

+1

你不能使用HtmlAgilityPack获得注释,因为它们是使用JavaScript加载的(你必须先运行JS)。 – Nasreddine

回答

0

您可以通过导航到你张贴的是URL的情况下,评论URL抓取评论..

http://timesofindia.indiatimes.com/tech/tech-news/software-services/Infosys-CEO-SD-Shibulals-letter-to-employees/opinions/16832881.cms

然后搜索

<div style="" class="cmt"> 

,这似乎是指定评论的标签。

+1

你在这里说的很明显。 – Nasreddine

+0

谢谢......这就是我要找的。刚刚错过了这个。 – Man8Blue

+0

@Nacereddine - 有时显而易见的是所有人都需要 –