2012-07-18 75 views
0

在您停止阅读并建议HTML敏捷(基于标题)之前,我已经在使用此工具。问题是这样的:我有一个网页,列出了大量的案例编号,并链接到个案号码页。我的应用程序已经下载这些信息并将其显示在datagridview中。然而,在我的应用程序中,我还需要来自个案号码页面(链接)的信息。下载网页信息的有效方法

问题是我已经知道这将需要永远采取使用HTML敏捷性。要获得案例页面,大约需要2分钟。明智的代码我将HTML敏捷性提供给HTML代码,将单元格值添加到数组中并解析出我在网格中显示的数组索引。这是对页面上组件数量非常大的数组解析。

任何想法从链接页面获取主页面和特定单元格?

+0

元素(一个或多个),如果您是使用HTML敏捷包那么为什么不使用XPath只需获取你想要的元素类型。如果你向我展示一些HTML和你想要的东西,我很高兴给你一个例子 – HatSoft 2012-07-18 21:10:20

+0

是的,如果你有任何方便的例子。我还没有用xpath进行实验。只有row.SelectNodes(“td”)'中的'HtmlAgilityPack.HtmlNode单元格返回许多许多单元格。 – ikathegreat 2012-07-19 00:15:54

+0

_“从链接页面获取[..]特定单元格的任何想法?”_ - 您必须下载所有的HTML才能解析它。 – CodeCaster 2012-07-19 07:53:08

回答

1

示出了如何在HmtlAgility使用XPath

的HTMLDocument DOC =新的HTMLDocument()的一个例子; doc.LoadHtml(yourHtml);

实施例1: //下面的例子将得到所有div的与类作为容器的foreach(HtmlNode节点在 doc.DocumentNode.SelectNodes( “// DIV [@类= '容器']”)){
Console.Writeline(node.InnerText); }

实施例2: //下面的例子将得到与类作为容器HtmlNode节点第一个div在 doc.DocumentNode.SelectNodes( “// DIV [@类= '容器'] [1]”) )

Console.Writeline(node.InnerText);

您可以使用XPath查询来获得你想要

的XPath语法和更多信息,请使用链接http://www.w3schools.com/xpath/xpath_syntax.asp