下载网页信息的有效方法

在您停止阅读并建议HTML敏捷（基于标题）之前，我已经在使用此工具。问题是这样的：我有一个网页，列出了大量的案例编号，并链接到个案号码页。我的应用程序已经下载这些信息并将其显示在datagridview中。然而，在我的应用程序中，我还需要来自个案号码页面（链接）的信息。下载网页信息的有效方法

问题是我已经知道这将需要永远采取使用HTML敏捷性。要获得案例页面，大约需要2分钟。明智的代码我将HTML敏捷性提供给HTML代码，将单元格值添加到数组中并解析出我在网格中显示的数组索引。这是对页面上组件数量非常大的数组解析。

任何想法从链接页面获取主页面和特定单元格？

来源

2012-07-18 ikathegreat

元素（一个或多个），如果您是使用HTML敏捷包那么为什么不使用XPath只需获取你想要的元素类型。如果你向我展示一些HTML和你想要的东西，我很高兴给你一个例子 – HatSoft 2012-07-18 21:10:20

是的，如果你有任何方便的例子。我还没有用xpath进行实验。只有row.SelectNodes（“td”）'中的'HtmlAgilityPack.HtmlNode单元格返回许多许多单元格。 – ikathegreat 2012-07-19 00:15:54

_“从链接页面获取[..]特定单元格的任何想法？”_ - 您必须下载所有的HTML才能解析它。 – CodeCaster 2012-07-19 07:53:08

示出了如何在HmtlAgility使用XPath

的HTMLDocument DOC =新的HTMLDocument（）的一个例子; doc.LoadHtml（yourHtml）;

实施例1： //下面的例子将得到所有div的与类作为容器的foreach（HtmlNode节点在 doc.DocumentNode.SelectNodes（ “// DIV [@类= '容器']”））{
Console.Writeline（node.InnerText）; }

实施例2： //下面的例子将得到与类作为容器HtmlNode节点第一个div在 doc.DocumentNode.SelectNodes（ “// DIV [@类= '容器'] [1]”））

Console.Writeline（node.InnerText）;

您可以使用XPath查询来获得你想要

的XPath语法和更多信息，请使用链接http://www.w3schools.com/xpath/xpath_syntax.asp

来源

2012-07-19 07:49:09 HatSoft

下载网页信息的有效方法

回答

相关问题