我建立一个应用程序从网站拉条新闻却无法得到它的发现与DD标签的XPath不拾取DD标签
在哪里我错了任何想法节点?
HTML
<h1>INFO: New Prices</h1>
<dl class='table'>
<dt>Department:</dt><dd>Sales</dd>
<dt>Start Date:</dt><dd>28/06/2012</dd>
<dt>End Date:</dt><dd>20/07/2012</dd>
<dt>Approved Date:</dt><dd>Jun 28 2012 3:11PM</dd>
</dl>
C#代码
public void CollectNewsItem(UInt64 aSID)
{
String URL = WebReader.storyLink + "?SID=" + aSID;
HtmlWeb hw = new HtmlWeb();
HtmlDocument document = hw.Load(URL);
HtmlNode n = document.DocumentNode.SelectSingleNode("//h1");
Console.WriteLine("Title: " + n.InnerText);
HtmlNodeCollection nodes = document.DocumentNode.SelectNodes("//dd");
foreach (HtmlNode node in nodes)
{
Console.WriteLine(node.InnerText);
}
}
是它找到'h1'标签OK? – bluevector
是的h1标签正在被发现并输出正确 –
而且我认为,如果你改变“// dd”为“// dl”它会发现。 “/ dt”怎么样?也许是因为'dd's在'dl'里面...... – bluevector