2015-10-15 60 views
-1

我想解析一个web文档。使用HtmlAgilityPack(C#) 这正是寻找标签的href值。HtmlAgilityPack解析的值不同

我解析http://www.ntis.go.kr/ThRndGateList.do

虽然成功的解析,数值略有不同。 我不知道为什么。

网络的实际值如下:

enter image description here

通过Htmlagilitypack得到的数值如下:

enter image description here

正如你可以看到,这个奇怪的起点在href值中获得“jsessionid”值。什么原因?

谢谢你的问候。

+0

能否请您复制粘贴HTML和解析结果的文本?我从这些图片中看不到任何东西 –

+1

难道是,您是在您的浏览器中登录到本网站的吗? –

+0

实际值:/ThRndGateView.do?searchType=&idx=211166&pageNumber=1&searchWord= –

回答

0

这可能是因为在你的浏览器(在你的情况下,Chrome浏览器)您登录如果您通过HtmlAgilityPack发出请求你像一个刚打开的浏览器:

  • 未登录
  • 决不此页面上

您要使用的web应用之前,当有人打开首次页面生成JSESSIONID这个ID是通过URL转移。

这个问题可以帮助你了解web应用背后的技术:Under what conditions is a JSESSIONID created?