2017-01-14 54 views
-1

我想从这个网页刮数据废弃数据:http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33,我特别需要的数据为基金数量的26的XPath从第二页

都没有问题从第一页中获取数据与该地址(基金编号1-25),但因为我的地狱不能从第二页上刮掉任何东西。有人可以帮忙吗?

谢谢!

这里是我使用的代码:在谷歌表:

= IMPORTXML( “http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33”,“/ HTML /体/形式[@ ID = '的MainForm'] /表/ TR/TD/DIV [ @ ID = '主'] /格[@ ID = 'tabResult'] /格[@ ID = '价格'] /表/ THEAD/TR [26]/TD [@类= '中心'] [1]” )

回答

0

你可以做两件事情 - 一个是为PgIndex=2添加到您的URL的末尾,然后你也可以显著简化您的XPath来此:

//*[@id='Prices']//tr[2]/td[2] 

这特别是抓取表的第二行(tr表示表行),以绕过标题行,然后抓取表格数据单元的第二个字段。

=IMPORTXML("http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33&PgIndex=2","//*[@id='Prices']//tr[2]/td[2]") 

enter image description here

+0

Aurielle,非常感谢! – Mordko

0

要获得第二页,请在您的网址中添加& PgIndex = 2。然后将/ table/thead/tr [26]调整到/ table/thead/tr [2]。其结果是:

=IMPORTXML("http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33&PgIndex=2","/html/body/form[@id='MainForm']/table/tr/td/div[@id='main']/div[@id='tabResult']/div[@id='Prices']/table/thead/tr[2]/td[@class='Center'][1]") 
+0

版,非常感谢!我一直在努力与这个愚蠢的东西多年,你真的帮了忙。 – Mordko

+0

太棒了!如果这回答了您的问题,请批准答案。谢谢, –