的XPath从第二页

-1

我想从这个网页刮数据废弃数据：http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33，我特别需要的数据为基金数量的26的XPath从第二页

都没有问题从第一页中获取数据与该地址（基金编号1-25），但因为我的地狱不能从第二页上刮掉任何东西。有人可以帮忙吗？

谢谢！

这里是我使用的代码：在谷歌表：

= IMPORTXML（ “http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33”，“/ HTML /体/形式[@ ID = '的MainForm'] /表/ TR/TD/DIV [ @ ID = '主'] /格[@ ID = 'tabResult'] /格[@ ID = '价格'] /表/ THEAD/TR [26]/TD [@类= '中心'] [1]” ）

来源

2017-01-14 Mordko

你可以做两件事情 - 一个是为PgIndex=2添加到您的URL的末尾，然后你也可以显著简化您的XPath来此：

//*[@id='Prices']//tr[2]/td[2]

这特别是抓取表的第二行（tr表示表行），以绕过标题行，然后抓取表格数据单元的第二个字段。

=IMPORTXML("http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33&PgIndex=2","//*[@id='Prices']//tr[2]/td[2]")

来源

2017-01-16 10:48:12

Aurielle，非常感谢！ – Mordko

要获得第二页，请在您的网址中添加& PgIndex = 2。然后将/ table/thead/tr [26]调整到/ table/thead/tr [2]。其结果是：

=IMPORTXML("http://webfund6.financialexpress.net/clients/zurichcp/PortfolioPriceTable.aspx?SchemeID=33&PgIndex=2","/html/body/form[@id='MainForm']/table/tr/td/div[@id='main']/div[@id='tabResult']/div[@id='Prices']/table/thead/tr[2]/td[@class='Center'][1]")

来源

2017-01-14 18:05:55

版，非常感谢！我一直在努力与这个愚蠢的东西多年，你真的帮了忙。 – Mordko

太棒了！如果这回答了您的问题，请批准答案。谢谢， –

的XPath从第二页

回答

相关问题