我有下面Explorer中浏览网页,你可以看到这个页面上,它是关于外汇交易和网站列表中的所有的真实交易记录在这里:如何阅读完整的HTML源代码与按钮“多”
http://www.forexfactory.com/trades.php?reset=1
我通常使用python来阅读背后的源代码并通过BeautifulSoup解析信息。然而,在这种情况下,你可以看到,这里是在窗格的最后一个“更多”点击按钮:
a busy cat http://i.minus.com/ibfq5BgLjta0Lo.jpg
如果我点击它一个时间,交易的名单将延期一次,并在列表的末尾这里是更多的点击再次。点击两次或三次后,整个列表将完整显示。我怎么能让python以编程代码的方式点击更多,然后我可以获取贸易记录的整个列表?
以下问题也是如此:通常,我们可以阅读HTML源代码,并使用一些解析技术从复杂标签中获取文本信息。但是,如果您不去源代码,但使用鼠标选择网络的全部内容,然后点击“ctrl + c”,那么您可以看到浏览器中显示的所有文本,而不需要复杂的标签。我认为这也可能是获取信息的另一种方式。但是,似乎python只能读取HTML源代码,并且有没有像我所描述的方式来简单地选择web的全部内容然后复制,然后我们得到一个包含整个文本信息而没有标签的长字符串?
非常感谢!
或pywebkitgtk或pyphantomjs或一些Python脚本浏览器。 – 2012-01-12 19:53:01