2013-05-07 101 views
0

任何人都可以请告诉我什么是最好的网页浏览器自动化框架/库?任务是打开Web浏览器页面,登录,执行一些长时间的搜索,并将收集的信息保存为excel。现在我在C#中使用IE引用,但在工作中我只能使用IE8。如果我已将其升级到IE9,但目标网站上的某些脚本开始处理错误。据我所知,我试图使用awesomium,但我无法用它的帮助解析页面。有没有任何变种高速做到这一点?库的大小 - 并不重要。网络浏览器自动化(Robor)

如果有任何解决方案与Scala兼容,那就太好了。

+0

看看[selenium](http://docs.seleniumhq.org/)。它内置了对C#和Java的支持(因此也支持Scala) – 2013-05-07 10:39:28

回答

0

正如om-nom-nom已经暗示,你最好的选择可能是像selenium webdriver这样的webdriver实现。它有c#和java的绑定,可以使用IE,FF,Chrome,phantomjs(很棒,如果你想去无头的话)等等。

请注意,直接使用网络驱动器收集信息可能不是最好的办法,尤其是在网站内容变化很快的情况下。在这种情况下,使用webdriver保存html页面源可能很有用,然后切换到静态内容的更高效的库,如JSoup