2013-10-23 24 views
1

在Windows环境中,您如何建议我完成以下任务:访问网站,输入用户名和密码,从下拉菜单中选择一个选项,点击几个链接(一个是动态的,但事先已知并存储在本地文件中),然后从显示的页面中删除信息并将其保存到文件中。如何访问网站,登录,导航到页面并抓取数据

我试图在人力方面解决的问题是;我从我以后的信息类型的大型聚合商那里购买我的一个业务的数据。他们给我发送了这个信息的快照,以获得完整的信息并将其输入到我的后台客户管理数据库中。我必须加载浏览器,访问聚合器站点,登录,从下拉列表中选择帐户正在存储信息,然后从着陆页导航到数据列表(1个静态链接),然后扫描新的客户数据页面(动态链接),然后单击该链接,最后将屏幕上显示的数据复制并粘贴到我的后台系统。

定期购买此数据的日志意味着需要我或员工很长时间才能完成此操作。聚合器没有API或其他与他们互动的方式,除了他们的网站,不幸的是,根据我的经验他们提供了最好的质量数据,所以我被大量世俗的数据录入困扰,或者付钱给其他人来做,做更多的生产任务。

我有各种机器和操作系统的可用,但宁愿我可以运行在WinXP/7/8的解决方案。

从电子邮件获取唯一标识符到一个文本文件不是一个问题,我可以在Outlook中编写一个VBA宏,这将做到这一点,并从文本(或其他)文件输入到我的后台数据库也是一个简单的任务,它只是与我正在努力的聚合器的交互。

任何和所有的帮助优雅地收到。

+0

http://phantomjs.org/ – DaveRandom

+0

有大部分脚本语言(Perl中,蟒蛇红宝石)一个机械化库,但那些通常不与微软产品发挥很好。或者你可以尝试用.NET语言来完成它,但这将会是一团糟。 – pguardiario

+0

大的问题,我一直在刮网页约两年,我从来没有做过任何复杂的,很想看到的解决办法+1 – 2016-02-03 16:41:58

回答

相关问题