2012-11-14 53 views
0

我的工作场所将客户端记录保存在可通过本地网络上托管的aspx应用程序访问的数据库中。该页面允许登录,简单搜索和检索显示在该网页上的信息。我正在执行的任务要求我访问每条记录,将一段文本复制到我们正在创建的新数据库中,并移至下一条记录(成千上万次)。通过aspx应用程序访问远程数据

我的问题是,有没有一种方法可以自动执行此操作?我查看了浏览器宏,但搜索每条记录的任务不允许使用简单的宏接口。我希望能够编写一个不需要浏览器就直接与aspx应用程序交互的程序。在代码中,我将能够告诉应用程序哪些记录(例如按日期或唯一ID),并让aspx应用程序返回我需要的相应文本字段。我没有到ASPX应用程序(它是一个第三方,专有应用及其开发者是没有兴趣帮助我完成这个任务)

  1. 可以这样做任何后端访问?
  2. 如果是,广义上说,我应该看什么样的解决方案?有没有更适合这项任务的特定语言?

任何帮助表示赞赏。我意识到这个问题有点模糊和广泛,但第三方应用程序只在本地托管,所以我不能举一个例子。我知道有一点红宝石,并且遇到了机械化的宝石,看起来它可能会工作......但我找不到很多关于与asp.net交互的东西

+0

为什么不直接访问数据库?脚本化应用程序以从您拥有的数据库中检索数据的行为似乎过分Rube Goldberg。 – andleer

+0

同意。非常Rube Goldberg。不幸的是,如上所述,数据库和应用程序是专有的(第三方),我无权访问后端。 – Jason

回答

0

您正处在红宝石机械化的正确轨道上。机械化会跟踪你的cookies并使其易于提交表单(登录,asp doPostBack操作)。试一试,如果你遇到困难,请在新问题中发布具体内容。

+0

谢谢。我已经对Mechanize做了一些更多的阅读,我同意这是一条路。看起来这将是很多工作。对于这个问题的其他人,我发现了一个关于机械化,拼凑和编码的很好的教程:http://ruby.bastardsbook.com/chapters/web-scraping/ – Jason

+0

我对这篇教程并不感兴趣。对于专门用ruby机械化抓取asp页面,请考虑[从这里开始](http://scraperblog.blogspot.com/2012/10/asp-forms-with-dopostback-using-ruby.html)*自插件。 – pguardiario

相关问题