2012-01-07 195 views
0

我想从网站获取响应,这些网站只需输入一个简单内容,这也反映在url的参数中。简单地使用常规方法得到结果比较好,例如OpenURI.open_uri(...)带有一些参数集,或者最好使用机械化,提取表单并通过提交得到结果?使用机械化

mechanize页面提供了一个提取表单并提交它以从Google搜索中获取搜索结果的示例。但是,这可以简单地做为OpenURI.open_uri("http://www.google.com/search?q=...").read。我应该尝试使用某种方式还是有其他原因?

回答

1

有很多网站最容易使用机械化。如果您需要登录并在访问数据前设置cookie,那么机械化是一种简单的方法。同样,如果有很多需要匹配的隐藏字段(比如CSRF标记),那么使用机械化获取页面,然后使用填充的数据提交页面通常是一种更简单的方法,可以自己制作URL。

如果它是一个简单的URI,比如谷歌的搜索页面,那么手动构建它可能会更简单。