1

我正尝试创建一个从PitchforkMedia.com获取专辑分数的rails应用程序 例如,我想要抓取score 8.0 from this album,如下图所示。从任何网站获取字符串值的片段

在我的简短研究中,我遇到了类似的问题asked from asp.net point of view

一般来说,答案使用HTTP请求

  • 解析HTML源
  • 识别周围的变量特有的标志得分
  • 一些答案与使用内置的ASP就建议

    1. .net功能。

      在Ruby或Ruby on Rails中是否有等价的函数? 或者有人可以建议一些其他方式做我想做的事情?

      任何建议将不胜感激。谢谢。

      编辑1:这完全是个人使用和教育。假设从网站的数据挖掘没有法律上的分歧。

      enter image description here

    回答

    1

    在开始屏幕抓取数据之前,您需要确保您正在阅读网站的使用条款,特别是如果它不是用于个人用途。

    这是干草叉的使用条款的一部分,其他大多数网站都有类似的内容。

    “如果Pitchfork不是所有者,未经Pitchfork或其所有者明确书面许可,严禁以任何目的复制,复制或再分发本网站的材料或设计元素。”

    屏幕抓取绝对属于这一类。

    +0

    这完全是个人使用和教育。它甚至不必是Pitchfork Score。如果从Pitchfork获得分数会让你感到困扰,比如说我想从维基百科页面获取丘吉尔的出生日期。 –