2011-06-01 86 views
3

我有一个网页抓取工具可以解析来自网站的html,我正在为它编写测试。使用RSpec和rails测试“HTML fixtures”

我试图测试的类收到一个Nokogiri HTML对象,并从中提取所需的数据。像往常一样,html可能会有所不同,有时元素将会丢失或者什么都不会。我需要测试这些不同的情况。

所以我想要做的是制作一堆html文件,每一个都代表一个特定元素缺失的情况等。对于每个html文件,我希望也构建一个关联的数据散列,我会假设刮刀正常工作,希望刮刀提取。

因此,我想编写一个测试,它将迭代这些html文件,并将被测试类所提取的数据与预期数据进行比较,并报告它是否正确。

有关如何做到这一点的任何建议?

回答