2011-08-10 101 views
1

我想使用一些Ruby库解析网页(目录)并将其存储到数据库。目前,我很难选择什么样的图书馆最适合这种目的。我对Hpricot很熟悉,但我现在并不是很疼,现在它处于边缘。Ruby/Rails HTML页面解析

P.S或任何类型的数据来解析URL-s?

谢谢!

回答

3

我认为HTML解析nokogiri open-uri是最好的。

0

为什么你在乎图书馆,“现在处于边缘”?如果你对Hpricot感到满意,那就使用它。不要把时间浪费在无休止的寻找上:只是开始编写一个程序。这是我的答案。

0

呵呵,我一直在寻找引述对此事角度来说,Hpricot作家,我发现此评论:

角度来说,Hpricot是黑客_why谁现在已经消失的工作。但 甚至在他失踪之前nokogiri超过了hpricot的表现。 他甚至啾啾“来电者问:‘我应该使用角度来说,Hpricot或引入nokogiri’如果 你不是我:使用引入nokogiri,如果你是我的。还有剪下来,停止 是我”?

这里是我引用的评论的链接: http://news.ycombinator.com/item?id=1955644

总结:与Nokogiri一起去吧。