我想使用一些Ruby库解析网页(目录)并将其存储到数据库。目前,我很难选择什么样的图书馆最适合这种目的。我对Hpricot很熟悉,但我现在并不是很疼,现在它处于边缘。Ruby/Rails HTML页面解析
P.S或任何类型的数据来解析URL-s?
谢谢!
我想使用一些Ruby库解析网页(目录)并将其存储到数据库。目前,我很难选择什么样的图书馆最适合这种目的。我对Hpricot很熟悉,但我现在并不是很疼,现在它处于边缘。Ruby/Rails HTML页面解析
P.S或任何类型的数据来解析URL-s?
谢谢!
我认为HTML解析nokogiri open-uri是最好的。
为什么你在乎图书馆,“现在处于边缘”?如果你对Hpricot感到满意,那就使用它。不要把时间浪费在无休止的寻找上:只是开始编写一个程序。这是我的答案。
呵呵,我一直在寻找引述对此事角度来说,Hpricot作家,我发现此评论:
角度来说,Hpricot是黑客_why谁现在已经消失的工作。但 甚至在他失踪之前nokogiri超过了hpricot的表现。 他甚至啾啾“来电者问:‘我应该使用角度来说,Hpricot或引入nokogiri’如果 你不是我:使用引入nokogiri,如果你是我的。还有剪下来,停止 是我”?
这里是我引用的评论的链接: http://news.ycombinator.com/item?id=1955644
总结:与Nokogiri一起去吧。