我想从使用Nokogiri的div中提取背景网址,但我无法解析它的背景网址。从红宝石中的HTML元素中提取背景图像
,同时寻找在计算器上,我发现这个链接
Parsing: Can I pick up the URL of embedded CSS Background in Nokogiri?
但鉴于有不工作的解决方案。
我想从使用Nokogiri的div中提取背景网址,但我无法解析它的背景网址。从红宝石中的HTML元素中提取背景图像
,同时寻找在计算器上,我发现这个链接
Parsing: Can I pick up the URL of embedded CSS Background in Nokogiri?
但鉴于有不工作的解决方案。
Nokogiri不是网络浏览器。它位于libxml2之上,提供对XML和HTML的快速和优秀的解析,以及对数据的操作和提取。
它只处理网页中的HTML。它不运行任何JavaScript。它不会将CSS应用于DOM。没有办法使用Nokogiri来查找应用于元素的CSS样式,除非它直接在该元素的style="..."
属性上。 (即使你需要使用其他东西,比如正则表达式来解析其中的CSS。)
你会想要使用其他的东西,比如由Ruby控制的无头浏览器, Watir或Selenium,如果你想处理一个网页,并像网页浏览器那样对待它。
感谢您的回复。 yest我也发现它不可能使用nokogiri。我会寻找替代解决方案。 –
添加一些html来查看,你想要解析什么 –
你可以做正则表达式来捕获所有的url。 – Nich