2
我想写一个支持cookie存储操作和会话的抓取程序。 Java无头浏览器有两种不同的实现。 HtmlUnit有更好的JavaScript支持和可能的HTML解析。但是是否有任何理由使用HttpUnit来实现爬虫?HtmlUnit与HttpUnit的性能对比
我想写一个支持cookie存储操作和会话的抓取程序。 Java无头浏览器有两种不同的实现。 HtmlUnit有更好的JavaScript支持和可能的HTML解析。但是是否有任何理由使用HttpUnit来实现爬虫?HtmlUnit与HttpUnit的性能对比
有一个相关的文章here,从一个HtmlUnit开发者。
它基本上说,除了Javascript的支持,HtmlUnit是更高层次的HttpUnit。 HtmlUnit似乎也更加积极地开发(2014年有2个版本,而HttpUnit自2008年以来未更新)。
[cockies](http://www.urbandictionary.com/define.php?term=cockie)哈哈:))仔细打字的 –
我怀疑你会发现任何性能比较。这些并不是针对速度进行优化的:他们的目标主要是实现不需要最高性能的单元测试。自己衡量,但网络肯定会成为瓶颈,而不是Java代码。 –
我为我的应用程序使用HTMLUnit,我基本上通过禁用CSS,从源代码中删除Java applet和ActiveX来加速实施。 – Lee