2011-08-28 25 views
2

我想写一个支持cookie存储操作和会话的抓取程序。 Java无头浏览器有两种不同的实现。 HtmlUnit有更好的JavaScript支持和可能的HTML解析。但是是否有任何理由使用HttpUnit来实现爬虫?HtmlUnit与HttpUnit的性能对比

+0

[cockies](http://www.urbandictionary.com/define.php?term=cockie)哈哈:))仔细打字的 –

+2

我怀疑你会发现任何性能比较。这些并不是针对速度进行优化的:他们的目标主要是实现不需要最高性能的单元测试。自己衡量,但网络肯定会成为瓶颈,而不是Java代码。 –

+0

我为我的应用程序使用HTMLUnit,我基本上通过禁用CSS,从源代码中删除Java applet和ActiveX来加速实施。 – Lee

回答

0

有一个相关的文章here,从一个HtmlUnit开发者。

它基本上说,除了Javascript的支持,HtmlUnit是更高层次的HttpUnit。 HtmlUnit似乎也更加积极地开发(2014年有2个版本,而HttpUnit自2008年以来未更新)。