我的应用程序当前通过从远程机器通过共享磁盘复制文件系统树来读取数据,所以它从应用程序的角度作为文件系统深层复制工作。Java爬虫库 - 使用目录列表解析器下载递归HTTP子树
此解决方案有点限制,我还想通过http支持第二个选项 - 复制子树。
图书馆应该做一些像wget --recursive
这样的解析目录列表并使用它遍历树。
我找不到任何这样做的Java库。
我能够自己实现这样的功能(使用NekoHTML或类似的东西),但我不喜欢重新发明轮子。
是否有这样的库,我可以在我的应用程序内容易使用?
理想:
- 发表在Maven的中央仓库,因为我使用Maven为构建
- 与其他图书馆尽可能少依赖尽可能
- 不需要机器人排除支持 - 将在有限的操作仅限临时服务器组
谢谢。
注意:请张贴指向您个人使用的图书馆的主页的指针。
你有没有找到解决方案? –
不幸的是:( –