很简单的问题,我希望:没有人知道一个工具,将有效地刮去与微软矩阵建网站?我可以用Python语言编写的代码,但它会带我这样的时间比我想我要献给即因为矩阵产生非常糟糕和丑陋的HTML中的任务。微软Web Matrix的
我已经试过网络哈维,氦刮板,和我试过网站刮板插件的Chrome。 WebHarvey在HTML上ch咽,无法加载后续页面。 Helium Scraper能够从一个细节页面移动到另一个细节页面(后面的链接被遵循),但是来自细节页面的内容没有被取消。 Chrome插件网络抓取工具无法导航链接,弹出窗口显示错误页面。我的直觉告诉我,这与独特的ASP.net事情有关,但我可能是错的。
任何指针或建议理解。
你是一个很好的问题。请考虑添加有关您遇到的错误的更多详细信息。建议:Google“用于asp.net页面的屏幕景观工具”。请让我们知道你找到了什么! – paulsm4