比方说,我有一个分配有10个IP的squid代理服务器(本地在我的gigE网络上)。使用代理服务器与本地主要IP
而且我们也可以说我有一个分配给它一个不同的IP地址10,运行的是运行10个线程C#应用程序在不同的服务器,使用每个线程抓取网站。每个线程使用不同的分配IP来发送其HTTP请求。
我的问题是,如果我在该应用程序中运行10个线程,其中每个线程使用来自代理服务器的代理IP来抓取网站。而且我还在该应用中尝试了10个线程,其中每个线程直接在服务器上使用本地分配的IP来爬网。哪种方法可以更快地抓取站点之间的网页,使用代理IP的线程,还是使用自己的服务器使用直接IP的线程?
我会想象服务器上的直接IP,因为代理服务器有固有的延迟,但它证明代理服务器速度稍快。所以我很困惑。也许是因为使用直接IP使用一些处理能力,通过使用代理服务器,它可以将该处理外包给代理服务器?非常感谢帮助。
我们需要看到你的爬行代码 –