我正在致函履带图,并尝试下载链接“http://devonline.com/”。我一直在同一个链接上获得301重定向代码。如何避免重定向
如何避免此重定向和检索内容?
这是我做的请求(文件等于在 “/” 这种情况下):
String request
= "GET " + file
+ (file.endsWith("robots.txt") ? " HTTP/1.0\r\n" : " HTTP/1.1\r\n")
// " HTTP/1.1\r\n"
+ "User-Agent: " + CrawlerConfig.USER_AGENT + "\r\n"
// + ((!CrawlerConfig.SAVE_IMAGES) ? "Accept: text/html\r\n" : "")
// + "Accept: text/*\r\n"
+ (file.endsWith("robots.txt") ? "Connection: close\r\n" : "")
+ "Host: " + host + "\r\n" + "\r\n"/*
* + body
*/;
outStream.write(request.getBytes("US-ASCII"));
outStream.flush();
哪些内容?如果是重定向,则不太可能有任何有用的响应主体内容。 –
devonline.com很可能在他们的服务器配置中有规则来拒绝对看起来不像来自真正浏览器的请求的响应。 –
不要“避免”重定向;跟着它! – Chris