所以我正在尝试读取HTML文件的内容以从特定网站上删除某些元数据。在可可模仿浏览器中发出HTTP请求
但是我遇到的问题是,使用可可库调用在objective-c中执行HTTP请求会给我一个不同的HTML文件,然后当我通过Web浏览器或我执行的python调用执行调用时。
这是令人讨厌的原因是我刮了一个在每个请求上生成的密钥。该网站似乎知道,当我通过可可而不是从python库或从浏览器执行请求时。
任何人都可以对此有所了解吗?
这里是下面的Python代码执行我:
self.url = 'http://sample-site.com/1?ax=1ts=123123.12'
request = urllib2.Request(complete_url)
response = urllib2.urlopen(request)
html_data = response.read()
这里是下面的可可尝试我试过:
NSString * completeUrl = [url stringByAppendingFormat:@"//%d?ax=1&ts=%1.2f", pageNumber, time];
的另一种尝试:
NSMutableURLRequest* request = [[[NSMutableURLRequest alloc] initWithURL:hypeURL] autorelease]; [request setValue:userAgent forHTTPHeaderField:@"User-Agent"]; NSURLResponse* response = nil; NSError* error = nil; NSData* data = [NSURLConnection sendSynchronousRequest:request returningResponse:&response error:&error]; NSString *hypeHTML = [[NSString alloc] initWithData:data encoding:NSASCIIStringEncoding];
可可的尝试正在检索HTML,但HTML包含的关键值我分析了每次刷新时生成的关键值。然而,在使用cocoa执行请求时,每次执行应用程序时键值都不会改变(HTML中的键值相同),在Python中,HTML正确地为每个请求使用不同的键。
感谢
请看看这篇博客我写的描述了这个问题:http://www.fzakaria.com/2011/03/hypemachine-cocoa-woes/ – Setheron 2011-03-23 18:30:53