我正在用C#编写一个网页抓取程序。到目前为止,我已经能够登录到网站,保存cookie,并返回另一页的源代码。从这个源代码中,我得到一个链接,将我带到pdf中,但该页面不以.pdf扩展名结尾。在浏览器中,此页面显示pdf图像,浏览器中包含一个保存按钮。如何保存/下载pdf嵌入在网页中没有pdf文件名
我相信PDF页面是使用ColdFusion创建的,因为它在URL中具有.cfm,CFID和CFTOKEN。
如何以编程方式保存此PDF文件?
两个答案建议我将二进制流保存为pdf。我如何首先获取二进制数据?我曾尝试以下:
byte[] result;
byte[] buffer = new byte[4096];
WebRequest wr = WebRequest.Create(billURL);
using (WebResponse response = wr.GetResponse())
{
using (Stream responseStream = response.GetResponseStream())
{
using (MemoryStream memoryStream = new MemoryStream())
{
int count = 0;
do
{
count = responseStream.Read(buffer, 0, buffer.Length);
memoryStream.Write(buffer, 0, count);
} while (count != 0);
result = memoryStream.ToArray();
}
}
}
不那么我想结果保存为PDF,还是我做错了什么呢?
如果你不显示链接/按钮/无论如何它不可能帮助pyou。 – JotaBe 2012-03-29 22:14:14
由于该页面在登录后面,我无法真正显示直接示例。但这是一个水电费账单,在看过很多公用事业供应商的网站之后,似乎大多数人都以这种方式显示他们的账单PDF。也许检查你自己的水电费账单在网上找到一个例子? – 2012-03-29 22:30:01
http://support.microsoft.com/kb/307023? – Henry 2012-03-29 22:56:02