2013-10-19 37 views
0

我想使用org.apache.commons.io库java下载PDF链接。 我想下载'https://----------------.pdf'intp pdf文件,当我运行下面的java类时,它会在我的磁盘上创建目标pdf,但我无法打开或阅读该pdf。它引发错误文件损坏或无法读取。无法使用org.apache.commons.io java库下载pdf链接

如果有人会检查我的代码中出现了什么问题,以及如何将pdf链接下载到pdf文件,我将不胜感激。

import java.io.File; 
import java.io.IOException; 
import java.net.URL; 

import org.apache.commons.io.FileUtils; 

public class Simple { 
    public static void main(String[] args) { 
     try { 
      URL url = new URL("https://docs.google.com/**********.pdf"); 
      File destination = new File("kodejava.html"); 

      // 
      // Copy bytes from the URL to the destination file. 
      // 
      FileUtils.copyURLToFile(url, destination); 
     } catch (IOException e) { 
      e.printStackTrace(); 
     } 
    } 
} 
+0

你为什么要将.pdf文件保存为.html文件? – Keerthivasan

+0

你检查过你的文件的内容吗? – mkl

+0

如果目标文件ID为pdf,它会创建但我打开它会抛出错误损坏的文件。 – user2897967

回答

0

您需要将您的文件保存为pdf而不是html.Try将下载的文件重命名为kodejava.pdf并打开。我可以下载它作为.pdf并打开它。

+0

我改为'kodejava.pdf',但创建pdf无法打开它会抛出错误损坏的文件 – user2897967

+0

我试过这个网站 - http://www.tutorialspoint.com/junit/junit_tutorial.pdf。有效。可能是你没有权限 – Keerthivasan

+0

它的工作原理是因为它以www开头。 ,以https://开头的网站无法正常工作 – user2897967