无法使用org.apache.commons.io java库下载pdf链接

我想使用org.apache.commons.io库java下载PDF链接。我想下载'https://----------------.pdf'intp pdf文件，当我运行下面的java类时，它会在我的磁盘上创建目标pdf，但我无法打开或阅读该pdf。它引发错误文件损坏或无法读取。无法使用org.apache.commons.io java库下载pdf链接

如果有人会检查我的代码中出现了什么问题，以及如何将pdf链接下载到pdf文件，我将不胜感激。

import java.io.File; 
import java.io.IOException; 
import java.net.URL; 

import org.apache.commons.io.FileUtils; 

public class Simple { 
    public static void main(String[] args) { 
     try { 
      URL url = new URL("https://docs.google.com/**********.pdf"); 
      File destination = new File("kodejava.html"); 

      // 
      // Copy bytes from the URL to the destination file. 
      // 
      FileUtils.copyURLToFile(url, destination); 
     } catch (IOException e) { 
      e.printStackTrace(); 
     } 
    } 
}

来源

2013-10-19 user2897967

你为什么要将.pdf文件保存为.html文件？ – Keerthivasan

你检查过你的文件的内容吗？ – mkl

如果目标文件ID为pdf，它会创建但我打开它会抛出错误损坏的文件。 – user2897967

您需要将您的文件保存为pdf而不是html.Try将下载的文件重命名为kodejava.pdf并打开。我可以下载它作为.pdf并打开它。

来源

2013-10-19 14:42:38 Keerthivasan

我改为'kodejava.pdf'，但创建pdf无法打开它会抛出错误损坏的文件 – user2897967

我试过这个网站 - http://www.tutorialspoint.com/junit/junit_tutorial.pdf。有效。可能是你没有权限 – Keerthivasan

它的工作原理是因为它以www开头。，以https：//开头的网站无法正常工作 – user2897967

无法使用org.apache.commons.io java库下载pdf链接

回答

相关问题