我一直在写一些代码到一个网站,并将HTML代码复制到一个文本文件。问题是一些代码被替换为“& nbsp”。 这是我使用的代码:如何在不用“ ”代替部分HTML代码的情况下使用java下载完整的网页?
public void addRecords() throws IOException{
URL google = new URL("Insert Website Here");
BufferedReader in = new BufferedReader(
new InputStreamReader(google.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null){
System.out.println(inputLine);
z.format("%s \n ", (inputLine));
}
in.close();
}
HTML中包含'' ,这是一个不可间断的空格HTML实体。 –