如果不使用任何外部库,将网站HTML内容获取到字符串中的最简单方法是什么?我曾尝试过,但我得到了完整的页面源,但我只想要HTML内容。如何仅获取Java中页面的HTML内容?
0
A
回答
0
我觉得有点难以实现这个我的朋友没有使用外部库。
你实际上想要执行Html的JavaScript部分,并且像一个无GUI界面的web浏览器programmaticaly。
如果你要使用外部库,我会去http://htmlunit.sourceforge.net/这很容易。
-1
String content = null;
URLConnection connection = null;
try {
connection = new URL("http://www.google.com").openConnection();
Scanner scanner = new Scanner(connection.getInputStream());
scanner.useDelimiter("\\Z");
content = scanner.next();
}catch (Exception ex) {
ex.printStackTrace();
}
System.out.println(content);
+1
我曾试过这个也会给出完整的页面源码 –
+0
上面的解决方案只下载未编译的源代码而不是生成的。 –
相关问题
- 1. 仅在HTML页面中计算内容
- 2. 如何获取html页面中未显示的内容
- 3. 从javascript页面获取HTML内容
- 4. 获取页面内容在Java
- 5. 仅从java中的url获取编码的html内容
- 6. Symfony问题:如何获取/阅读页面的HTML内容?
- 7. 如何从PHP生成的HTML页面获取正文内容?
- 8. 如何从XUL获取内容页面?
- 9. 如何获取页面内容
- 10. 如何从PAMIE获取页面内容?
- 11. 如何获取页面内容?
- 12. java:获取html内容
- 13. 如何使用jquery或ajax获取外部html页面内容
- 14. Ruby获取页面内容
- 15. 取从HTML页面内容表中iPhone
- 16. 如何从(内部)https页面中刮取html内容
- 17. 如何获取重定向页面的页面内容?
- 18. 如何获取登录页面后面的网页内容?
- 19. 如何缩小html页面的内容?
- 20. PHP:使用xpath()获取html页面中的内容
- 21. 提取HTML页面的特定内容
- 22. 用ajax读取页面的html内容
- 23. 如何获取Java库中的内容?
- 24. 在C++中获取页面内容
- 25. 如何获取url html内容到java中的字符串
- 26. 如何在Adobe AIR中使用JavaScript来获取页面的HTML内容?
- 27. 如何通过Java从特定的HTML页面检索内容
- 28. 如何仅使用javascript获取div的内容而不是整个页面
- 29. 如何在httpmodule中获取页面html?
- 30. 从html页面抓取内容
如果JavaScript和css(etc ...)嵌入在页面中,除了手动提取它之外没有其他办法。 –
网站上的Javascript可能与主HTML内容存储在相同的文本文件中。如果是这样的话,那么你只能强有力地修剪文本,就像@SteveSmith所说的那样。 –
如何通过代码手动提取 –