2013-03-03 55 views
0

我有内容的文件:如何从文件中读取html?

<!DOCTYPE html> 
<html>  
     <head>  
      <title>Hello, w3c validator!</title>  
     <head> 
     <body>  
      <p>Hello again!</p>  
     </body> 
</html> 

如何阅读在Java中该文件并发送到验证,W3C?

+0

你的问题不是很清楚了吗?您想做什么? – 2013-03-03 13:17:19

+0

@Kata我认为他需要在JAva中做一个小程序,作为输入获取HTML文件,并随着输出提供文件上的w3c验证输出...我是否愿意Relrin?你到目前为止尝试过什么吗? – araknoid 2013-03-03 13:25:43

+0

@araknoid absolutly – Relrin 2013-03-03 13:36:12

回答

1

你所寻找的是一个Java程序是:

  1. 输入:HTML文件
  2. 阅读HTML文件
  3. 验证文件(W3C验证)
  4. OUTPUT:验证输出

对于第1点和第2点,你可以给战俘中的另一个帖子一个战利品:Reading entire html file to String?

对于点3,你可以检查Markup Validator Web Service API对于如何与W3C的HTML验证的规范,但是这是他们在说什么:

Note: Please be considerate in using this shared, free resource. 
Consider Installing your own instance of the validator for smooth and fast operation. 
Excessive use of the W3C Validation Service will be blocked. 

所以我的建议是阅读这篇文章,以更好地理解你可以做什么,如果你能在Java Programa它里面集成:

Installation information for the W3C Markup Validator

+0

我正在尝试使用rexsl-w3c,它将数据发送到此站点。如果获取有关我的页面无效的信息 - 打印错误,但总是在控制台应用程序中获得“0 0”,并且我不知道为什么... – Relrin 2013-03-03 14:13:55