2014-07-01 58 views
5

File.htmlHTML整洁的开始剥离空间

word<i><span> <span>ratti</span></span></i> 

命令

输出

word<i>ratti</i> 

所需的输出

word<i> ratti</i> 

空间在哪里?

登录

line 1 column 1 - Warning: missing <!DOCTYPE> declaration 
line 1 column 1 - Warning: plain text isn't allowed in <head> elements 
line 1 column 8 - Warning: <span> is probably intended as </span> 
line 1 column 5 - Warning: replacing unexpected span by </span> 
line 1 column 33 - Warning: discarding unexpected </span> 
line 1 column 40 - Warning: discarding unexpected </i> 
line 1 column 1 - Warning: inserting missing 'title' element 
line 1 column 8 - Warning: trimming empty <span> 
Info: Document content looks like HTML 4.01 Transitional 
8 warnings, 0 errors were found! 

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> 
<html> 
<head> 
<meta name="generator" content= 
"HTML Tidy for Linux/x86 (vers 1st November 2003), see www.w3.org"> 
<title></title> 
</head> 
<body> 
word<i>ratti</i> 
</body> 
</html> 
+0

似乎被整齐丢弃,你试过牢不可破的空间 ? –

+0

我无法对HTML做任何事情,它只是10K +行文件的样本,并且有成千上万个这样的文件,我无法编辑它们的HTML。在这种情况下,'tidy'应该有一个选项来保存空格。顺便说一句来回答你的问题,是的,它工作正常  –

+0

你可以尝试这个选项--add-xml-space是 –

回答

1

这个问题似乎已经在新版本中得到解决。我使用的是2003年的版本。我只是updated tidy on my machine与2009年版本和输出如下。

content: word<i><span> <span>ratti</span></span></i> 
command: tidy file.html 
output: word <i><span><span>ratti</span></span></i> 

所以它现在保留空间,但它不会删除span标签,反正这看起来像一个正确答案的问题。