2015-06-15 77 views
0

我在使用Pandoc将降价源转换为其他格式时遇到问题。整个问题发生在markdown位于html时;当2个html标签之间有一些空格时,它不能正确转换。所以我需要的是检查整个降价源,并删除所有不同的 html标签之间的空格,例如2 删除html标签之间的空白php

这里是降价一些文本(Lorem存有)

<table> 
    <tr> 
    <td> here is some text</td> 
    <td>some other text</td> 
    </tr> 
</table> 

我使用的PHP Pandoc,所以我觉得当一个变量被读出降价的来源,可以匹配和更换与一些regex;更换后的输出应该是这样的:

这里是降价一些文本(Lorem存有)

<table><tr><td> here is some text</td><td>some other text</td></tr></table> 

所以就在><之间有没有别的比空白,空白应该被删除。

+0

使用正则表达式处理常规HTML注定会失败(HTML不是常规 - 正式语义)。个人的影响也[negative](http://stackoverflow.com/a/1732454/67392)。 – Richard

+3

你能详细说明你想要的原因吗?减价可能有一个很好的理由,不是为了消除这些空间,也许您的担忧可以用另一种方式解决?对我而言,听起来你正在做一些黑客来避免可能以更好方式解决的问题。 –

+0

我需要将某些模板从markdown转换为.rtf,因为我没有发现任何库可以做到这一点,PHP有一个解决方案将markdown转换为html并转换为rtf,pdf,..问题是,降价有内部HTML源,我需要在转换后的html, – jalco

回答

1

您可以使用CSS属性white-space:pre-wrap;。 空白将被浏览器保留。文本将在必要时换行,并在换行符

+0

'我在使用Pandoc将Markdown源代码转换为其他格式时遇到问题 - 您如何期待css使用pSpace解析带有空格的pandoc问题? – AD7six