我正在寻找一种方式来HTML格式的文本转换为纯文本,同时保持它的基本结构,也许会稍微调整了,所以:HTML转换为纯文本,并保持基本格式
<p>This is a paragraph.</p>
<ol>
<li>List item 1.</li>
<li>List item 2.</li>
</ol>
<p>This is an <a href="www.google.com">anchor</a>.</p>
变为:
这是一个段落。
- 列表项1.
- 列表项2.
这是一个锚(www.google.com)。
关于如何有效实现大量HTML格式模板的任何想法?
- 请注意,结构外最重要的部分是保持锚点。
您应该考虑使用降价或其他轻量级标记语言 – Nicolas
这是目前非选择。我无权修改这些内容,但我需要以纯文本的形式进行修改。 :/ – rebelliard
随着[Pandoc(http://johnmacfarlane.net/pandoc/try)(哈斯克尔),你可以轻松地HTML源转换为标记语言。 – Nicolas