2010-05-15 42 views
0

我试图将富文本字符串转换为纯文本或html。我目前使用的RichTextBox.Text功能几乎可以在所有情况下正常工作,除非文本包含反斜杠,否则某些文本会被剥离,因为转换器认为它是rtf格式的一部分。有没有人有任何想法如何让反斜杠停留在这种情况下。 下面是一个字符串的一个例子,我将不得不将包含反斜杠的富文本转换为纯文本或html

{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 Arial;}}\viewkind4\uc1\pard\fs17 Testing Export \with comments\par} 

我需要将“测试导出\与评论”,我从RTF转换找回的文字是“测试导出注释”中的文本。任何帮助将不胜感激。如果您还有其他问题,请回复。

+0

你使用什么语言?它应该转义为'\\\',这就是我用.net/vb6 Richedit组件看到的。 – 2010-05-15 14:11:46

回答

0

我认为转换器是正确的。 RTF文本中的真实反斜线应该被转义(例如,到\\)。我相信你所得到的是,RTF根本就不是有效的。

惠斯特,你可以尝试了做一个正则表达式将其固定于输入取代了双机一个不属于valid control words一部分的任何反斜杠,这似乎很脆弱,会出问题,如果有人添加了一个序列的文本一个有效的控制字。唯一的安全方法就是修复任何产生RTF的东西,以便正确地逃避反斜杠。

+0

这就是我所害怕的。不幸的是,我无法修复创建数据的原因,因为这是我们试图转换的所有旧数据。感谢您的帮助。 – Allison 2010-05-15 16:41:30