我试图格式化XML文档后拆分XML字符串,所以我传递一个字符串到的方法,如:使用正则表达式之前和比赛
"<foo><subfoo><subsubfoo>content</subsubfoo></subfoo><subfoo/></foo>"
而且我试图分裂它基于找到标签。我想每一个元素(标签或内容)分割成唯一的字符串,如:
"<foo>", "<subfoo>", "<subsubfoo>", "content", "</subsubfoo>", "</subfoo>", "<subfoo/>", "</foo>"
,并为此我使用的代码:
string findTagString = "(?<=<.*?>)";
Regex findTag = new Regex(findTagString);
List<string> textList = findTag.Split(text).ToList();
上面的代码工作正常,只是它不“内容”分割成其自己的字符串,而不是:
"<foo>", "<subfoo>", "<subsubfoo>", "content</subsubfoo>", "</subfoo>", "<subfoo/>", "</foo>"
有没有办法重写正则表达式acomplish到自己的字符串此,非匹配的分裂?
或者,改写:是否可以在正则表达式匹配之前将AND拆分为字符串?
你为什么要这么做?什么是最终目标?有可能更有效的方法来做到这一点。 – 2012-07-10 18:50:51
我只是试图创建一个包含每个标签或元素的组,以便我可以格式化它们并将它们放入FlowDocument以加载到RichTextBox(WPF)中。这正是我打算将其分解成多个部分的原因,以便我可以检查,格式化和插入这些部分。 – Canin 2012-07-10 19:01:12