2008-09-23 45 views
1

我正在解析包含标题的文本,然后解析适用于该标题的数据。我需要将每个数据字段分组,并且标题也适用于这些组。这里有一个例子:在组中重复标题

(更新:下面的文本已更新,以更好地反映其当前的布局,并指示注释。)

 
Heading 1 
Heading 2  Heading 3 
(Group 1) 
data1 data2 
data3 data4 
data5 
(Group 2) 
data1 data2 
data3 data4 
data5 
(Group 3) 
data1 data2 
data3 data4 
data5 
** The headers become different values here *** (this is not part of the data) 
NewHeading 1 
NewHeading 2  NewHeading 3 
(Group 4) 
data1 data2 
data3 data4 
data5 
(Group 5) 
data1 data2 
data3 data4 
data5 
**etc 

输出应该是这样的:

 
(Group 1) Heading1 Heading2 Heading3 data1 data2 data3 data4 data5 
(Group 2) Heading1 Heading2 Heading3 data1 data2 data3 data4 data5 
(Group 3) Heading1 Heading2 Heading3 data1 data2 data3 data4 data5 
(Group 4) NewHeading1 NewHeading2 NewHeading3 data1 data2 data3 data4 data5 
(Group 5) NewHeading1 NewHeading2 NewHeading3 data1 data2 data3 data4 data5 

标记的区域(组1-5)只是该行的标签,它们并不意味着是返回集的一部分。更改为“NewHeading”的标题仅表示标题值已更改,并应应用于其后的数据。

在过去的几个小时里,我已经做了一些阅读,看看这叫什么,但我没有任何运气。有任何想法吗?这是为.Net正则表达式引擎。

更新:添加了注释,并显示标题改变了文件。 我也做了一些研究,并相信我可以通过两种模式来完成一件简单的事情。一个用于标题,一个用于数据。然后,我可以将标题和数据匹配索引(即:在文件中找到它的位置)相互比较并将它们组合在一起。

回答

2

1)逐行循环。这不是正则表达式的地方

2)你真的需要澄清你的问题。不清楚是否(组1)和**标题在这里变得不同**是您的输入的一部分,或者您是否注释它。

+0

感谢您的反馈!我会给这几个小时来看看是否有任何散兵有好的想法。如果没有,我会给你答案。这是你应得的。 – user13810 2008-09-23 20:20:05