我有很多(超过50个),在某些行(超过30/40每个文件)与格式不正确的XML文件:删除两个标记之间EOLS和空格在XML文件中
例子,这样的:
<TAG1>
<TAG_TO_FORMAT>
a_random_string
</TAG_TO_FORMAT>
<AN_OTHER_TAG_TO_FORMAT>
an_other_random_string
</AN_OTHER_TAG_TO_FORMAT>
<OTHER_TAG>pifpafpouf</OTHER_TAG>
</TAG1>
应该变成这样:
<TAG1>
<TAG_TO_FORMAT>a_random_string</TAG_TO_FORMAT>
<AN_OTHER_TAG_TO_FORMAT>an_other_random_string</AN_OTHER_TAG_TO_FORMAT>
<OTHER_TAG>pifpafpouf</OTHER_TAG>
</TAG1>
如果</TAG1>
之前,新的生产线仍然存在,不要紧,我的关键问题是,每个模式:<TAG>random_string</TAG>
必须在一条线上(random_string不包含EOL)
我在bash中找不到任何工具让我执行此操作,那么如何在bash中执行此操作? (或者在Python中,但我更喜欢bash)。
awk可能真的很有用,在这里,绝对值得使用谷歌搜索。我能得到的最接近的是'awk'/ $/{printf $ 0“”; next;} 1''。 –
James
2013-04-10 16:35:57
我建议使用'为 – enzotib 2013-04-10 16:49:45