我需要根据大文件中使用shell脚本最后一次出现的模式将较大的文件拆分成更小的块。例如。 Sample.txt的 NORTH EAST|0004|00001|Fost|Weaather|<br/>
NORTH EAST|0004|00001|Fost|Weaather|<br/>
SOUTH|0003|00003|Haet|Summer|<br/>
SOUTH|0003|00003|Haet
我有这个.xml文件: <docs>
<doc>
Some text
</doc>
<doc>
here some
</doc>
<doc>
text here
</doc>
</docs>
我试图用csplit可为了只拿到文本部分。这是我想出的。 $ csplit docs.xml '%^<docs>%1' '/^<\/doc/1' '{*}'
有什么工具可以做我想要的东西吗?我想分裂文件“一”在开始的@线,接着是文件名: $ cat one
@header
-- header --
@body
-- body --
@body isn't a split point
@footer
-- footer --
$ splitit one
$ ls
body footer header one
$ cat heade
我有一个包含近千个html文件的目录。每个文件都需要根据循环模式(标题)分成多个文本文件。我在一台Windows机器上使用GnuWin32工具。 我已经找到一种方法来做到这一点,单个文件: csplit 1.html -b "%04d.txt" /"Words in heading"/ {*}
但我不知道如何在整个一系列的HTML文件重复此操作。这样的:在一个无效的模式错误 for %i in