我必须从file1中基本去掉一段文本。该文件1是巨大的数千行(〜3GB大小)。块看起来如下,使用python从文件中剥离一段文本
line 1
line 2
<pattern1> {
...
...
...
}
<pattern2> {
...
...
...
}
我基本上是想在大括号之间写出线的块“{}”中的文件,我试图模式匹配的每个条目(模式1, pattern2)读取该行时。我通过另一个文件(file2)给出了一个模式列表。 所以我想到了我的逻辑(不是代码,但想法)下面的东西,但没有信心。有人可以澄清什么是解决这个问题的最好方法吗?
- 打开file2并获取要匹配的字符串模式。
- 打开file1并开始搜索file2中每个字符串模式的行。
- 一旦找到,启用该标志并开始将大括号之间的行写入输出文件(比如file3)。
- 一旦遇到大括号,取消设置标志并停止写入文件(file3)。
file2中只有一个模式吗? – Prune
是否有嵌套的大括号? – dawg
不是在file2中有多个模式,这就是为什么我把它称为pattern1/pattern2(例如,像100个这样的模式),是的,我试图写出的块内嵌套大括号。 – Sreeder