爱Python,我也是Python的新手。在社区(Antti Haapala等用户)的帮助下,我能够在一定程度上进行。但我最终陷入了困境。请帮忙。在进入我的大数据POC之前,我还有两项任务尚未完成。 (计划在超过100万条记录在文本文件中使用此代码)关键词搜索只是在文件的一列中,并在关键词前后保留2个字
•在搜索栏的关键字(C#3),并保持2个字前面和后面该关键词。
•将打印输出转移到文件。
•在这里我不想碰C#1,C#2参照完整性的目的。
非常感谢您的帮助。
我的输入文件:
C#1 C# 2 C# 3 (these are headings of columns, I used just for clarity)
12088|CITA|{Hello very nice lists, better to keep those
12089|CITA|This is great theme for lists keep it
所需的输出文件:(只在第3列或最后一列更改)
12088|CITA|very nice lists, better to
12089|CITA|theme for lists keep it
代码我目前正在使用:
s = """12088|CITA|{Hello very nice lists, better to keep those
12089|CITA|This is great theme for lists keep it """
for line in s.splitlines():
if not line.strip():
continue
fields = line.split(None, 2)
joined = '|'.join(fields)
print(joined)
BTW如果我使用关键字搜索,我正在查看我的第一和第二列。我的挑战是保持第一和第二列不变。并且只搜索第3列并在关键词/之前/之前保留2个单词。
为什么你不分裂的' '|'',如果这是你的列分隔符? – 2015-02-08 19:49:59
什么是关键词?这是“列表”,对吗?你为什么不在你的代码中使用它? – 2015-02-08 19:54:13
我必须拆分,因为我必须分开3列,并且仅在第3列中进行搜索。我不想在第1或第2栏中搜索。我只想在第三列中搜索。 (在第3列中搜索词前后加上2个关键词)。这有道理吗? – Murali 2015-02-08 19:57:24