我有一个文件中的文档列表。基本上由普通话和英文文件组成的TDT2语料库。我只想保留英文文件并删除普通话文件。手动这样做会很长,因为文件很大。在Python中删除文件中的特定行
结构看起来是这样的:
<ONTOPIC topicid=20001 level=YES docno=VOA19980630.1800.3165 fileid=19980630_1800_1900_VOA_ENG comments="NO">
<ONTOPIC topicid=20001 level=BRIEF docno=VOM19980220.0700.0559 fileid=19980220_0700_0800_VOA_MAN comments="NO">
<ONTOPIC topicid=20001 level=YES docno=VOM19980220.0700.1159 fileid=19980220_0700_0800_VOA_MAN comments="NO">
所以我想删除它在他们的fileid一个“人”的文件。 如何在Python中执行此特定任务?
因此这些线是一个文件的内容,你想输出中具有“ENG”行?如果我发布了答案。 – garg10may