列表“匹配的号码”我有一个文件中的文本格式如下:创建使用python
[NP mr. speaker ] , [NP mr. vice president ] , [NP members ] [PP of ] [NP congress ] [NP my fellow ] [VP americans ] : [NP today ]
我想获得与显示使用NP的它匹配的数量列表,按降序排列。要清楚,文中可能有很多NP,[NP先生。说话人]可能会在文中出现5次,[NP先生。副主席]可能会在文中出现6次......等等。我想找到所有这些比赛的频率。
输出应该像这样:
6 [NP mr. vice president ]
5 [NP mr. speaker ]
等
任何想法如何去了解呢?我很确定python中的正则表达式会有所帮助,但我迷失于我的表达应该看起来像以及如何将这些匹配放在列表中。
正在使用python的一个要求,或者只是你认为可能会帮助你的东西? –
python不是必需的,shell工具可以工作 – user2951046