我有一个类似2页长的文本文件,我需要编写一个正则表达式来提取以大写字母开头的单词。 ,我想获得(但不限于)有些词的例子是:以大写字母开头的单词的正则表达式
British Indian Ocean Territory
People's Republic of China Confederation of Independent States
French Southern and Antarctic Lands
Gilbert and Ellia Islands
Iraq-Saudia Arabia Neutral Zone
Juan de Nova Island
St. Vincent and the Grenadines
Trust Territory of the Pacific
Washington, D.C.
,我想出了正则表达式是:
"((?:[A-Z][a-z]+\\s){2,4}?) || ((?:[A-Z][a-z]+\\s){1,2}of(?:\\s[A-Z][a-z]+){1,2}) || ((?:[A-Z][a-z]+\\s){1,2}and(?:\\s[A-Z][a-z]+){1,2})"
恭喜。那对你有用吗? – 2013-11-26 18:54:31
那么......这个正则表达式有什么问题吗?如果是这样,什么? – ajp15243
你试图做的事情对正则表达式来说是不可能的,因为你似乎想要提取的不仅是单个单词而是表达式(例如:“中华民国独立国家联合会”)。请记住,不使用字典是不可能的。 –