任何人都可以请帮我这个正则表达式,因为我不知道如何实现它。PHP正则表达式取下字符串包含非字母的单词/数字
我需要一个正则表达式来删除字符串中至少包含一个不是UTF-8字母或数字的字符的所有单词,或者在单词的中间(但不在末尾)标点符号。
实例:
This is ®Aix string
A bad str?ng is here
第一个例子包含®
,这不是一个字母,数字或标点。 第二个示例在中间包含标点符号。
我需要删除这些不好的话,但保留完整的字符串的其余部分。例如。 This is string
,A bad is here
。
请注意,A bad string? is here
将不包含任何坏的话,因为标点符号是在单词的末尾。
非常感谢您的帮助。
你有其他语言,除了英语?因为'UTF-8字母或数字'需要http://www.php.net/manual/en/regexp.reference.unicode.php,这可能在任何地方都不受支持。 – Cheery 2012-02-25 07:59:44
可以包含重音字符,包括重音符号在内的任何拉丁字母。但东方,俄罗斯,希腊等字符可以排除在外。 – Alasdair 2012-02-25 08:28:15