2013-02-07 120 views
1

我的一页被窃听,我收到谷歌的一条消息,说它是印度尼西亚语。 这里是一个.txt链接,如果你想:http://lc-roleplay.com/account/actions/modelchange/modelchange.txt禁用非英文字符?

我可以以某种方式禁用所有非英文字母?

+2

什么是“被窃听”是什么意思? *“是越野车”*?所有页内样式和内联样式都有太多需要阅读的内容。所有验证错误都无助于http://validator.w3.org/check?uri=http%3A%2F%2Flc-roleplay.com%2Faccount.php&charset=%28detect+automatically%29&doctype=Inline&group=0 提示:对于HTML注释,“<!------- x”不是**和<! - x一样(两个破折号仅适用于开始和结束注释) 生成某些东西这个,还是你可以将样式移动到'.css'文件中? –

+1

您可以通过删除静态文档中的“禁用”字符。 – tadman

+1

印度尼西亚语是少数几种不使用基本拉丁字母A到Z以外的字母的语言之一,所以没有什么意义上的“非英语”字符会导致错误分类。 –

回答

3

不,你不能。

没有“英文字母”这样的东西。你所描述的是罗马字符,其中出现在英语中的52也出现在大多数其他语言中。

此外,许多英语单词都是用外来口音保留下来的,如咖啡馆,天真和外观。

您可以做的最好的方法是通过英文拼写检查运行您的输入,并拒绝任何具有给定百分比拼写错误的输入。

你可以强制ASCII编码,但不会阻止某人给你Unicode输入 - 它只是意味着它被不当解码(和看起来像废话)