2015-06-09 43 views
-4

我正在做一些类似检测网站语言。这是关于1k网站,所以我不能做1 1。我认为这样做,我需要通过python获取网站的HTML代码,并获取所有的文本,做分析。是否正确,有没有人做过这样的事情,这将是非常有帮助:)如何知道一个网站是否是非英语的?

+0

SO不是代码写入服务。请展示您的尝试以及您可能面临的任何错误。 – sgp

+0

http://stackoverflow.com/questions/4605062/detecting-whether-or-not-text-is-english-in-bulk 这可能有帮助 – Ajay

+0

你的意思是代码或内容?那些支持多国语言/ i18n的网站呢? – jonrsharpe

回答

0

谢谢大家回答,我找到了一个方法。通过列出网站的alexa排名和大多数访问者的国家。如果是美国或其他讲英语的国家,那么它是英文网站。

做了python。

相关问题