我想以编程方式确定的语言,一个网站的内容被写入了数据。如何以编程方式确定一个网站的内容被写在
是进入我的脑海里唯一的一点是要比较的内容是什么语言该网站带有一些特定语言通用的单词集合,并根据匹配百分比确定语言。
有没有更好更强大的方法来解决这个问题?
我想以编程方式确定的语言,一个网站的内容被写入了数据。如何以编程方式确定一个网站的内容被写在
是进入我的脑海里唯一的一点是要比较的内容是什么语言该网站带有一些特定语言通用的单词集合,并根据匹配百分比确定语言。
有没有更好更强大的方法来解决这个问题?
神经网络教程,语言基于字母的平均频率分类例如 http://fann.sourceforge.net/fann_en.pdf
的如果你可以使用一个API(而不必编写自己的),看看这个特殊的回答了这个问题:https://stackoverflow.com/questions/6151668/alternative-to-google-translate-api/8121813#8121813
报价:
如果你只需要语言检测,你可以使用免费的网络服务:
它与谷歌兼容翻译API请求/响应格式。
但是,如果目标是翻译文本以及找到其语言,那么这里的资源是有用的;然而,提问者似乎只对找到某些文本的自然语言感兴趣。 –
我链接的特定答案提供语言检测。 – Kevin
可能重复[语言如何检测工作?](http://stackoverflow.com/questions/7670427/如何做,语言检测工作) –
或[自动确定网站页面的自然语言给定其URL](http://stackoverflow.com/questions/1167262/automatically-determine-the-natural-language-of -a-website-page-given-its-url)或其他一系列问题。 –