我想要一个读取文档中的文本并说它是用哪种语言(英语,西班牙语,...)的java代码。文件的格式并不重要。我希望输出是例如:“这份文件是西班牙文”。请以这种方式引导我,并给我一个示例代码。语言检测器
Q
语言检测器
1
A
回答
3
+0
*“**注意:** Google Language Detect API必须用于用户生成的语言检测。严格禁止任何类型的自动或批量查询。“* – 2012-02-06 16:24:40
0
的标准方法是建立n元模型的候选语言,然后建立目标文档一个类似的模型,并使用一个简单的比较,对参考模型编辑距离计算。 Gertjan van Noord的网站http://www.let.rug.nl/vannoord/TextCat/competitors.html可链接到您可以使用的多个图书馆。
0
language-detection库在Java中使用非常简单(请参阅示例代码)和健壮性。检测来自各种家庭的至少53种语言。
相关问题
- 1. 浏览器语言检测
- 2. 语言检测
- 3. 语言检测
- 4. ANN:语言检测
- 5. 检测Facebook语言
- 6. Solr语言检测
- 7. CLI语言检测
- 8. 检测iOS语言
- 9. jQuery的浏览器语言检测
- 10. 浏览器自动检测语言
- 11. 机器人自动检测语言
- 12. 在java中检测浏览器语言
- 13. Symfony 3,检测浏览器语言
- 14. 春:检测浏览器语言环境
- 15. 检测浏览器语言环境/语言并生成输出
- 16. 语言检测API/Library
- 17. 检测文本的语言
- 18. SOLR 4.1语言检测
- 19. 检测Android语言支持
- 20. 检测NSString的语言
- 21. 检测语言从RecognizerIntent
- 22. iPad检测键盘/语言
- 23. 的.htaccess的语言检测
- 24. 较短的语言检测
- 25. 检测编程语言
- 26. NLTK和语言检测
- 27. python网站语言检测
- 28. 蛮力语言检测
- 29. 检测输入语言?
- 30. CodeMirror - 自动检测语言
大多数文档格式将该信息嵌入其元数据中。对于纯文本文件,是的,你必须做一些魔术。 – 2012-02-06 16:20:21
这是问题解答网站,那么你的问题是什么,我建议阅读常见问题解答... – Nettogrof 2012-02-06 16:21:34
你需要根据所使用的单词使用猜测。我会为每种语言创建一个单词词典并尝试匹配它们。注:一些简短的文件可能是。 – 2012-02-06 16:21:37