我想创建一个能够确定一些文字是通过读取两个文件的文本,并比较他们两个文件之间进行复制的应用程序。我想知道是否有人曾试图做到这一点,以及处理这种情况的最佳方式是什么。如果涉及机器学习和自然语言处理:到什么程度?创建一个文件比较软件
2
A
回答
0
我相信Copyscape使用4克帮助确定唯一性。
这些字符串被称为N-Grams。
然而,another SO answer链接到language independent algo comparing bi-grams角色的基础上。它已经在Java中实现,这将有助于节省时间。
+0
谢谢。我正在检查它 – Goodman
1
相关问题
- 1. 文档比较软件
- 2. 文本文件比较软件
- 3. 软件来比较zip文件
- 4. 比较两个文件,并创建一个列表
- 5. 比较我创建的python文件
- 6. 比较文件创建日期
- 7. 软件比较标准
- 8. 我想为我们的软件创建一个.deb软件包
- 9. AWK比较一个文件与另一个文件
- 10. 我需要什么软件来创建一个Flash文件
- 11. 创建一个比较多个服务器中的多个文件的脚本
- 12. 文件比较
- 13. 文件比较
- 14. 文件比较
- 15. c#比较2个文件 - 创建和更新函数
- 16. 通过比较两个文件创建列表
- 17. 如何比较两个文件的创建日期?
- 18. 一次用Vista比较多个文件?
- 19. 比较2个文件一行
- 20. 比较2个文件一行
- 21. XMLDocument与另一个文件比较
- 22. 比较列在同一个文件
- 23. 比较一个文件名模式
- 24. 两个文件夹的文件比较
- 25. Excel - 比较两个文件?
- 26. 比较两个文件
- 27. 比较2个文件夹
- 28. 比较两个文件
- 29. 比较两个文件
你有没有试过'md5_file()'? – Karo
很多人都试过这个。 turnitin.com只是一个例子。 – emory
希望通过这两个文件 – Goodman