源代码管理系统的算法？

Patience Diff是找到两个文件有可能是有意义的人与人之间的增量好的算法。这通常会比天真的“最长的公共子序列”算法获得更好的结果，但结果是主观的。尽管如此，许多现代版本控制系统在每个阶段存储完整的文件，并且仅在需要时才计算实际差异。对于二进制文件（这可能不是非常可压缩的），您可能会发现存储反向增量可能最终会更有效。

来源

2010-04-18 05:18:13

这很酷。 LCS算法家族仍然是一个变体，但它是一个非常漂亮的改进。 – JasonTrue 2010-04-18 05:40:13

有趣！（垫，垫......） – 2010-04-18 06:26:02

基因迈尔斯写了一篇很好的论文An O(ND) Difference Algorithm and its Variations。谈到比较序列，迈尔斯是男人。您可能还应该阅读Walter Tichy关于RCS的论文;它解释了如何通过存储最新版本和差异来存储一组文件。

来源

2010-04-18 06:02:51

存储增量（向前或向后）的想法在版本控制方面很经典。问题一直是，“你存储哪个三角洲？“

很多源代码控制系统存储基本上由”diff“计算的增量，例如，最长公共子序列的面向行的补充。但是，您可以按特定于这些文档的方式计算特定类型文档的增量，以获得更小（并且通常更容易理解）的增量

对于编程语言的源代码，我们可以计算程序结构上的Levenshtein距离，可以在这里找到一系列用于各种流行编程语言的工具。 Smart Differencer

如果您要存储非文本文件，您可能可以利用其结构来计算s麦芽三角洲。

当然，如果你想要的是一个最小的实现，那么仅仅存储每个文件版本的完整图像是很容易的。太字节磁盘使得该解决方案如果不美观可行。（PDP10文件系统用于隐含地执行此操作）。

来源

2010-04-18 10:03:29

源代码管理系统的算法？

回答

相关问题