2011-08-11 65 views
1

我们是一家运行jdk 1.6的java商店。最近我被要求调查软件,以便比较QA团队的两份文件。这不是一个编程式的练习,而是研究一种产品,它可以在我们现有的原始文档与从我们的代码生成的原始文档之间进行物理比较。文档比较软件

原因是我们最近升级了我们的文档处理软件:Windward Reports和QA希望确保新文档在所有方面都与旧版本完全相同。这包括布局和字体大小等内容。这些是对字体大小,类型等有要求的法律合同文件......他们已经有一个称为XTest的EMC产品,但我不知道是否有开源或其他商业产品可能会更好工作。

需要注意的是,由于文档存储在我们的数据库中,因此我们没有正式的文档存储库,并且我们有不同格式的超过2k个文档:word,excel,pdf和rtf。可能还有其他一些类型,如文本和csv。我认为这将是手动完成这项工作的真正挑战,但我不知道如何在没有编写大量代码的情况下自动执行此操作,所以我不认为这是一种选择。

  • 有没有人曾经遇到类似这样的事情?
  • 有关于此的任何想法或意见?
+0

我被告知我可以从代码编写的文档的一些基本比较检查,以尽量减少文件的数量手动比较,所以它看起来像我会毕竟写一些代码,但我一定要找出什么要求将是这样。我正在研究XTest的功能,看看有多少可以自动化。 –

回答

0

我们选择了混合解决方案。我发现XTest可以使用一些旧的文件格式和pdf,但不能使用RTF或甚至txt文件。所以我创建了一个实用程序,它将运行我们的旧iText代码或我们的新iText代码,方法是将我的实用程序分别指向每个代码库。我还发现上风报道使用iText。

我们用来生成pdf的rtf文件将不得不手动处理以进行比较,但文件的生成可以使用该实用程序完成,而不是让某人尝试通过代码手动执行该任务。 Xtest似乎非常适合处理PDF文件。

0

你可能会得到一些类似大学使用的剽窃软件。它应该找到文本中的所有相似性,但是我不确定它们是否检测到布局/字体大小。