我有大量MSWord文档(大约40,000),它们是mailmerges(相同主文档,不同数据源)的结果。以编程方式从邮件合并Word文档检索MergeField值
其中一个合并字段是文本字段,可以有文本“是”或“否”。
是否有一种简单的方法可以列出哪些文档将合并字段设置为值“是”? (我期待大约10,000个“是”的文档。)
我会对任何方法感兴趣,无论是使用Word本身,Office自动化,hexdumping二进制文件和grep对于某些魔法,或任何现成的工具(Perl脚本,.NET应用程序等),可以做这种事情。
这些文件位于可从Linux和Windows盒子访问的网络共享中(如果需要,我可能会盗用一段时间的Mac),所以我并不担心工具在哪个平台上运行。
是的,这是我的评估情况在时刻。我正在考虑使用wvWare作为二进制处理器选项或VBA路由。我希望有人可以a)对现有工具/ VBA脚本的建议,或者b)关于二进制格式的外观的一些文档。 – Stobor 2009-07-23 00:38:19