在this topic响应帮助我理解为什么有时我 PDF未能找到一个词,为什么我继续使用 不同的PDF字数程序时获得不同的字数。我决定使用xpdf
。我将它转换为文本 并添加了-layout标记,然后用Word 2003打开生成的文本文件。 我注意到了单词计数。然后,我不幸地决定删除-layout标签。 虽然这一次,字数是不同的。获得一个PDF的权利字数文件
为什么标签会影响字数?是否有准确的方法来查找PDF文件的字数 ?我甚至会支付这样的软件,如果我只要它给我 正确的字数。
(我检查another topic但认为我会看看我刚才提出的可以解决一切的解决方案。有地方建议advancedpdf另一个话题。)
恳求并不完全是正确的方法:) – vulkanino 2012-03-01 14:33:26
PDFs的设计不是机器可读的。无论是更便宜的方法,都可以使用手动更正的OCR解决方案或雇用人员为您计算单词。 – Kos 2012-03-01 14:56:51
我想你们会告诉我,用户在OLD TOPIC中发布的信息是正确的,我应该支持它。我从那篇文章中得到的理解是,这些文字被计算在内,包括分裂成文字的文字。那么我想我会坚持这一个。谢谢! – user1242840 2012-03-01 16:35:38