2011-02-02 25 views
2

我有一个pdf文档,我想从该pdf中提取一些随机单词并保存(索引/标记)。然后,我将这些单词用作该pdf文档的可搜索标签。请注意,我不能直接使用pdf文档来搜索单词,我必须转发为该文档创建的标签。 是否有任何图书馆可以从pdf中获取这些词语?这是我的Mac应用程序所需要的。如何在可可中编制索引pdf文档

谢谢。

回答

0

你可以试试Spotlight Query或打开PDF文件PDFKitsearch manually

注意:我并不完全清楚您的意思是“我想从该PDF中提取......”和“我无法直接使用pdf文档搜索一个词”......两个似乎是相互排斥的。

更新

你一直说“随机单词” ......你从字面上的意思是你想a)在文件随机选择词作为标签使用,b)检查,看是否有来自已有列表的单词在文档中,或者c)查找“任何重要和有趣的单词”?

如果您的意思是“c”,则使用SearchKit to build the index in memory

+0

我必须从pdf中提取一些随机单词并将它们用作该文档的标签。我会将这些文字作为pdf的标签发送给服务器。接下来,当客户想要搜索文档时,当他输入一个单词时,我必须将该单词发送到服务器,该服务器将在所有pdf文档的标签中搜索该单词。这是要求。但我很困惑如何从PDF文档中获取随机单词。有没有什么可以做到这一点,或者我有写我自己的算法来做到这一点。 – 2011-07-07 06:14:19

相关问题