我有一个PDF文件,包含图层。从PDF文件提取图层为HTML
例如,在一些网页,还有图形,与点击(层)当对图的顶部显示的附加数据。
现在我需要尝试将所有这些层取出来的PDF文件,或者更确切地说,我需要从PDF文件中的所有数据,包括图层。 pdf文件包含javascript以适当地显示/隐藏图层。
什么是最好的方法?是否有任何工具可以用于我的意图?或者我应该自己写点什么? (如果这是可能的话)。
编辑:
在这里你可以下载PDF文件: http://www.2shared.com/document/IutUfDfr/OR_erasmus.html
观看的密码是:伊拉斯谟
的能力,这看起来我配不上。我正在尝试使用外部PDF库(itextsharp),现在我正在遍历每一页的部分,在PdfDictionary中收集该页面的内容。然后,我有点困... – Mortana