2013-06-26 28 views
2

我得到这个错误“No/Root object! - 这真的是PDF吗?”使用我的MAC电脑与Python 2.7和PDFMiner版本20110515. PDF文件没有损坏,因为具有相同文件的相同程序在我的PC上运行!此外,我已经尝试了很多PDF文件,并且所有这些错误都存在。任何想法,我应该改变我的MAC不会得到这个错误?Python PDFMiner error:“No/Root object! - 这真的是PDF吗?”

+1

版本PDFMiner的20110515是一个Beta版本,所以它可能有错误。幸运的是它是纯粹的Python,它可以帮助调试变得更容易。你所描述的问题可能是由于在解析文件中处理行尾的方式。确保它们以二进制模式打开,即'fp = open('mypdf.pdf','rb')'。在问题文件上运行附带的'dumppdf.py'工具也可能会有所帮助。最后,错误可能是由于Python解释器因机器而异。通用换行支持不适用于所有版本的Python。 – martineau

回答

2

我找到了问题的根源:

我不得不读目录中的所有文件,并分析它们的方法。事实证明,我在该目录中有一个不是pdf文件的隐藏文件!

这里是我固定的问题:

for filename in os.listdir(INPUT_DIR_NAME): 
    if filename.endswith('.pdf'): 
     #do stuff!