2014-03-25 34 views
2

我想使用pdfminer来提取文本信息。我已经下载了pdfminer-20131113。我已经在C:\python34中安装了python。 现在使用cmd,我将路径设置为pdfminer的setup.py文件。 并运行以下命令。使用python安装pdfminer时出现语法错误

python setup.py install 

但我得到了下面的错误。

> D:\pdfminer-20101226>python setup.py install 
Traceback (most recent call last): 
    File "setup.py", line 3, in <module> 
    from pdfminer import __version__ 
    File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4 
    if __name__ == '__main__': print __version__ 
              ^
SyntaxError: invalid syntax 

这似乎是在pdfminer,我不知道如何解决setup.py文件中的一些错误。

另外,我在pdfminer的build文件夹中看到一个pdf2txt.py文件。我试图使用这也作为pdf2txt.py -o output.html pdffilename.pdf(完整路径)。但不是转换它。它打开pdf2txt.py文件。

+0

您忘记发布错误讯息。很可能,代码不是Python 3兼容的,需要Python 2才能运行。 –

+0

无关:不要使用'python setup.py install'。它不允许彻底卸载。改为使用'pip install ..'。 python 3.4 – jfs

+0

中包含'pip',它试图将它移植到Python 3:['pdfminer3k'](https://pypi.python.org/pypi/pdfminer3k) – jfs

回答

4

PDFMiner project homepage状态:

完全写在Python。 (对于2.4或更新的版本)

和进一步向下:

安装Python 2.4或更高版本。 (Python 3不支持

所以你必须安装Python 2来运行这个项目。

或者,您可以尝试Python 3 port, pdfminer3k;它在20个月内没有任何更新,而PDFMiner确实有更新的版本,所以你的里程可能会有所不同。

+0

好的。我会尝试2.7版本。 – Maverick

+0

谢谢。有效。 – Maverick

+0

@Martijin,你能帮我pdf2txt.py 我想运行pdf2txt.py pdffile.pdf 但它打开pdf2txt.py – Maverick