我基本上想要的是在行标题下的PDF数据或简化我所说的,我想从PDF文件创建一个数据库。每个PDF由25 -40页取决于选民的数量。 A page of pdf file I am talking about 我想从箱子中提取数据(或者不管你说什么他们)到Access/EXCEL/SQL使各盒 名称下名称列 关系出现关系列等出现在其他数据下 但是我不知道应该学习哪种编程语言才能做到这一点。我尝试过搜
我写了Python代码,从PDF文件中删除所有的数据。这里的问题是,一旦被刮掉,这些词会失去语法。如何解决这些问题? 我附上了代码。 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.la