0
我正在寻找处理PDF文件(或使用直接链接)的方法。R Studio:使用PDF文件或HTML文件提取信息
我必须处理文件PDF文件以提取有关公司财务报表的信息,并且我希望直接处理文件。可能吗?我是否将PDF转换为文本文件?之后,是否可以搜索该文件的特定信息?
我在问所有这些东西是否可行以及如何去做。
感谢
我正在寻找处理PDF文件(或使用直接链接)的方法。R Studio:使用PDF文件或HTML文件提取信息
我必须处理文件PDF文件以提取有关公司财务报表的信息,并且我希望直接处理文件。可能吗?我是否将PDF转换为文本文件?之后,是否可以搜索该文件的特定信息?
我在问所有这些东西是否可行以及如何去做。
感谢
好像有一个叫pdftools包PDF工作。但是你需要将它解析为JSON。有小教程: http://ropensci.org/blog/2016/03/01/pdftools-and-jeroen