2
我想解析perl中的pdf文件中的文本,而无需将pdf转换为任何其他格式。可能吗 ?是否可以使用Perl读取pdf文件中的文本?
我想解析perl中的pdf文件中的文本,而无需将pdf转换为任何其他格式。可能吗 ?是否可以使用Perl读取pdf文件中的文本?
是的,你可以。请参考CAM::PDF包。
您可以使用此模块将文本拉出。
my $pdf = CAM::PDF->new($filename);
my $pageone_tree = $pdf->getPageContentTree(1);
print CAM::PDF::PageText->render($pageone_tree);
删除我的,你的是更好的包。 – Powertieke 2010-10-29 12:42:38
看到http://stackoverflow.com/questions/1136990/how-can-i-extract-text-from-a-pdf-file-in-perl – 2010-10-29 06:37:42