2011-12-13 54 views
0

我写了一个脚本,通过一个文件夹进行搜索,让我知道什么PDF字体有(快速的方法来知道它是否被OCR'd除非有人有更好的人知道)脚本来搜索文件夹OCR的PDF文件

我不能在我的脚本上做它是为了搜索主DIR中的所有文件夹?

有什么想法?

!/bin/bash 
SAVEIFS=$IFS 
IFS=$(echo -en "\n\b") 
PDFDIR=/home/user/Temp/Docs/*.pdf 
for f in $PDFDIR 
do 
echo "******************PDF***********************" 
pdffonts $f 
echo "$f" 
echo "******************PDf***********************" 
done > output.txt 
# restore $IFS 
IFS=$SAVEIFS 

回答

0

改变这一点:

PDFDIR=/home/user/Temp/Docs/*.pdf 
for f in $PDFDIR 

这样:

PDFDIR=/home/user/Temp/Docs 
for f in $(find $PDFDIR -type f -name "*.pdf") 
+1

遍历找到输出一个for循环如果他的任何文件包含空格将会中断。 – jordanm 2011-12-13 23:53:12

2

你会做的更好使用find

find /home/usr/Temp/Docs -name \*.pdf -exec echo "***PDF***" -print -exec pdffonts {} \; -exec echo "***END PDF***" \; 
+0

这不会显示pdffont输出:-( – Grimlockz 2011-12-14 11:26:53