2014-04-27 26 views
0

每当我从PDF或网站复制表格组织的数据时,它通常在Excel中显示为空格分隔的值。当将空格分隔的值粘贴到Excel中时,它们都会进入同一列。当我想从数据中创建表格,对数据进行排序或基本上对数据执行任何操作时,这并没有什么帮助。这里有一个数据行的例子:将空格分隔的值从PDF导出为Excel作为制表符分隔值

100 04/01 10:00 PM 555-555-5555 SOME PLACE,CA XA/VE/AE 1:00 

这个数据是平板状组织在PDF不过,无论什么位置字段的长度,在下一列中的值都是一致的意思。例如,这是它会怎样看的PDF:

100 04/01 10:00 PM 555-555-5555 SOME PLACE,CA   XA/AE 1:00 
100 04/01 10:00 PM 555-555-5555 SOME OTHER PLACE,CA XA/VE/AE 1:00 

是否有一个快速的方式来获得的方式来获得这样经常看到成易于粘贴到Excel制表符分隔值的空间分隔的值?是否有一些格式可以让我在复制时将所有标签转换为空格?是否有可能提取复制时似乎丢失的标签的程序?

回答

1

Patrick,

(99%)PDF文件中没有选项卡。这是将选项卡式文本绘制到PDF中的很多方法,这使得无法将文本可靠地转换为列。

在PDF文件中的大多数文本是使用任一

通过MoveTo(X,Y)绘制; DrawText的( “你好”); MoveTo(x1,t1); DrawText(“Hello World”);

某些PDF将以这种方式单独绘制每个字符。其他人将把“你好W”和“orld”画成两个单独的单词。字符可以应用字符间距和字间距值以及缩放,旋转等。我已经看到了绘制文本的各种方式,这就是为什么您需要一个可靠的PDF到文本库才能获得最佳结果。 Proportianal字体也会导致很多问题。

即。没有快速的方法来从你的文本中获得列而不写一些奇特的代码。

Andrew。

+0

Darn,感谢您提供丰富的答案。我不知道这是如何绘制PDF中的文本。 – Patrick

相关问题