2016-03-31 54 views
0

我有一个从PDF转换而来的.numbers文件,我需要从每隔50行和DEF列的特定单元格中提取和转置数据。例如,数据以这种格式存在,通过文件间隔开。使用python从.numbers文件中提取数据

Año Población Superficie 
1980 2061744 12855 
2000 3381005 55035 
2005 3745073 58668 
2010 4106054 63018 

这样做的最好方法是什么?

回答

0

如果你打算做更多的数值计算,我会建议使用Numpy

np.loadtxt该功能提供一种简单的方式在这样的数据读取,允许你忽略标题等

否则,你可以逐行读取文件中的行(跳过第一个),并使用split,得到列值,然后将它们转换为浮点数。

下面的代码应该工作(未经测试):

ano = [] 
poblacion = [] 
superficie = [] 

with open("yourfile.numbers") as file: 
    file.readline() # skip first line 
    for line in file: 
     values = map(float, line.split()) 
     ano.append(values[0]) 
     poblacion.append(values[1]) 
     superficie.append(values[2])