2016-10-02 19 views
1

我目前试图采样音频文件并将采样信息存储到txt文件中。在python中保存完整的数组作为txt

采样使用librosa完成。

当我将它保存到一个文件中时发生问题... 该数组没有得到完全保存,我只能查看一些采样点,其余的点是虚线。

例如:

22050.000 
[ -8.61534572e-05 -1.64340396e-04 -8.03423245e-05 ..., -1.40137578e-04 
    -3.71412549e-04 -5.04361582e-04] 

我这是怎么做的吧:

import tensorflow as tf 
import numpy as np 
import librosa 
from os import listdir 
from os.path import isfile, join 
import os 



path_train = "/home/k/kaldi-trunk/egs/start/s5/data/train" 
path_test = "/home/k/kaldi-trunk/egs/start/s5/data/test" 
dnn_train = "/home/k/kaldi-trunk/dnn/train/" 
dnn_test = "/home/k/kaldi-trunk/dnn/test/" 
dnn = "/home/k/kaldi-trunk/dnn/" 
path = "/home/k/kaldi-trunk/egs/start/s5/data/" 
train_filelist = path_train+"/wav_train.txt" 
test_filelist = path_test+"/wav_test.txt" 

    files_train = [f for f in listdir(dnn_train) if isfile(join(dnn_train, f))] 
    files_test = [f for f in listdir(dnn_test) if isfile(join(dnn_test, f))] 

    os.chdir(dnn_train) 
    train = [] 
    test = [] 


    for line in files_train: 
     #print dnn_train+line 
     y,sr=librosa.core.load(dnn_train+line) 
     train.append(y.tolist()) 

    print "Train done!" 

    for line in files_test: 
     x,sr=librosa.core.load(dnn_test+line) 
     test.append(x.tolist()) 

    print "Test done!" 

    os.chdir(dnn) 

    with open('sample_test.txt','wb') as f: 
     np.savetxt(f,test) 

    with open('sample_train.txt','wb') as f: 
     np.savetxt(f,train) 

任何可以解释为什么我不能保存所有的采样点,而不是几个?

所需的输出是两个独立的文件[sample_test,sample_train] 其中每行包含一个列表。 列表中的每个条目都应该包含尽可能多的小数,这就是为什么要将它存储为float或double的原因。

+0

文件大小是否对其输出有影响? –

+0

我不确定我是否理解这个问题。 我没有详细说明。 –

+0

你期待'test'和'train'变量的格式是什么?我询问的原因是代码似乎将它们创建为一长串值,但在调用'np.savetxt()'时,您传递了两个格式化字符串'%10s'和'%10.3f'。您是否期望列表中的每个项目都是两个项目的列表?它可能有助于删除所有其他代码,并留下一个最小破碎的示例(例如,创建一个适当维度的随机列表并尝试保存)。 – kabdulla

回答

0

np.savetxt的参数应该是一个数组。

在保存数据前添加test = np.array(test)

  1. 如果数据无法转换为数组,则会发生错误。
  2. 可以打印,诊断,数组的形状:print test.shape

你的输出有你有一个浮动,然后在您的数据列表,要打印,而不是与NumPy阵列的内容。

相关问题