2017-10-19 116 views
0

我正在尝试使用口袋里的狮身人面像转录音频文件。预期音频采样率与实际不符?

pocketsphinx_continuous -infile 116-288045-0005.flac.wav 

,但我得到的错误:

ERROR: "continuous.c", line 136: Input audio file has sample rate [44100], 
     but decoder expects [16000] 
FATAL: "continuous.c", line 165: Failed to process file '116-288045-0005.flac.wav' 
     due to format mismatch. 

这是我需要转录音频文件中的一个:Download from GitHub

最终,我将批量录制超过5小时的像音频文件这些,目前他们都抛出同样的错误。

这里的同一个文件的一些统计数据,我想抄写:

$ soxi 116-288045-0000.flac.wav 

Input File  : '116-288045-0000.flac.wav' 
Channels  : 1 
Sample Rate : 44100 
Precision  : 16-bit 
Duration  : 00:00:10.65 = 469665 samples = 798.75 CDDA sectors 
File Size  : 939k 
Bit Rate  : 706k 
Sample Encoding: 16-bit Signed Integer PCM 

有可能是其中的某些文件的配置的问题,我已经做了一些预处理与MP3音乐进行合并,从flac转换为wav等等。

现在最简单的方式让我的转录工作?

是否有可能无需重新采样文件回落到16kHz的。原来flac文件的采样率为16kHz,但我不得不将它们与44.1kHz的mp3文件合并。因此,现在有一些高频信息可能会丢失,如果重新采样到16k。

回答

1

重新采样的音频16000样本,然后再试一次。

您可以重新取样这样
sox file.wav -r 16000 file-16000.wav

+0

但是摆脱的信息。发生了什么事''.flac'文件最初是16000Hz,但我不得不将它们与44.1kHz的mp3文件合并。因此,那里面有一些高频率的信息,如果重新采样到16K – theonlygusti

+0

可能丢了,我该怎么办呢而不重新取样到16kHz的? – theonlygusti

+0

另一种选择可能是修改配置文件并更改解码器的默认采样率。配置中的选项名称是'-samprate' – deimus