2012-04-11 39 views
2

我有MFCC(Mel频率倒谱系数)文件由HTK从.wav文件生成。我需要的是从MFCC中提取一段时间。当MFCC文件代表90分钟长度的音频时,我想得到例如MFCC第三分钟的音频。操作MFCC文件

HTK书上说MFCC文件由一个标题和一个连续的样本序列组成。但以字节为单位确定样本的确切大小似乎并不重要。

是否有文件的解析器? (当然,在HTK中,但我没有设法弄清楚如何使用这个任务的二进制文件。)

或者有可能是一种简单的方法来确定样本的大小和标题,以便能够简单地将文件分开?

回答

2

想通了。 HTK有一个工具。 HCopy可以将MFCC转换为MFCC并接受开始和结束的参数。

HCopy -C config0 -s 10e7 -e 11e7 source.mfcc target.mfcc 

从源头削减00:10..00:11。

config0应该包含与用于从wav创建原始mfcc的配置相同的配置,除了将sourcekind设置为wav。

+0

你能告诉我什么是在配置文件中提到。我正在尝试使用htk为mp4/wav文件生成mfcc – 2017-12-01 01:36:48