回答

5

在处理人类语音的背景下,真的没有“频率”这样的东西。 该信号将是许多不同频率的混合信号,所以根据频谱而不是单个频率考虑可能会更有成效。即使你在谈论固定音高的持续音符 ,除了音符的基本频率之外,还会出现大量的泛音和谐波。而对于实际的语音,由于元音和辅音的不同音调特性,即使在短片中,频谱也将剧烈变化。

即便如此,考虑录音的峰值频率也是有道理的。 您可以计算语音片段的Fast Fourier Transform,然后找到具有最大响应的频率 bin。您也可能对spectrogram的概念感兴趣,它表示信号的音频频谱如何随时间变化。

+0

伟大的回应,+1 – 2010-03-07 08:26:49

1

使用Audacity。记录典型的语音,并将其降至一个波长,从一个峰值到另一个峰值。减去两次,然后除以1得到你的波的频率,单位为赫兹。

实施例:

以我的音频剪辑,我的波形运行从0.0760到0.0803秒。

0.0803-0.0760 = 0.0043

1/0.0043 = 232.558赫兹,我的典型发言频率

这可能给你一个很好的基础,以产生一个分析仪。您需要检测波峰和波峰之间的时间,并对结果进行平均计算。

0

您需要使用Apple的Accelerate框架对相关音频进行FFT。 FFT将把时域中的音频转换到频域。 Accelerate框架支持FFT,并允许您实时进行频率分析。

相关问题