我正在研究一个工具来比较两个波形文件的波形相似性。恩,我有时间1分钟的声音文件,并让我使用的第一个一拨文件,但在5秒的0 的间隔取得各5秒的数据现在我的软件会告诉大家,有波形差异在时间间隔5秒以10秒,15秒到20秒,25秒到30秒,等等...决定FFT的长度
截至目前,初始的发展,这是工作的罚款。 以下是3个试台:
我有960Hz的采样率,单声道,没有数据样本为138551(1分钟的Arnd文件12秒)2个波文件。我正在使用128点FFT(分割128个样本块),结果很好。
当我在采样率为48KHz的波形文件中使用相同的算法时,每个通道没有数据采样6927361的2通道(arnd 2min 24 sec文件)时,该过程变得太慢。当我使用4096点FFT时,过程更好。
但是,对于每个通道的数据采样数为55776的22050Hz,2通道文件的4096点FFT(波形为0.6秒文件)的结果非常差。在这种情况下,128点FFT会给出好的结果。
所以,我很困惑如何决定FFT的长度,以便我的结果在每种情况下都很好。
我想长度应当取决于样品和采样率的数量。 请在此提供您的意见。
由于
有100件事情需要您在尝试之前学习像这样的东西,仅举几例 - FFT窗口,声音重采样(采样率变化),音频指纹识别的当前技术,...确定正确的声音匹配算法应该是第一个,它应该来自您的声音匹配的要求。 –
@DanielMošmondor现在,我不担心文件的不同采样率,因为我的输入文件之一是使用另一个文件。所以,抽样率是我最担心的问题。 我只是比较波形,并尝试通过FFT和比较频率分量的大小来找到它们的相似程度。我面临的问题是决定FFT的长度,保持固定或取决于采样率和样本总数(或wav文件的长度) – Garfield