2013-01-02 63 views
6

我想开始一个大项目,它需要比较两个音频文件以获得匹配百分比。比较两个音频文件。声音匹配

实施例:

  1. 音频A是原始音频。

  2. audo B从麦克风录音。 (除了语音之外,所有内容与音频A中的相同)

  3. 我想知道B以百分比的方式接近A的几率。 (100%=相同)

有谁知道一种方法如何做到这一点?

也许这可能与文件B的光谱对比文件A的频谱可能..

+1

这一切都取决于你是什么意思的“比较两个音频文件”。 100%很容易想象,但0%怎么样?正如你所看到的,“音频文件比较”的定义没有很好的定义,所以你的解决方案也不会被定义。是否应该根据知觉的角度来计算比较(两个音频文件的声音相似),还是应该基于单纯的字节 - 字节算术差异? –

+0

你可能会写一本关于声音处理和比较的书,因此投票结束为“过于宽泛”。 –

+0

比较对你而言意味着什么?你必须检查声乐和器乐。这可以帮助吗? http://stackoverflow.com/questions/3673042/algorithm-to-remove-vocal-from-sound-track – SomeJavaGuy

回答

2

我在本科课程项目但图像文件做这样的事情。你想看的东西是Cross-correlation。您可以在其中测量两个信号之间的相似性。您也可能需要预处理音频文件,即:标准化,应用一些低通滤波器来消除噪音。

我会建议奥本海姆的数字信号处理,以深入理解信号处理。

但是,这些技术都很模糊,直到yopu知道你想找到什么类型的相似点。

+0

为了跟进图像比较,有一家公司(LTU)具有基于矢量比较图像的应用程序,然后比较矢量,这反映了2幅图像之间的差异。这不是字节/字节的比较,它匹配裁剪和倒置的图像。也许他们的技术可以适应音频文件。这就是说,我怀疑你可以接受他们的算法。 –

+0

@ Nick.T但是,我认为必须有一些开源项目来做这些事情。 –

+0

我只知道它,因为客户对我说“我想要LTU”。所以没有对我开源项目的研究。我确实同意这种算法必须存在于开源项目中。也许这个问题可以在'mathematica'堆栈中重新设置和询问... –