2014-07-06 194 views
0

我已经通读了很多关于堆栈溢出的问题,其中声明混合音频,你只需要添加字节帧在一起(并确保在必要时剪辑)。但是我应该怎么做,如果我想说混合一个音频与另一个偏移量。例如,我想在第一个音频达到第5秒时将第二个音频混合到第一个音频中。音频混合wrt时间

任何帮助,将不胜感激!

回答

0

通常,在计算机上处​​理音频时,您将使用PCM样本格式的时域音频。也就是说,每秒多次,该时间点的压力水平将被测量并量化为一个数字。如果您使用CD质量的音频,则每秒44,1000个采样是采样率。该数字通常被量化为16位整数。 (-32,767至32,768)。 (其他采样率,位深度和量化值都在这里并经常使用,这只是一个例子。)

如果要混合两个具有相同采样率的音频流,可以简单地将这些值的每个样品一起。如果你仔细想想,如果你听到来自两个来源的声音,他们的压力水平会以相同的方式相互影响。有时他们会互相抵消,有时他们会互相补充。你提到了剪辑...你可以做到这一点,但是你会在混合中引入扭曲。当声音太大而无法量化时,会将其限制在可量化范围的最大值和最小值范围内,导致发出咔嗒声,砰砰声和质量差的声音。如果你想避免这个问题,你可以将每个级别降低一半,保证即使两个级别都处于最高级别,它们也会在适当的范围内。

现在,你的问题是关于混合音频与偏移。这完全没有什么不同。如果你想开始混合5秒钟,然后5 * 44,100 = 220500,这意味着将一个流的样本零对齐到另一个流的样本220500并混合。

+0

宾果!采样率!而已!!并感谢您添加到剪辑部分。如果我只是认真地考虑过我的物理课......反正......谢谢一吨! –