音频混合wrt时间

我已经通读了很多关于堆栈溢出的问题，其中声明混合音频，你只需要添加字节帧在一起（并确保在必要时剪辑）。但是我应该怎么做，如果我想说混合一个音频与另一个偏移量。例如，我想在第一个音频达到第5秒时将第二个音频混合到第一个音频中。音频混合wrt时间

任何帮助，将不胜感激！

来源

2014-07-06 Abdul Qadir

通常，在计算机上处理音频时，您将使用PCM样本格式的时域音频。也就是说，每秒多次，该时间点的压力水平将被测量并量化为一个数字。如果您使用CD质量的音频，则每秒44,1000个采样是采样率。该数字通常被量化为16位整数。（-32,767至32,768）。（其他采样率，位深度和量化值都在这里并经常使用，这只是一个例子。）

如果要混合两个具有相同采样率的音频流，可以简单地将这些值的每个样品一起。如果你仔细想想，如果你听到来自两个来源的声音，他们的压力水平会以相同的方式相互影响。有时他们会互相抵消，有时他们会互相补充。你提到了剪辑...你可以做到这一点，但是你会在混合中引入扭曲。当声音太大而无法量化时，会将其限制在可量化范围的最大值和最小值范围内，导致发出咔嗒声，砰砰声和质量差的声音。如果你想避免这个问题，你可以将每个级别降低一半，保证即使两个级别都处于最高级别，它们也会在适当的范围内。

现在，你的问题是关于混合音频与偏移。这完全没有什么不同。如果你想开始混合5秒钟，然后5 * 44,100 = 220500，这意味着将一个流的样本零对齐到另一个流的样本220500并混合。

来源

2014-07-06 21:22:18 Brad

宾果！采样率！而已！！并感谢您添加到剪辑部分。如果我只是认真地考虑过我的物理课......反正......谢谢一吨！ –

音频混合wrt时间

回答

相关问题