我已将叠加去噪自动编码器应用于某些噪音语音,并获得估计干净的语音,并且我想通过PESQ访问网络。但是,即使在搜索了几个小时的方法后,我也不知道该怎么做。任何人都可以给我一些想法吗?如何通过python来计算PESQ?
现在我有清晰的演讲,嘈杂的演讲和估计的演讲。谢谢!
我已将叠加去噪自动编码器应用于某些噪音语音,并获得估计干净的语音,并且我想通过PESQ访问网络。但是,即使在搜索了几个小时的方法后,我也不知道该怎么做。任何人都可以给我一些想法吗?如何通过python来计算PESQ?
现在我有清晰的演讲,嘈杂的演讲和估计的演讲。谢谢!
首先,PESQ不是访问方法;这是一个度量评估一个信号处理网络。我花了几分钟的时间来搜索,并提出了几个指标的参考。它更正式地被称为“ITU-T建议P.862”;我建议你看看那里。
由于Stack Overflow不是一项研究服务,我会停止使用术语。我希望这会让你朝着正确的方向前进。
对不起,我用错了词。我真正想做的是评估我的网络的性能。我认为PESQ可以帮助我,因为它被用在大多数去噪自动编码器研究论文中。 –
你可以参考这个GitHub仓库来计算使用Python的音频分数。
对不起,我可能会用错误的字眼。我想要做的是评估PESQ的网络性能。 –