2014-03-18 38 views
0

请原谅我的问题,因为有点太宽泛。音频数据的健身功能

我想对分组类似的音乐一起利用遗传算法的工作。我似乎无法找到如何检查我的解决方案的确切方式,我想知道社区对此有何评论。

我的一个朋友说的kNN算法可能是有帮助的;如果是的话,那么如何? 其他建议?

+0

你可能需要能描述一下你会考虑“相似”你可以问我们的算法之前,来衡量它。 – AShelly

+0

对不起。我还不确定自己的功能。我打算考虑每分钟节拍(BPM)和歌曲的流派。也许我可以通过对音频信号进行更详细的分析来提取更丰富的特征。 – Ali

回答

1

所以,我认为这是通常做的方式是有一些音乐专家(也许是音乐博客或从事音乐经典训练)做自己的音乐排行榜,然后你可以用它来测试反对。没有某种测试集,很难“证明”两首歌曲之间的相似性。但是,这些测试集中的任何一个都会具有内在的主观性,所以我可以看到,即使您可以找到其中一个数据集,也会遇到一些问题。

我看着其他人都在使用在学术界是什么,显然有每年由美国伊利诺伊大学香槟分校的MIREX评价活动的大学的国际音乐信息检索系统评价实验室头驻扎创建一个大library 。他们根据这些数据在这次活动中进行了一系列比赛,其中包括一些用于音乐相似性和分类的比赛。然后将结果发布在International Society for Music Information Retrieval的年度会议上。

最后一件事,你可以看看(如果你还没有的话)是Music Genome Project潘多拉使用作为后端。他们让音乐家为每首歌添加标签,但我认为他们的排名使用这些标签作为特征,而不是某种分析方法,比如比较旋律,低音,人声等实际统计数据。

因此,总结,在我冗长的回答之后,它取决于你的特征空间是什么,但假设你将比较你的“染色体”之间的分类分数,你应该能够使用k-最近的邻居为你的健身。然而,找到一个好的数据集并找出你的特征空间使用什么指标(即欧几里得,皮尔森等)是很困难的。请参阅第2节中的this paper,作为如何执行此操作的示例。