sound-recognition

-3热度

1回答

我想知道是否可以使用Windows Azure认知服务创建服务，以使我能够识别对话中的一个特定声音（由互联网上的直播流提供）以及如何制作它。我已经知道机器学习的基本技术，但我从来没有实现过这样的东西，无论如何，我想使用认知服务使它成为一种简单而有效的方式。该任务将与其他任务（如事件链）相关联，所以我应该使用为Java或Python提供SKD的东西。有人知道我该怎么做？谢谢！

4热度

1回答

Shazam/soundhound如何工作？

我对shazam或soundhound如何工作感兴趣。它如何记录语音并使指纹与指纹数据库相似？我即将开始在C/C++中编写一些软件，但不确定要使用哪个库，看到有一些来自Microsoft的Speech SDK。你有没有建议，从哪里开始'理解'分析语音和玩它的过程？我会很感谢每一个提示或想法，你会分享：]

0热度

2回答

iOS 7的声音识别？

我想要构建一个应用程序，以响应您吹熄生日蜡烛时所发出的声音。这本身不是语音识别（这个声音不是英语中的单词），而且OpenEars上非常善良的Halle告诉我，使用该框架是不可能的。（感谢您的快速响应，哈雷！）有没有办法“教”一个应用程序的声音，使应用程序可以随后识别它？我该怎么办？它是否可行？我是疯了还是承担比我想象的要困难得多的问题？我的作业应该是什么？

1热度

1回答

音频数据字节的含义是什么？ Android

我尝试在我的android应用程序中创建一个尖叫和哨子检测器。现在我可以通过使用musicg android库here来检测用户的哨声。我必须自己实施尖叫探测器，因为没有可用的库。在musicg中，它读取音频数据并将其存储在字节缓冲区中。它使用缓冲区作为其哨子检测器的输入。我试图通过在LogCat中打印这些字节来了解和了解这些字节的样子。但是，我不知道它们是什么以及音乐库如何使用此输入来检测用户

1热度

1回答

找出一首歌曲的标题和艺术家在Ruby中

，我发现了一个有趣的宝石从它来自返回标题和艺术家，其音乐的未知文件发现：https://github.com/tenderlove/earworm 事实就是最后一次提交是4年前，并使用的网站已不再工作... 有谁知道这个问题的另一种解决方案？另一个宝石或其他片段？

1热度

1回答

音乐精度分析

有谁知道某些软件（例如SmartMusic或Garageband）能够“听”演奏者正在播放的音乐，检测播放的错误音符并提供总分吗？例如88％？是否有任何API可用于创建应用程序，可以使用各种标准（如音调，节奏，音量和/或音调）对演奏者现场演奏的音乐短语/片段进行评分/评级？感谢大家的想法。

0热度

1回答

在声音识别中进行异常值检测的方法？

有一些模型可以识别2类声音，它们是A类和B类。如何将C类声音识别为异常声音？我试图设置一个阈值，同时通过帧进行识别。 above 70% -> class A or B else -> abnormal 例如，如果声音具有10帧，其结果是 frame 1 2 3 4 5 6 7 8 9 10 A B A B A A A B A A A=7 B=3 -> class A

1热度

1回答

在网络中的声音识别

我正在构建一个网页，我需要在麦克风捕捉特定声音时执行某些操作。我搜索了很多，发现此链接： Write a Program Which Recognizes a Sound and Performs Action 我被困在两两件事：如何使用基于Java的声音识别虽然网页或的JavaScript 如何搭配使用任何识别器的两个声音（一个来自麦克风和其他来自保存的文件）对于声音识别器，使用Sphin

1热度

1回答

波斯语言在android中的文本

我想提高我的知识和工作与声音重组（语音到文本）。我从谷歌找到好的样本，但我不知道我怎么能用波斯语 - 波斯语来做这些事情？我用英语来做，但波斯语怎么样？是否需要在我的手机安卓手机中进行一些设置？有谁这样做？ Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(Recognize

0热度

1回答

计算机生成的声音与人类语音的相似性

我正在寻找一种算法，通过它们的语音来比较两个声音文件。我想评估某种评分（例如0：没有相似性; 100：相同的声音）。因此，我在Audacity中加载了一台计算机生成的录音和录制的人声，并说出“你好”的声音（我知道，这不是专业的...），并看着海浪。 https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png（不幸的是，我不能插入图片）虽然这两种声音com