sound-recognition

    -3热度

    1回答

    我想知道是否可以使用Windows Azure认知服务创建服务,以使我能够识别对话中的一个特定声音(由互联网上的直播流提供)以及如何制作它。 我已经知道机器学习的基本技术,但我从来没有实现过这样的东西,无论如何,我想使用认知服务使它成为一种简单而有效的方式。 该任务将与其他任务(如事件链)相关联,所以我应该使用为Java或Python提供SKD的东西。 有人知道我该怎么做? 谢谢!

    4热度

    1回答

    我对shazam或soundhound如何工作感兴趣。 它如何记录语音并使指纹与指纹数据库相似? 我即将开始在C/C++中编写一些软件,但不确定要使用哪个库,看到有一些来自Microsoft的Speech SDK。你有没有建议,从哪里开始'理解'分析语音和玩它的过程? 我会很感谢每一个提示或想法,你会分享:]

    0热度

    2回答

    我想要构建一个应用程序,以响应您吹熄生日蜡烛时所发出的声音。这本身不是语音识别(这个声音不是英语中的单词),而且OpenEars上非常善良的Halle告诉我,使用该框架是不可能的。 (感谢您的快速响应,哈雷!) 有没有办法“教”一个应用程序的声音,使应用程序可以随后识别它? 我该怎么办?它是否可行?我是疯了还是承担比我想象的要困难得多的问题?我的作业应该是什么?

    1热度

    1回答

    我尝试在我的android应用程序中创建一个尖叫和哨子检测器。现在我可以通过使用musicg android库here来检测用户的哨声。我必须自己实施尖叫探测器,因为没有可用的库。 在musicg中,它读取音频数据并将其存储在字节缓冲区中。它使用缓冲区作为其哨子检测器的输入。我试图通过在LogCat中打印这些字节来了解和了解这些字节的样子。但是,我不知道它们是什么以及音乐库如何使用此输入来检测用户

    1热度

    1回答

    ,我发现了一个有趣的宝石从它来自返回标题和艺术家,其音乐的未知文件发现:https://github.com/tenderlove/earworm 事实就是最后一次提交是4年前,并使用的网站已不再工作... 有谁知道这个问题的另一种解决方案?另一个宝石或其他片段?

    1热度

    1回答

    有谁知道某些软件(例如SmartMusic或Garageband)能够“听”演奏者正在播放的音乐,检测播放的错误音符并提供总分吗?例如88%? 是否有任何API可用于创建应用程序,可以使用各种标准(如音调,节奏,音量和/或音调)对演奏者现场演奏的音乐短语/片段进行评分/评级? 感谢大家的想法。

    0热度

    1回答

    有一些模型可以识别2类声音,它们是A类和B类。 如何将C类声音识别为异常声音? 我试图设置一个阈值,同时通过帧进行识别。 above 70% -> class A or B else -> abnormal 例如, 如果声音具有10帧,其结果是 frame 1 2 3 4 5 6 7 8 9 10 A B A B A A A B A A A=7 B=3 -> class A

    1热度

    1回答

    我正在构建一个网页,我需要在麦克风捕捉特定声音时执行某些操作。我搜索了很多,发现此链接: Write a Program Which Recognizes a Sound and Performs Action 我被困在两两件事: 如何使用基于Java的声音识别虽然网页或 的JavaScript 如何搭配使用任何识别器的两个声音(一个来自麦克风和其他来自保存的文件) 对于声音识别器,使用Sphin

    1热度

    1回答

    我想提高我的知识和工作与声音重组(语音到文本)。我从谷歌找到好的样本,但我不知道我怎么能用波斯语 - 波斯语来做这些事情?我用英语来做,但波斯语怎么样?是否需要在我的手机安卓手机中进行一些设置?有谁这样做? Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(Recognize

    0热度

    1回答

    我正在寻找一种算法,通过它们的语音来比较两个声音文件。我想评估某种评分(例如0:没有相似性; 100:相同的声音)。因此,我在Audacity中加载了一台计算机生成的录音和录制的人声,并说出“你好”的声音(我知道,这不是专业的...),并看着海浪。 https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png(不幸的是,我不能插入图片) 虽然这两种声音com