speech-recognition

    0热度

    1回答

    快速的新手!我正在尝试使用语音识别器来实现将语音转换为文本的应用程序。 问题 SFSpeechRecognizer().isAvailable是false private let request = SFSpeechAudioBufferRecognitionRequest() private var task: SFSpeechRecognitionTask? private let eng

    -1热度

    1回答

    我想在C#窗口应用程序中创建一个Windows应用程序,应用程序应使用IBM Watson服务执行语音到文本转换。 我们应该如何实现IBM Watson Speech to Text API服务 https://stream.watsonplatform.net/speech-to-text/api应该听用户的声音并编写输出文本。 我搜索了很多文章,在所有这些例子中,.wav(音频)文件作为输入传

    1热度

    1回答

    我需要开发一个语音识别软件,所以我使用Python的Pocketsphinx。 我想识别几个单词,因此我使用带阈值的关键词列表来排除语法单词。 我到目前为止这样的代码: #!/usr/bin/env python import os from pocketsphinx import LiveSpeech, get_model_path model_path = get_model_pat

    2热度

    1回答

    我在Raspberry Pi上使用Google python语音识别,效果非常好。然而,它不断地倾听,我宁愿有一个唤醒词,以便它只在我需要时听。 此刻它一直收听直到出现沉默(或返回到任何环境背景噪声),然后将声音片段发送到API以进行语音识别。我有没有办法缩短它正在听的时间长度?这样,它一次只能听一个单词,并等待我设定的任何唤醒词。

    1热度

    1回答

    我正在使用android中使用pocketsphinx语音识别器的个人助理。这是我的应用程序每次听到特殊字词时的个人助理会回复并执行任务的方式。麦克风的释放我一直有一些问题。我不知道它是否是一个错误。它仅在我关闭应用程序时才会发生,麦克风仍然在查找该单词并使用文本到语音进行回答。即使屏幕关闭。当我试图录制视频时,表示麦克风被其他应用程序使用。所以我必须再次打开我的应用程序并关闭应用程序以释放麦克风

    0热度

    1回答

    我在我的应用程序中使用recognitionlistener界面将语音转换为文本。不过,我想在演讲后立即显示来自演讲的转换文本。如果我说4-5个单词,那么只要我说一个单词就应该显示第一个单词。总之就像谷歌助理。我正在重写它的onresults方法并显示调用此方法时的结果。有没有办法一次检测出一个单词并逐一显示? https://drive.google.com/open?id=0BxHdMJXrM

    0热度

    1回答

    我是用JavaScript的语音识别API(new webkitSpeechRecognition())工作,我感到惊讶,为什么它没有互联网的工作,因为它是JavaScript代码,所以它应该脱机工作 我检查的Chrome开发者工具的网段,甚至不做要求互联网

    0热度

    1回答

    在很多语音识别论文中,我看到这个术语“帧的上下文窗口”。我不确定这一点,但看起来好像你从一个话语中取出一个帧x,并且将这个帧连接到5个先前帧和5个未来帧。这个上下文窗口的标签是中心框架。我对吗? 谢谢 (顺便说一下5号只是一个例子)

    0热度

    1回答

    我想做一个android游戏(使用统一游戏引擎),我希望这个游戏有语音识别功能。 我想用使用谷歌API的Android应用程序进行语音识别,但我想将识别结果发送到另一个应用程序,这是统一游戏。 我该怎么办?它有效吗? P.S .:我知道谷歌提供了一个统一的插件,但我不想使用它。

    3热度

    2回答

    有没有人曾试图用两个或更多的语音向文本API转录音频?你可以使用时间戳来匹配单词,并以最高的可信度选择单词。如果有人这样做,是否显着提高了转录的准确性?这值得么?