speech

-1热度

2回答

我想建立一个团结的游戏，有阿拉伯语语音识别在Android设备上使用。我被困在语音识别工具中。哪一个更适合统一？我可以直接使用Google API吗？如果是，我可以控制数据吗？或狮身人面像更适合Android设备上的游戏？我已阅读关于狮身人面像，但阿拉伯语的声学模型不可用，但它。我尝试过使用MATLAB，但使用MATLAB编码器在移动设备上构建它并花费我很多，并且它没有全部所需的库。对此有帮

0热度

1回答

使用HVite不使用词汇

是否可以在不指定词汇文件的情况下使用HTK中的HVite？我正在做纯手机识别，并且只有对应于语音wav的电话级实验室文件。我还没有定义任何词汇档案...

0热度

1回答

录音讲话n音讯

我使用naudio.Following是代码初始化n音讯试图记录用户的语音中UWP捕获并写入到磁盘： sourcestream = new WasapiCaptureRT(); sourcestream.WaveFormat = new WaveFormat(8000, 8, 1); sourcestream.DataAvailable += OnDataAvailable; source

0热度

1回答

grpc Google登录失败

我试图使用谷歌的云语音api创建应用程序。我克隆了所有的存储库，并在C++中创建了一个非常简单的客户端应用程序。 #include <grpc++/grpc++.h> #include "google/cloud/speech/v1/cloud_speech.grpc.pb.h" namespace gs=google::cloud::speech::v1; using gs::Speec

0热度

2回答

如何将语音训练数据添加到张量流中

我已经标记了.wav文件来训练卷积神经网络。这些适用于孟加拉语手机，没有标准数据集可用。我想输入这些.wav文件到Tensorflow来培训我的CNN模型。我想从这些.wav文件中创建灰度光谱图，这些文件将被输入到我的模型中。我需要帮助如何做到这一点。如果有多个替代品，他们的优势和劣势是什么？另外，它们的时间长度可变，有些是70ms，有些是160ms。有没有办法将他们分成20ms的细分市场？

0热度

1回答

Bing Speech API只是停止响应

我注意到其他人询问基本相同的问题，但没有收到回复。我在Android应用程序中使用Bing Speech API。我基本上使用提供的示例之一进行连续识别。我的应用程序效果很好，识别效果非常好，但大约1/2分钟后，Bing Speech API停止响应。我把调试语句放在我的代码中。我的代码中的所有内容都像其成功时一样工作。当Bing Speech API停止响应时，我没有收到FinalRes

1热度

2回答

CNTK用法创建c＃应用程序

我是认识工具包的新手，仍在探索如何使用它。但是我几乎无法找到任何有关如何使用认知工具包创建应用程序的资源或视频。我期待构建类似于Cortana或siri的语音识别和导航应用程序。任何关于如何在Visual Studio应用程序中使用认知工具包的指针都会非常感激。

0热度

1回答

是否有理由使用Microsoft.Speech命名空间而不是直接在Visual Studio中使用SAPI 5.4？

在Visual Studio中的演讲很混乱。在其他语言甚至VB6中，我有使用SAPI 5.4对象的工作代码。我发现Visual Studio中有Microsoft.Speech和System.Speech对象。我认为这是我可以有托管代码。你仍然可以直接编程到SAPI吗？我应该知道为什么我想要使用一种方法或另一种方法？该代码甚至不是很相似。此应用程序将在Windows Server上运行，并使用VB

0热度

1回答

SpeechRecognizer可以播放声音，但在调用startListening（）时不会传递结果

我试图在没有对话框的情况下编程语音识别。对于第一个电话SpeechRecognizer.startListening(recognizerIntent)一切工作正常，我得到的结果与识别的语音字符串。但是当我想要第二次开始识别时，只播放识别开始声音，并且当我停止说出识别结束声音时。调用没有回调方法，如onResults(),onRmsChanged或onError等。的活动： package co

0热度

2回答

说话人识别性能：等误差率（EER）和识别精度

我对用于测量说话人识别系统（而不是验证）性能的指标感到困惑。它是等误差率（EER），识别精度还是两者？如果两者都是，哪一个最重要？