google-speech-api

    -3热度

    1回答

    我使用谷歌语音API将语音转换为文本转换,当我使用自己录制的语音时,它工作正常,但使用计算机生成的Lady语音时结果不正确,如手机网络运营商声音。 任何人都面临这样的问题?或有任何解决方案吗?请帮我解决这个问题... 谢谢。

    1热度

    2回答

    我能够根据安阳语音API中提供的命令执行操作。 但我的问题是如何捕捉语音,除了使用这个API的命令。 我需要我们从谷歌的讲话得到了相同的行为https://www.google.com/intl/en/chrome/demos/speech.html

    1热度

    1回答

    是否可以限制Google Speech API只识别给定的单词集?或者,是否有可能“禁止”某些词语?如果没有,是否有可能支持德语的任何其他语音API? 我知道我可以通过语音环境设置提示短语。它仍然认可一个不同的词。 作为一个例子,我主要使用德语的API。我想要识别“stärker”(也被列为语音上下文提示)这个词,然而,除非我最终发现“r”不自然地强壮,否则API大部分将其转译为“Stärke”。

    0热度

    2回答

    在文档页面https://cloud.google.com/speech/中有一个演示示例,它通过浏览器收听语音并在后台使用API​​。该演示的源代码是否可用? 如果不是,语音API使用flac文件。是否有任何开源项目可以从浏览器记录flacfiles(与此API兼容 - 有许多github项目,但想知道是否有官方的项目)?

    3热度

    1回答

    我已经搜索了Google的所有可用文档,但是我找不到在Python中的音频流上流式语音识别的示例。 目前,我在Django中使用Python语音识别来获取用户的音频,然后收听音频。然后,我可以保存该文件并运行谷歌语音识别,或直接从创建的音频实例中运行。 有人可以指导我如何在音频流上执行流式语音识别吗?

    9热度

    1回答

    这是谷歌语音API文档:https://cloud.google.com/speech/docs/sync-recognize 我尝试此API 2周。但仍然无法解决我的主要目的(翻译直播)。 我正在使用PHP。 (其他的语的建议是允许的,我会自己找) 我可以在我的2周做: 同步语音识别(< = 1分) 异步语音识别(> 1min和< = 80分钟)。 注意:我可以修改此接受3小时视频。从话筒 直播

    2热度

    3回答

    我想使用Google Speech API的异步转录服务。我已经将我的音频文件上传到Google存储桶中,并且正在尝试使用以下代码(我从命令中删除了我的密钥和文件名,其他所有内容都被复制了)。 curl -H "Content-Type: application/json" --data '{"audio":{"uri":"https://storage.cloud.google.com

    1热度

    1回答

    我正在研究一个应用程序,它需要知道语音信号的哪些部分(时间)对应于转换文本的哪些部分(字)。有谁知道这是否可以使用Google的Speech-to-Text API?

    0热度

    1回答

    是否有可能将云语音服务置于调用应用程序所在的区域或仅存在单个端点? 我想通过尽可能接近我的客户端应用程序来减少延迟,我的客户端应用程序在Azure中运行。 1.直接从您的本地驱动器的API 2.从谷歌云存储(GCS)的语音API :

    0热度

    1回答

    我有从笔记本电脑麦克风音频数据流到谷歌语音识别码,但我想从其他来源流音频代码。从这个来源我可以得到原始数据的缓冲区,而这个缓冲区是我想流到谷歌。可以有人帮助我或给一些有用的建议吗? 我试图自己搜索和解决这个问题,但我找不到。 这里是代码: from __future__ import division import contextlib import functools import re