2017-08-30 63 views
0

我试图创建一个应用程序,记录用户的声音并同时将其转录。我使用AVFoundation和Speech框架来完成这项工作。问题在于苹果将转录时间限制为一分钟。所以,在这段时间之后,我应该回忆一下语音识别请求。问题是我也想同时录制声音。1分钟后不重新启动连续语音识别

有谁知道我该如何解决这个问题?

这是我使用的代码:

private func startRecording() throws { 

    // Cancel the previous task if it's running. 
    if let recognitionTask = recognitionTask { 
     recognitionTask.cancel() 
     self.recognitionTask = nil 
    } 

    try audioSession.setCategory(AVAudioSessionCategoryPlayAndRecord, with: .allowBluetoothA2DP) 
    try audioSession.setMode(AVAudioSessionModeMeasurement) 
    try audioSession.setActive(true, with: .notifyOthersOnDeactivation) 

    recognitionRequest = SFSpeechAudioBufferRecognitionRequest() 

    guard let inputNode = audioEngine.inputNode else { fatalError("Audio engine has no input node") } 
    guard let recognitionRequest = recognitionRequest else { fatalError("Unable to created a SFSpeechAudioBufferRecognitionRequest object") } 

    // Configure request so that results are returned before audio recording is finished 
    recognitionRequest.shouldReportPartialResults = true 

    // A recognition task represents a speech recognition session. 
    // We keep a reference to the task so that it can be cancelled. 
    recognitionTask = speechRecognizer.recognitionTask(with: recognitionRequest) { result, error in 
     var isFinal = false 

     if result != nil { 

      if let result = result { 
       self.textView.text = result.bestTranscription.formattedString 
      } 

      isFinal = (result?.isFinal)! 
      if isFinal == true{ 
       self.textView.text.append((result?.bestTranscription.formattedString)!) 
      } 
     } 

     if error != nil || isFinal { 

      print("Error: \(error)") 
      print("ifFinal: \(isFinal)") 
      self.audioEngine.stop() 
      inputNode.removeTap(onBus: 0) 

      self.recognitionRequest = nil 
      self.recognitionTask = nil 

      try! self.startRecording() 
      self.recordButton.isEnabled = true 
      self.recordButton.setTitle("Start Recording", for: []) 
     } 
    } 


    let recordingFormat = inputNode.outputFormat(forBus: 0) 

    inputNode.installTap(onBus: 0, bufferSize: 1024, format: recordingFormat) { (buffer: AVAudioPCMBuffer, when: AVAudioTime) in 

     DispatchQueue.main.async { 
     self.recognitionRequest?.append(buffer) 
     self.writeBuffer(buffer) 
     } 
    } 

    if !audioEngine.isRunning { 
     audioEngine.prepare() 
     try audioEngine.start() 
    } 

} 

正如你可以从代码中看到,我提出的要求,我写在installTap方法的音频文件。因此,每次我必须重新开始录音时,我还要删除巴士上的水龙头。通过这种方式,我无法继续录制音频文件。

有什么我可以做的吗?任何解决方案备择方案?

+0

你有答案吗? –

回答

0

您可以在audioEngine的mainMixerNode上安装一个水龙头来进行录制。这应该使您能够在不中断录制的情况下移除inputNode上的轻敲。

或者只是改变self.recognitionRequest而不删除水龙头。原始的抽头应自动将缓冲区附加到新的请求。

当我试图做同样的事情时,我能够在不中断录制的情况下开始新的识别请求。 但是,我无法防止转录中的空白。 看起来第一个识别请求必须在第二个识别请求开始之前完成,并且一些缓冲区在中间丢失。 有可能将这些缓冲区保存在内存中,直到第二个启动...