如何解决语音识别使用 python
我正在研究一个语音助手项目并使用 SpeechRecognition 库来识别用户的命令。我决定命名我的助手 ODI,并意识到 SpeechRecognition 库无法识别它。 “ODI”关键字被识别为“body”或“audi”。我想知道是否有办法做到这一点?
我希望它持续监听用户,一旦使用“ODI”这个词,识别器就会开始识别其他命令。
编辑:我安装了pocketsphinx来检测语音中的关键字,然后在匹配关键字后将其传输到谷歌识别器。我尝试了两种方法,使用 r.recognizer_sphinx(keyphrase=[('ode',1)])
和 LiveSpeech(keyword='ode')
,包括阈值 1e+20
和 1e-40
。这两种方法似乎都不起作用,一旦我提供了关键短语参数,它就会用关键字解释所有内容。
这是代码片段:
def get_user_input(self):
with self.microphone as source:
self.recognizer.adjust_for_ambient_noise(source,duration=1)
print("listening")
audio = self.recognizer.listen(source)
try:
transcript = self.recognizer.recognize_sphinx(audio,language='en-us',keyword_entries=[('ode',1)]).lower()
print("User said: {0}".format(transcript))
time.sleep(1)
except sr.UnknownValueError:
transcript = ''
print('Unable to recognize speech')
except sr.RequestError:
transcript = ''
print("Request failed")
except Exception as e:
print("Repeat Command",e)
return "None"
if "ode" in transcript:
new_transcript = self.recognizer.recognize_google(audio,language='en-ie').lower()
return new_transcript
为什么有“ode”而不是“odi”的原因是CMU字典有“ode”,这听起来不错,但问题是它也一直将其他单词检测为“ode”。 任何帮助将不胜感激,谢谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。