如何解决语音到语音的字符
| 我的目的是能够让我的应用程序以不太流行的语言(例如福建语,马来语等)进行交谈。我当前的方法是使用录制的mp3。 我想知道.net或任何平台是否存在“语音语音字符”引擎? 此处的语音字符就像纸质词典中的语音条目一样。任何想法?解决方法
这是VB.NET代码:
\'create the object. This object will store your phonetic \'characters\'
Dim PBuilder As New System.Speech.Synthesis.PromptBuilder
\'add your phonetic \'characters\' here. Just ignore the first parameter.
\'The second parameter is your phonetic \'characters\'
PBuilder.AppendTextWithPronunciation(\"test\",\"riːdɪŋ\")
\'now create a speaker to speak your phonetic \'characters\'
Dim SpeechSynthesizer2 As New System.Speech.Synthesis.SpeechSynthesizer
\'now actually speaking. It will speak \'reading\'
SpeechSynthesizer2.Speak(PBuilder)
这是转换后的C#代码:
//create the object. This object will store your phonetic \'characters\'
System.Speech.Synthesis.PromptBuilder PBuilder = new System.Speech.Synthesis.PromptBuilder();
//add your phonetic \'characters\' here. Just ignore the first parameter.
//The second parameter is your phonetic \'characters\'
PBuilder.AppendTextWithPronunciation(\"test\",\"riːdɪŋ\");
//now create a speaker to speak your phonetic \'characters\'
System.Speech.Synthesis.SpeechSynthesizer SpeechSynthesizer2 = new System.Speech.Synthesis.SpeechSynthesizer();
//now actually speaking. It will speak \'reading\'
SpeechSynthesizer2.Speak(PBuilder);
,您需要的是大型词汇TTS引擎。 Microsoft有一个语音SDK,您可以在键入内容时说出来,还有Windows SAPI(语音API-不确定SDK和API是否相同)。我知道他们的确会说英语的男性和女性声音,但也许不会讲其他语言,例如马来语(那里可能还没有太多的市场)。您可能想看看CMU的Festival Project。他们通常会用不同的语言发出很多声音,但是一些鲜为人知的声音可能不如英语那样好。
进一步更新:
检查MBROLA网站。这是一个开放源代码项目,用于开发多语言的大型vocab TTS引擎,并且它们也有马来扩展。我不知道这有多好。我试用了北印度语,觉得还有很多工作要做。
另外,请访问BabelFish网站。它们具有许多免费的TTS引擎的链接,这些引擎应该对马来语有所支持。
更新3:我不知道这是否适合您的目的,但是如果应用程序必须说的文字很少,那么您也可以在limited vocabulary
上尝试concatenative speech synthesis
。用马来语(或任何其他语言)记录句子的片段,并将程序的输出传递到您自己的有限vocab tts引擎,在其中创建输出。一个例子可能是(用英语):“是最有价值的玩家。”在这里,“是最有价值的玩家”成为一个片段,而“玩家X”则可以随意更改。如果这符合您的目的,则应该可以正常工作。
,您是否看过“ 4”名称空间?
特别是“ 5”和“ 6”命名空间。
,.NetSystem.Speech.Synthesis.PromptBuilder
类将从SSML字符串创建音频。您可以使用它们从原始音素和采样音频中构造声音。音频与语言无关。
,也许这个吗?系统语音识别Srgs语法Srgs语音字母
,我已经尝试过System.Speech.Synthesis.PromptBuilder。我不得不说,语音字符的当前实现方式非常基础,而且不够准确。例如,PromptBuilder缺少语音语调,并且单词中没有强调压力。 PromptBuilder只能够输出单调和机器人声音,这很烦人。
我的建议是继续使用您当前的方法。使用mp3传递消息在翻译语音中完美的语音字符所需的时间方面更自然,更具成本效益。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。