全球数字财富领导者

腾讯公司取得语音识别专利,可自动发现新词和不同发音,进而提高语音识别准确性

2024-01-11 22:12:41
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:金融界2024年1月11日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“一种语音识别方法及装置“,授权公告号CN112002308B,申请日期为2020年10月。专利摘要显示,本申请涉及计算机技术领域,尤其涉及一种语音识别方法及装置,获取待识别音频帧序列;分别提取所述待识别音频帧序列中各待识别音频帧的声学特征;根据所述各待识别音频帧的声学特征和已生成的解码图,对所述待识别音频帧序列进行解码,确定所述待识别音频帧序列对应的词语的识别结果,其中,所述解码图是至少根据声学模型和发音词典而生成的,所述声学模型用于基于声学特征以识别音素,所述发音词典用于针对已知音素以识别输出所述已知音素对应的词语文本,并针对未知音素以识别输出以所述未知音素的音素文本表示的词语文本,这样,可以自动发现新词和不同发音,进而提高语音识别准确性。

金融界2024年1月11日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“一种语音识别方法及装置“,授权公告号CN112002308B,申请日期为2020年10月。

专利摘要显示,本申请涉及计算机技术领域,尤其涉及一种语音识别方法及装置,获取待识别音频帧序列;分别提取所述待识别音频帧序列中各待识别音频帧的声学特征;根据所述各待识别音频帧的声学特征和已生成的解码图,对所述待识别音频帧序列进行解码,确定所述待识别音频帧序列对应的词语的识别结果,其中,所述解码图是至少根据声学模型和发音词典而生成的,所述声学模型用于基于声学特征以识别音素,所述发音词典用于针对已知音素以识别输出所述已知音素对应的词语文本,并针对未知音素以识别输出以所述未知音素的音素文本表示的词语文本,这样,可以自动发现新词和不同发音,进而提高语音识别准确性。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go