金融界2024年3月30日消息,据国家知识产权局公告,携程旅游网络技术(上海)有限公司申请一项名为“说话人的语音识别方法、系统、电子设备及存储介质“,公开号CN117789728A,申请日期为2023年12月。
专利摘要显示,本发明公开了一种说话人的语音识别方法、系统、电子设备及存储介质。该语音识别方法包括:获取目标音频,并对所述目标音频进行语音识别处理,得到目标文本;根据语义对所述目标文本进行断句处理,得到至少两个子句文本;对所述子句文本对应的子句音频进行声纹识别,得到所述子句音频的声纹信息;根据所述子句音频的声纹信息以及所述子句文本与当前场景的关联度确定所述子句音频对应的说话人是否为主说话人。通过对音频进行声纹信息识别和场景主题相关度的识别,判断音频对应的说话人是否为主说话人,解决了旁边人说话的干扰问题,提高了语音对话中的交互舒适度。