TG:达佳互联申请流式语音识别模型训练相关专利显著降低流式语音识别中尾字删除的问题
金融界2025年7月29日消息,国家知识产权局信息显示,北京达佳互联信息技术有限公司申请一项名为“一种流式语音识别模型的训练方法、装置、电子设备及存储介质”的专利,公开号CN120388560A,申请日期为2025年03月。
专利摘要显示,本公开关于一种流式语音识别模型的训练方法、装置、电子设备及存储介质,该方法包括:取第一样本语音序列输入初始模型,进行语音识别处理,根据语音识别结果对初始模型进行迭代训练,得到非流式语音识别模型;对初始样本语音序列的尾部进行裁切处理,得到已裁切的样本语音序列;在第三样本语音序列输入过程中实时进行语音识别处理,对非流式语音识别模型进行迭代训练,得到初始流式语音识别模型;将非流式语音识别模型作为教师模型、初始流式语音识别模型作为学生模型,进行对比学习训练,得到第一流式语音识别模型。本方案显著降低流式语音识别中尾字删除的问题,并且使用非流式模型提升流式模型的性能,提高了流式语音识别模型的准确率。
天眼查资料显示,北京达佳互联信息技术有限公司,成立于2014年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本600000万美元。通过天眼查大数据分析,北京达佳互联信息技术有限公司共对外投资了20家企业,参与招投标项目17次,财产线条,此外企业还拥有行政许可31个。
猜你喜欢
- 06-04TG完成3079台唇腭裂救助手术
- 05-06TGYY强化语音业务 上线YY语音
- 06-23TG唐驳虎:特朗普上演美以
- 05-15TG语音技术企业龙头有哪些
- 06-04TG语音合成技术新突破:对
- 07-02TGTT语音下载-TT语音最新版下
- 06-24TG智能语音龙头名单收好(
- 05-14TG支付宝上线实名语音通话
- 06-12TG广和通发布AI语音智能体