TG:浙江研煌科技申请基于预训练模型的视频语音自动翻译方法专利大幅降低全球化内容生产的时间与人力成本
金融界2025年8月2日消息,国家知识产权局信息显示,浙江研煌科技有限公司申请一项名为“一种基于预训练模型的视频语音自动翻译方法”的专利,公开号CN120412546A,申请日期为2025年04月。
专利摘要显示,本发明属于语音翻译技术领域,具体涉及一种基于预训练模型的视频语音自动翻译方法,所述视频语音自动翻译方法包括以下步骤:步骤1.视频与音频数据预处理;步骤2.语音识别与语种检测;步骤3.机器翻译与文本后处理;步骤4.语音合成与音频混合;步骤5.视频处理与字幕同步;步骤6.质量控制与多维度评估;步骤7.模型迭代与数据闭环;步骤8.系统部署与工程化实现。该发明通过预训练模型的高效迁移学习与多模态技术的深度融合,构建了高精度、低成本、易扩展的视频语音翻译解决方案,大幅降低全球化内容生产的时间与人力成本,提升跨语言沟通效率,提供沉浸式的多语言体验,建立数据驱动的持续优化机制,使系统性能随使用规模增长而提升。
天眼查资料显示,浙江研煌科技有限公司,成立于2023年,位于宁波市,是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,浙江研煌科技有限公司参与招投标项目3次,财产线条。
猜你喜欢
- 06-06TGOpenAI Codex大升级:语音输
- 07-12TG美政府内部再现信息安全
- 03-17TG车载语音
- 08-02TG浙江研煌科技申请基于预
- 07-21TG语音技术服务“国补”来
- 06-28TG中国电信发布星小辰终端
- 06-14TG我院24级播音与主持艺术专
- 05-18TG动态|MiniMax发布新一代语
- 07-31TG动态|让顺风车行前沟通