TG:嘀拍信息科技南通申请基于人工智能语音识别方法及系统专利实现实时语音识别
金融界2025年7月30日消息,国家知识产权局信息显示,嘀拍信息科技南通有限公司申请一项名为“一种基于人工智能的语音识别方法及系统”的专利,公开号CN120388575A,申请日期为2025年4月。
专利摘要显示,本发明提供一种基于人工智能的语音识别方法及系统,涉及语音识别技术领域,本发明实时采集语音信号,对语音信号进行降噪后通过梅尔频率倒谱系数提取语音信号特征,组合梅尔倒谱系数、梅尔倒谱系数的一阶差分和二阶差分形成语音特征向量。同时采集唇动图像作为视觉信号,对图像进行灰度化处理之后,通过计算图像中像素点的LBP值生成图像特征向量,通过跨模态注意力机制动态调整语音特征向量和图像特征向量的权重,生成融合权重矩阵,不同的融合权重矩阵对应不同的语音指令,将语音原始信号和视觉原始图像作为训练集,融合权重矩阵对应的语音指令作为标签训练深度学习网络模型,最后使用将实时采集的数据输入训练好的模型进行实时语音识别。
天眼查资料显示,嘀拍信息科技南通有限公司,成立于2016年,位于南通市,是一家以从事商务服务业为主的企业。企业注册资本740万人民币。通过天眼查大数据分析,嘀拍信息科技南通有限公司参与招投标项目1次,专利信息5条,此外企业还拥有行政许可2个。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
2026女足亚洲杯分组:中国女足与朝鲜、乌兹别克斯坦、孟加拉国同分在B组
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
摩根大通:预计苹果可折叠 iPhone 明年 9 月推出,售价1999美元
分析预测苹果折叠屏iPhone明年 9 月发布,或归属iPhone 18系列
猜你喜欢
- 07-24TG恒实科技新注册《恒实智
- 05-22TG斗鱼一季度直播收入降近
- 06-29TG微信语音新界面「丑」上
- 07-15TG印度空难驾驶舱语音记录
- 06-17TG巴黎4-0马竞创新测试:裁
- 06-29TGMeta洽谈收购AI语音公司P
- 05-23TG姚晨反复听朱媛媛的语音
- 06-06TG彩讯股份:公司与腾讯在
- 07-30TG嘀拍信息科技南通申请基