苏州市福川科技有限公司姜克建获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州市福川科技有限公司申请的专利基于POE话筒阵列的同声传译数据处理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121354578B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511891554.X,技术领域涉及:G10L21/0208;该发明授权基于POE话筒阵列的同声传译数据处理方法及系统是由姜克建设计研发完成,并于2025-12-16向国家知识产权局提交的专利申请。
本基于POE话筒阵列的同声传译数据处理方法及系统在说明书摘要公布了:本发明涉及同声传译技术领域,公开了基于POE话筒阵列的同声传译数据处理方法及系统。该方法包括通过以太网供电的分布式话筒阵列同步采集多语种原始音频流与会场环境噪声频谱特征;对音频流时域分帧后,利用动态降噪权重系数执行自适应滤波得初级纯净语音段;经预训练多语种语音端点检测模型分割为带语种标签的独立语音单元,匹配对应声学模型生成音素级时间对齐序列;结合同传术语库实时比对输出术语替换指令流,融合后生成中间语义表示向量;经低延迟编码器转换为目标语种语音参数序列,驱动波形合成器生成最终同传音频。该方法优化了全流程处理,兼顾同传准确性与实时性,适用于多语种会场场景。
本发明授权基于POE话筒阵列的同声传译数据处理方法及系统在权利要求书中公布了:1.一种基于POE话筒阵列的同声传译数据处理方法,其特征在于,包括: 通过以太网供电的分布式话筒阵列采集多语种原始音频流,同步获取会场环境噪声频谱特征; 对原始音频流进行时域分帧处理,结合环境噪声频谱特征生成动态降噪权重系数; 利用动态降噪权重系数对分帧后的音频流执行自适应滤波,输出初级纯净语音段; 将初级纯净语音段输入预训练的多语种语音端点检测模型,分割为具有语种标签的独立语音单元; 根据语音单元的语种标签匹配对应的声学模型,生成音素级时间对齐序列; 基于音素级时间对齐序列与预设的同传术语库进行实时比对,输出术语替换指令流; 融合术语替换指令流与音素级时间对齐序列,生成中间语义表示向量; 通过低延迟编码器将中间语义表示向量转换为目标语种语音参数序列; 根据目标语种语音参数序列驱动波形合成器生成最终同传音频输出; 所述通过以太网供电的分布式话筒阵列采集多语种原始音频流包括: 配置话筒阵列中各节点的采样时钟同步协议,使所有节点的时间戳偏差小于预设阈值;对每个节点采集的原始音频流附加空间坐标标识;根据空间坐标标识计算相邻节点的声波到达时间差,生成发言人定位向量; 所述对原始音频流进行时域分帧处理包括: 根据发言人定位向量动态调整分帧窗口长度;在分帧窗口内计算梅尔频率倒谱系数与短时能量比;将梅尔频率倒谱系数与短时能量比组合为时频联合特征矩阵; 所述利用动态降噪权重系数对分帧后的音频流执行自适应滤波包括: 提取时频联合特征矩阵中的谐波分量与噪声基底分量;根据谐波分量与噪声基底分量的能量比计算频带掩蔽阈值;采用频带掩蔽阈值对动态降噪权重系数进行非线性缩放。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州市福川科技有限公司,其通讯地址为:215000 江苏省苏州市高新区科创路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励