南方电网人工智能科技有限公司郑桦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南方电网人工智能科技有限公司申请的专利面向电力行业的声纹识别与热词优化的智能会议语音转写及纪要生成方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121096347B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511338529.9,技术领域涉及:G10L17/02;该发明授权面向电力行业的声纹识别与热词优化的智能会议语音转写及纪要生成方法与系统是由郑桦;陈骞;刘俊健;周瑾;梁翰韬;欧礼斌;梁凌宇;李成;任正国;彭君权;曾凡强;杨梦雪;支芳龙;陈宁婷;农燕丽设计研发完成,并于2025-09-18向国家知识产权局提交的专利申请。
本面向电力行业的声纹识别与热词优化的智能会议语音转写及纪要生成方法与系统在说明书摘要公布了:本发明公开了一种面向电力行业的声纹识别与热词优化的智能会议语音转写及纪要生成方法及系统。该方法包括:预先采集语音样本构建加密声纹数据库;从电力行业多源数据挖掘专业术语并动态分配权重建立热词库;对输入音频进行统一解码和自适应预处理;提取语音特征后采用深度嵌入聚类实现说话人分离与识别;集成热词库并采用基于Transformer的领域自适应模型生成带说话人标签的转写文本;利用电力领域预训练模型进行多粒度语义理解和层次化摘要生成,自动输出结构化会议纪要。本发明有效解决了电力行业专业术语识别准确率低、多人说话人分离困难、纪要生成依赖人工的问题,显著提升了会议记录的效率和智能化水平。
本发明授权面向电力行业的声纹识别与热词优化的智能会议语音转写及纪要生成方法与系统在权利要求书中公布了:1.一种面向电力行业的声纹识别与热词优化的智能会议语音转写及纪要生成方法,其特征在于,包括以下步骤: S1:预先采集会议参与者的语音样本,提取基于深度神经网络的声纹特征向量,通过平均池化生成标准声纹模板,建立加密的声纹数据库; S2:从电力行业多源数据中通过文本挖掘收集专业术语,基于词频、逆文档频率和时效性因素动态分配词汇权重,并建立热词库动态更新机制; S3:接收多格式音频输入,进行统一解码和自适应预处理,采用基于一维卷积神经网络的语音活性检测模型进行端点检测和静音切除; S4:提取预处理后语音段的高维声学特征向量,采用深度嵌入聚类算法进行无监督聚类,通过优化软分配概率与目标分布间的KL散度损失实现说话人分离,并将聚类结果与声纹数据库进行匹配识别; 所述S4包括: 提取预处理后语音段的高维声学特征向量; 对所述特征向量进行无监督聚类,通过优化软分配概率与目标分布之间的KL散度损失实现说话人分离,其中: a使用学生t分布计算特征向量与聚类中心之间的软分配概率: , 其中,表示第个语音段的高维声学特征向量,表示第个聚类中心,表示对所有聚类中心的遍历; b通过强化高置信度分配构造目标分布: , 其中,表示第个聚类中心的软分配频率和; c通过最小化KL散度损失函数L同步更新聚类中心和深度神经网络的参数: , 其中,表示目标分布,表示软分配分布,为KL散度损失值; 将聚类结果与声纹数据库中的标准声纹模板进行相似度匹配,若最大相似度超过预设阈值,则将聚类簇映射为对应说话人身份,否则标记为未知说话人; S5:采用基于Transformer结构的领域自适应语音识别模型,在解码过程中集成加权热词库,通过上下文感知的动态加权算法和热词冲突消解机制,生成带说话人标签的转写文本; S6:利用电力领域预训练的自然语言处理模型进行多粒度语义理解和层次化摘要生成,自动生成包含全文摘要、章节速览和待办事项列表的结构化会议纪要; S7:提供编辑界面并对最终纪要加密存储,支持本地和云端多模态输出格式。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南方电网人工智能科技有限公司,其通讯地址为:510555 广东省广州市黄埔区中新广州知识城亿创街1号406房之822;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励