Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜国网山东省电力公司电力科学研究院郑文杰获国家专利权

恭喜国网山东省电力公司电力科学研究院郑文杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜国网山东省电力公司电力科学研究院申请的专利一种输电通道多隐患声音分类标记方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119068913B

龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411554209.2,技术领域涉及:G10L25/51;该发明授权一种输电通道多隐患声音分类标记方法及系统是由郑文杰;李壮壮;孙晓斌;张峰达;李程启;孙艺玮;林颖;杨祎;刘萌;杜伦;贾然;刘强设计研发完成,并于2024-11-04向国家知识产权局提交的专利申请。

一种输电通道多隐患声音分类标记方法及系统在说明书摘要公布了:本发明提出了一种输电通道多隐患声音分类标记方法及系统,属于输电通道多隐患声音分类技术领域,包括:持续采集输电通道周围的声音信号;对声音信号进行处理并提取梅尔频谱图特征;将提取的梅尔频谱图特征输入到训练好的分类标记模型中进行预测,输出该声音信号中包含的声音类型。实现声音信号中包含的单类或者多类隐患声音类型的分类标记,提高多隐患同时出现时的监测能力,进一步保障电力设施的安全。

本发明授权一种输电通道多隐患声音分类标记方法及系统在权利要求书中公布了:1.一种输电通道多隐患声音分类标记方法,其特征是,包括:持续采集输电通道周围的声音信号;对声音信号进行处理并提取梅尔频谱图特征;将提取的梅尔频谱图特征输入到训练好的分类标记模型中进行预测,输出该声音信号中包含的声音类型;其中,所述分类标记模型包括卷积层、深度可分离卷积层、瓶颈层、SE模块以及全局平均池化和分类层;其中卷积层用于对输入的梅尔频谱图特征进行特征提取;深度可分离卷积层对提起的提取再次进行处理以减小计算复杂度;瓶颈层主要采用卷积进行通道压缩;SE模块用于在通道维度上对特征进行重新校准,通过学习每个通道的重要性权重,自适应地调整特征图的通道权重,以便网络能够更好地关注重要的特征;全局平均池化,用于减少特征维度,获得更紧凑的特征表示;分类层用于为每个目标声音类型提供概率;训练好的分类标记模型为基于构建的输电通道多隐患声音数据集上训练获得的,输电通道多隐患声音数据集构建及处理过程:获取输电通道多隐患声音数据集中的数据时,带有音频采集功能的设备实时采集输电通道周围存在的声音数据;声音数据经过长时间的采集积累逐渐达到设定的数量,然后经过标注形成用于模型训练、测试的数据集;所述声音数据均来自于挂塔设备采集,多个设备安装在不同的输电杆塔上;根据统计分析及输电场景感兴趣的声音确定标注声音类型,共分为9大类,包括鸟叫、风声、发动机、雷声、金属碰撞、鸣笛、人声、雨声、其他,相应的标注文件按照划分的9类进行构建,根据每个声音文件中包含的具体类别在相应的标注文件类别下进行标注,具体方法为:首先,为所有的待标注的声音文件生成一个总的标注文件,标注文件中包含所有声音文件的文件名以及对应的9类标签;对所有音频进行标注,并对每个音频进行检查,确认是否存在9类中的声音类型,根据存在与否以及音频中包含声音的明确程度依次打分,确定包含的类型声音在对应类别处标记为1,若是存在不明确的情况,根据声音相似程度取0-1之间赋予对应的分数,若不存在标记为0;然后,所有声音数据标注完成之后包括三个标注文件,对于三个标注文件采用筛选机制确定最终的数据标签,具体筛选方法为:a、对照检查三个标注文件中声音文件数量及名称是否一致,确保三个标注文件标记了同样的音频数据;b、确认好一致性后,对标注文件中所有类别根据标注分数对标签进行二值化处理0或者1,具体操作:每个音频对应各个类别的得分以0.8为阈值进行处理,大于等于0.8的赋值为1,否则赋值为0;c、最后将同一音频对应的三个标注的类别取交集,得到最终音频数据标注,音频对应的标注标签为一类或为多类;所有音频对应的标注标签整理至一个csv表格文件中,从标注文件中按照比例拆分成训练标签数据csv文件、测试标签数据csv文件、验证标签数据csv文件,增加一个数据集包含所有声音类型文件,构建完成输电通道多隐患声音数据集;将输电通道多隐患声音数据集中的标签进行ID映射,获得目标输出,基于目标输出及梅尔频谱图特征进行迭代训练,获得训练后的分类标记模型;所有需要提取声学特征的音频声音数据在提取之前均先经过预加重的处理,预加重采用的一阶滤波器可以表示为:Hz=1-μz-1Hz是数字滤波器的传递函数,描述了输入信号Xz与输出信号Yz之间的关系,μ是一个滤波器系数,与高通滤波器的截止频率有关,z-1是延迟运算符,表示信号在时间上延迟一个样本;如果输入信号是x[n],那么z-1x[n]就是x[n-1],表示信号在时间上向后移动了一个采样周期;将输入的经过预加重后的音频进行分帧加窗处理,即将声音信号按照时间切分为若干个片段,每个片段成为一帧,帧长通常取20~40ms,帧长设置为25ms,帧移设置为15ms,前后两帧之间存在10ms的重叠;对每帧信号乘上窗函数,接下来对声音信号的每一帧执行傅里叶变换,将信号从时域变换到频域上,将得到的傅里叶变换数据经过梅尔滤波器组处理,然后将所有处理后的数据利用sum运算进行拼接整合得到梅尔频谱图;分类标记模型的网络结构处理声音时序数据时,将声音时序数据分割成固定长度的窗口,然后将每个窗口数据作为图像输入至mobilenetv3模型;在mobilenetv3中加入时间卷积层,即通过在时间维度上滑动卷积核来提取时序信息,同时配合网络中本身的多头注意力机制池化层共同来获取声音信号的时序上的前后依赖关系,输出层使用sigmoid单元,为每个目标类型提供概率;所述时间卷积层放在模型最开始的位置,用户提取时间维度上的特征,后面是激活层;特征提取之后输入到训练好的模型中进行预测,获得预测结果,然后进行后处理,包括:模型分析结束后会输出针对所有预设声音类型的预测得分,每个类别之前的得分相互独立,最终输出各个类别的得分通过预设阈值进行判断,如果该类别超过自己的预先设置的阈值则认为声音信号中包含该类型的声音,所有超过各自预设阈值的类别就作为该声音信号包含的类型输出;获得的梅尔频谱图特征输入到进行时间卷积MobileNet模型进行迭代训练,最后训练好的模型能够对声音信号中包含的单类或者多类隐患声音类型进行分类标记,监测到隐患出现则采取相应的措施,如果监测到此处有鸟类活动,基于此信息联动此处驱鸟装置;如果监测到附近存在施工情况,可以联动喊话装置对周围施工人员进行提示,以保障电力设施的安全。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网山东省电力公司电力科学研究院,其通讯地址为:250000 山东省济南市市中区望岳路2000号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。