Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 深圳市大屏影音技术有限公司杨成获国家专利权

深圳市大屏影音技术有限公司杨成获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉深圳市大屏影音技术有限公司申请的专利一种基于物联网的影音数据管理系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119251739B

龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411761012.6,技术领域涉及:G06V20/40;该发明授权一种基于物联网的影音数据管理系统及方法是由杨成;许凤江设计研发完成,并于2024-12-03向国家知识产权局提交的专利申请。

一种基于物联网的影音数据管理系统及方法在说明书摘要公布了:本发明公开了一种基于物联网的影音数据管理系统及方法,涉及物联网数据分析技术领域,本系统包括预处理模块、特征工程模块、异常判断模块和异常修复模块;所述预处理模块用于获取音频和视频数据,进行分帧处理并提取特征;所述特征工程模块用于对音频信号和视频帧图像人工标注分类,构建分类器并提取重要特征,为异常判断提供依据;所述异常判断模块用于确定聚类中心,进行聚类操作并判断音频信号和视频帧图像是否异常,准确识别异常数据;所述异常修复模块用于构建时间序列模型修正异常数据并将其还原。本发明还提出一种方法用于对系统的实现。本发明能够有效改善现有技术中部分异常帧对管理存在影响的情况。

本发明授权一种基于物联网的影音数据管理系统及方法在权利要求书中公布了:1.一种基于物联网的影音数据管理方法,其特征在于:该方法包括以下步骤: Step1、从设备或数据库获取音频和视频并分帧,将音频帧信号和视频帧图像以特征值形式表示; Step2、人工标注音频信号和视频帧图像形成数据集并分类,构建随机森林分类器提取重要特征; Step3、对于同一分类数据提取到的特征,根据特征值分布情况判断异常音频信号和视频帧图像; Step4、标记音频信号和视频帧图像,构建时间序列模型修正并还原; 在步骤Step1中,对于音频,由音频录制设备录取或从音频数据库中进行获取;对音频进行分帧处理,分别得到N个帧的音频信号;对于每帧的音频信号,提取音频信号特征,表示为:[A1i,A2i,…,Ani]; 对于视频,由视频录制设备录制或从视频数据库中进行获取;对视频进行分帧处理,分别得到M个图像;对于每帧视频帧图像,提取视频帧图像特征,表示为:[V1j,V2j,…,Vmj]; 其中,M,N为正整数,分别表示音频信号和视频帧图像的个数;i∈{1,2,…,N},表示音频帧序列;j∈{1,2,…,M},表示视频帧序列;n为正整数,表示音频信号特征的个数,Ani表示第i个音频帧的第n个音频信号特征;m为正整数,表示视频帧图像特征的个数,Vmj表示第j个视频帧的第m个视频帧图像特征; 在步骤Step2中,对每一帧音频信号进行人工标注,人工标注类型表示为:[K1,K2,…,Ku];得到每一帧的音频信号特征及其对应的人工标注类型并形成数据集; 其中,u为正整数,表示音频信号的类型数量,Ku表示第u个音频信号类型; 按照人工标注的不同类型对音频信号进行分类,得到不同标注类型的分类子集;构建随机森林分类器,设置决策树数量为E;对于每一个分类子集,使用该子集中的音频信号特征数据作为输入特征,以及对应的人工标注类型作为目标输出进行随机森林分类器的训练: 训练每一棵决策树时,从数据集中有放回地随机抽取样本; 对于每个节点的分裂,而是从所有音频信号特征中随机选择k个音频信号特征;在k个音频信号特征中选择使得分裂后节点纯度提升最大的音频信号特征作为该节点的分裂特征;节点纯度通过基尼指数衡量; 对于一个音频信号特征Ar,计算其在某一棵决策树中的重要性:遍历树中的每个节点,计算在不考虑特征Ar作为分裂特征时该节点的基尼指数,根据该节点包含的样本数量占总样本数量的比例进行加权求和得到GbAr;遍历树中的每个节点,计算在使用特征Ar作为分裂特征时该节点的分裂后的子节点的基尼指数,根据子节点包含的样本数量占总样本数量的比例进行加权求和得到GaAr;特征Ar在这棵决策树中的重要性表示为ItAr=GbAr-GaAr;对于特征Ar,其在整个随机森林中的重要性IfAr通过对每棵决策树中该特征的重要性进行平均得到:IfAr=1E·ΣItAr; 其中,r为正整数,r∈{1,2,…,n},表示音频信号特征序列;k为正整数,k<n,表示选取的音频信号特征数量; 计算每一个音频信号特征对每一个分类子集的重要性;对于每一个分类子集,选取重要性值最大的前α个特征作为该子集的重要音频信号特征; 根据上述方式对标注后的视频帧图像进行分类以及重要视频帧图像特征的提取; 在步骤Step3中,对于按照人工标注的不同类型对音频信号进行分类得到不同标注类型的某一分类子集,其选取的重要音频信号特征,表示为:[F1,F2,…,Fα];其中,F1,F2,…,Fα∈{A1,A2,…,An}; 在该子集中,获取不同重要音频信号特征的分布情况: 计算每个音频信号重要特征值与其他所有音频信号重要特征值之间的欧几里得距离,形成距离矩阵;对距离矩阵中的所有距离值进行排序,绘制距离值的排序图;根据排序图中距离值的变化趋势,寻找距离值变化从平缓变为急剧增加差值最大的点,选取对应的距离值作为邻域半径eps的一个初始估计值; 最少点数minPts设置为α+1; 对于每一个音频信号,计算其在eps邻域内包含的数据点数量,当数据点数量大于等于minPts时,将该音频信号标记为核心点;否则标记为边界点或噪声点;从核心点开始,通过连接密度可达的数据点来形成聚类;密度可达是指存在一个数据点链,链上的每个点都在其前驱点的eps邻域内,并且前驱点是核心点; 使用DBSCAN算法,数据被划分为不同的聚类;对于每个识别出的密集聚类区域,选择每个聚类的质心作为初始聚类中心; 其中,质心表示该聚类内所有音频信号特征数据向量的平均值; 设置聚类数为2,选取初始聚类中心中的两个,使用K-means聚类算法将该分类子集所有音频信号分为两个簇; 完成一次聚类后,对于每个簇,重新计算聚类中心:分别以第一次聚类之后的所有点的平均值作为新的两个聚类中心;再次使用K-means聚类算法对不同音频信号进行分配;设置最大迭代次数T,当迭代次数达到T时,停止迭代;设置阈值G,计算每个音频信号到其所属簇质心的距离,当距离大于G时,认为该音频信号异常; 对每一分类子集对应的音频信号进行异常判断; 根据上述方式对每一分类子集对应的视频帧图像进行异常判断; 在步骤Step4中,标记判断为异常的音频信号,对于每一个音频信号特征,构建音频信号数据库:[Av1,Av2,…,AvN]; 其中,v为正整数,v∈{1,2,…,n},表示音频信号特征序列;AvN表示第N个音频帧的第v个音频信号特征; 进一步构建音频信号特征Av的时间序列模型LSTM,以Av1,Av2,…,AvN为输入对模型进行训练,得到训练完成的模型;输入判断为异常的音频信号对应的帧数,得到模型预测的音频信号特征Av作为对异常值的修正; 为每个音频信号特征构建时间序列模型对判断为异常音频信号特征进行修正;将修正后的音频信号特征还原为音频帧; 根据上述方式对判断为异常视频帧图像特征进行修正并还原成视频帧。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市大屏影音技术有限公司,其通讯地址为:518000 广东省深圳市罗湖区东晓街道兰花社区布吉路1021号天乐大厦302;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。