买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京三五通联科技发展有限公司;四川省创鑫服装有限责任公司;中国移动通信集团四川有限公司眉山分公司;北京创原天地科技有限公司
摘要:本发明提出了一种基于数据标注的的数据标注统计方法,该方法基于注意力图神经网络,首先构建包含标注样本、标注结果和质量真值的训练集,然后通过注意力机制学习样本重要性权重,再利用图卷积网络建模样本之间的结构关系,最终基于加权图表示实现标注质量预测。在此基础上,该方法设计了一套标注人员绩效统计流程,从工作量、准确率、完整率、速度等角度量化每个人员的工作状态,并生成可视化的绩效分析报告,以全面评估标注人员的工作表现,为优化标注流程提供数据支撑。
主权项:1.一种基于数据标注的数据统计分析方法,其特征在于,包括以下步骤:步骤S1、构建包含标注样本、标注结果和质量真值的训练数据集步骤S2、搭建注意力图神经网络模型,包括注意力图神经网络模型包括:特征编码器,用预训练的骨干网络gx;θg提取样本x的语义特征注意力层,通过加性注意力机制计算样本的重要性权重其中图卷积层,在样本间构建全连接图邻接矩阵Aij=αiαj,通过图卷积更新节点表示;全连接层,将图卷积输出HL映射为预测分数通过最小化交叉熵损失训练模型参数θ,得到标注质量预测函数fx;θ,损失函数为预测分数与真值的交叉熵: 采用梯度下降法更新模型参数θ;步骤S3、利用训练好的模型对新样本x进行质量预测,输出标注质量分数并评估预测性能,所述预测性能的评估指标包括:平均准确率均方根误差Pearson相关系数步骤S4、基于预测的标注质量,从工作量Q、准确率P、完整率R、速度V统计每个标注人员的绩效指标,并进行综合评分排名,所述标注人员的绩效指标包括:工作量其中wx为样本难度权重;平均准确率标注完整率其中 标注速度其中Tm为总工作时长;采用加权求和法得到第m个人员的综合绩效评分: 其中wQ,wP,wR,wV为各指标权重;步骤S5、生成标注人员绩效的可视化报告,包括柱状图、雷达图、散点图,多角度展示和比较每个人的工作表现。
全文数据:
权利要求:
百度查询: 北京三五通联科技发展有限公司 四川省创鑫服装有限责任公司 中国移动通信集团四川有限公司眉山分公司 北京创原天地科技有限公司 一种基于数据标注的数据统计分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。