Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

专业数据的标注人员遴选方法、装置和电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本申请公开一种专业数据的标注人员遴选方法、装置和电子设备,本申请基于对标注人员的能力评测构建每一标注人员的用户特征,以及构建每种实体类型的实体类型特征和或各篇测试文本分别对应的文本主题特征,并根据每一标注人员的用户特征,每种实体类型的实体类型特征和或每篇测试文本的文本主题特征,以及待标注任务的任务特征,为待标注任务选取用于任务标注的至少一个目标标注人员。从而,本申请提出了从多维度、多方面如,用户特征、实体类型特征、文本主题特征等为待处理任务适配合适的、在专业性方面与待标注任务对应一致标注人员,提升了标注结果的准确性和可信性,能够辅助智能算法实现更好的识别效果。

主权项:1.一种专业数据的标注人员遴选方法,其特征在于,包括:对标注人员集中的不同标注人员进行能力评测,得到各标注人员分别对应的能力评测结果;标注人员对应的能力评测结果,能用于表征标注人员对预定领域专业数据的多种实体类型中每种实体类型的标注质量,和或对多篇测试文本中每篇文本的标注质量;根据标注人员对应的能力评测结果,构建标注人员的用户特征;构建所述多种实体类型中每种实体类型的实体类型特征;和或,构建所述多篇测试文本中每篇测试文本的文本主题特征;根据标注人员的用户特征,每种实体类型的实体类型特征和或每篇测试文本的文本主题特征,以及待标注任务的任务特征,从所述标注人员集中为所述待标注任务选取用于任务标注的至少一个目标标注人员;将所述待标注任务分配给选取的目标标注人员;其中,所述对标注人员集中的不同标注人员进行能力评测,得到各标注人员分别对应的能力评测结果,包括:设置所述预定领域专业数据的多篇测试文本,每篇测试文本对应所述预定领域的一种或多种实体类型;获取所述标注人员集中每个标注人员对所述多篇测试文本进行实体标注所得的标注结果;根据每个标注人员的标注结果,确定每个标注人员对每种实体类型的标注质量的质量指标值,和或对每篇测试文本的标注质量的质量指标值,得到每个标注人员对应的能力评测结果;所述根据标注人员对应的能力评测结果,构建标注人员的用户特征,包括:根据标注人员对每种实体类型的标注质量的质量指标值,和或对每篇测试文本的标注质量的质量指标值,构建标注人员的用户特征;其中,标注人员的用户特征为按序排列的多维特征,每维特征包括:相应实体类型与标注人员在所述相应实体类型产生的质量指标值的对应关系,和或,各篇测试文本的文本标识与标注人员在相应测试文本产生的质量指标值的对应关系;在构建标注人员的用户特征之前,所述方法还包括:从所述标注人员集中滤除对应的相应质量指标值未满足设定的指标条件的标注人员;所述构建所述多种实体类型中每种实体类型的实体类型特征,包括:根据所述多种实体类型中每种实体类型的实体类型结构,构建每种实体类型的特征表示,得到每种实体类型的实体类型特征;所述构建所述多篇测试文本中每篇测试文本的文本主题特征,包括:根据所述多篇测试文本中每篇测试文本的主题分布,构建每篇测试文本的文本主题特征;实体类型的实体类型结构包括:通过从实体类型对应的知识数据中进行实体对象提取及实体标签标注,并基于各实体对象的对象关系所构建的树型的实体标签体系结构;根据所述多种实体类型中每种实体类型的实体类型结构,构建每种实体类型的特征表示,包括:根据实体类型的实体类型结构中每一个节点包含的实体标签,通过向量空间模型构建实体类型的向量表示,作为实体类型的实体类型特征;待标注任务的任务特征包括:待标注任务的实体类型特征和或文本主题特征;所述根据每一标注人员的用户特征,每种实体类型的实体类型特征和或每篇测试文本的文本主题特征,以及待标注任务的任务特征,从所述标注人员集中为所述待标注任务选取用于任务标注的至少一个目标标注人员,包括:根据待标注任务的实体类型特征及各标注人员用户特征中的实体类型对应的实体类型特征,计算待标注任务的实体类型与各标注人员用户特征中的实体类型的相似度;确定对应的实体类型相似度及实体类型质量指标值满足第一筛选条件的标注人员为目标标注人员;或,根据待标注任务的文本主题特征及各标注人员用户特征中的测试文本对应的文本主题特征,计算待标注任务与各标注人员用户特征中的测试文本的文本主题相似度;确定对应的文本主题相似度及测试文本质量指标值满足第二筛选条件的标注人员为目标标注人员;在将所述待标注任务分配给选取的目标标注人员之后,所述方法还包括:获取并审核所述目标标注人员对所述待标注任务的标注结果,得到所述目标标注人员对所述待标注任务的标注质量的质量指标值;基于审核得到的质量指标值,更新目标标注人员的用户特征,以基于更新后的用户特征进行后续待标注任务的标注人员遴选。

全文数据:

权利要求:

百度查询: 中国医学科学院医学信息研究所 专业数据的标注人员遴选方法、装置和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。