通用汽车环球科技运作有限责任公司D·G·拉杰帕塔克获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉通用汽车环球科技运作有限责任公司申请的专利用以检测新的领域知识的基于深度学习的自动本体抽取获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114722190B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111541786.4,技术领域涉及:G06F16/35;该发明授权用以检测新的领域知识的基于深度学习的自动本体抽取是由D·G·拉杰帕塔克;R·S·桑班吉;X·王设计研发完成,并于2021-12-16向国家知识产权局提交的专利申请。
本用以检测新的领域知识的基于深度学习的自动本体抽取在说明书摘要公布了:本发明涉及用以检测新的领域知识的基于深度学习的自动本体抽取。一种系统,其处理非结构化数据以识别在该非结构化数据中的文本集中的文本中的多个子集,并且针对来自所述多个子集中的一个子集,基于该子集在文本集中的位置、该子集中每个词的词性(POS)、以及在该子集的左手侧和右手侧上的一个或多个词的POS来确定概率,所述一个或多个词的数量是基于文本集的长度来选择的。系统生成该子集的特征向量,该特征向量包括概率和子集的附加特征;并且使用分类器基于该子集的特征向量将该子集分类到多个类中的一个中,所述多个类表示知识的领域的本体。
本发明授权用以检测新的领域知识的基于深度学习的自动本体抽取在权利要求书中公布了:1.一种系统,其包括: 处理器;以及 存储指令的存储器,所述指令在由所述处理器执行时将所述处理器配置成: 处理非结构化数据以识别在所述非结构化数据中的文本集中的文本中的多个子集; 针对来自所述多个子集中的一个子集,基于所述子集在所述文本集中的位置、所述子集中每个词的词性、以及在所述子集的左手侧和右手侧上的一个或多个词的词性来确定概率,所述一个或多个词的数量是基于所述文本集的长度来选择的; 生成所述子集的特征向量,所述特征向量包括所述概率和所述子集的附加特征;以及 使用分类器基于所述子集的所述特征向量将所述子集分类到多个类中的一个中,所述多个类表示知识的领域的本体; 其中,所述处理器被配置成: 使用从所述非结构化数据生成的手动标记的第一特征向量集来训练模型;以及 使用所训练的模型自动标记从所述非结构化数据生成的第二特征向量集, 其中,所述第二特征向量集比所述第一特征向量集大一个或多个数量级; 其中,所述分类器包括基于迁移学习的分类器,并且所述处理器被配置成:使用较大的自动标记的第二特征向量集来训练所述基于迁移学习的分类器,以训练所述基于迁移学习的分类器的低水平层;以及然后,利用比起所述较大的自动标记的第二特征向量集具有更高质量但更小数量的所述手动标记的第一特征向量集来重新训练所述基于迁移学习的分类器的顶水平层,以改进所述基于迁移学习的分类器的F1分数,所述F1分数要被用来将表示附加的非结构化数据的特征向量分类到所述多个类中; 其中,所述基于迁移学习的分类器使用上下文信息、位置特征、句法信息、以及基于词性的新型分布概率模型从非结构化文本数据中抽取和分类新概念。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人通用汽车环球科技运作有限责任公司,其通讯地址为:美国密执安州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励