首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

结合AI Agent的暗网领域知识图谱构建与检索的方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国电子科技集团公司第三十研究所

摘要:本发明公开了一种结合AIAgent的暗网领域知识图谱构建与检索的方法及系统,该方法包括根据暗网领域的专家知识,构建本体,定义实体类型、实体属性、关系类型、关系属性;从对暗网贴文中抽取实体和关系;通过AIAgent对提取的实体和关系进行数据增强;响应用户的查询并生成对应的检索内容。本发明实现了对暗网数据的高效抽取、实体信息智能扩展和暗网内容精准检索。

主权项:1.一种结合AIAgent的暗网领域知识图谱构建与检索的方法,其特征在于,包括:步骤1:根据暗网领域的专家知识,构建本体,定义实体类型、实体属性、关系类型、关系属性;实体类型包括暗网用户、暗网涉及人物、暗网贴文、暗网事件、虚拟货币地址和暗网商品;实体属性包括暗网用户的基本信息、暗网用户社交信息、暗网涉及人物的基本信息、暗网涉及人物社交信息、暗网涉及人物的行业信息;关系类型包括暗网用户关联虚拟货币地址、暗网用户发布暗网贴文、暗网用户提及暗网涉及人物;关系属性包括网用户发布暗网贴文的时间、暗网用户提及暗网涉及人物的情感倾向;步骤2:从对暗网贴文中抽取实体和关系;步骤3:通过AIAgent对步骤2提取的实体和关系进行数据增强;步骤4:响应用户的查询并生成对应的检索内容;所述步骤2包括:步骤21:对暗网贴文进行数据清洗,过滤空文本、非文本内容以及无意义文本,将文本数据转为LangChain中的document类型;步骤22:设置用于实体与关系抽取的提示词信息;步骤23:选用大语言模型,基于步骤22中的提示词信息,对暗网贴文的document类型的文本进行实体、关系抽取,抽取文本中的实体信息、关系信息、实体属性;所述步骤3包括:步骤31:定义用于信息搜索的agent,使用load_tools工具进行载入google-serper,并初始化agent;步骤32:利用agent对已抽取的实体信息进行搜索;已抽取的实体信息包括暗网用户昵称、暗网提及人物的名称和虚拟货币地址;步骤33:利用ChatGLM从agent搜索结果中提取实体对应的属性和关系信息,按照指定的节点类型、节点属性、关系类型输出;步骤34:将步骤23中产生的实体信息、关系信息、实体属性与步骤33中的节点类型、节点属性、关系类型进行合并;将步骤33产生的节点类型、节点属性、关系类型转为GraphDocument类型;将产生的GraphDocument类型数据加入图数据库中;所述步骤4包括:步骤41:利用ChatGLM接收并解析用户查询语句,输出被检索的实体以及输出图数据查询的cypher语句;步骤42:利用图数据库查询语句进行查询,返回暗网领域知识图谱返回的检索结果;步骤43:利用agent对被检索的实体进行互联网搜索,获取相关的外部信息;步骤44:融合步骤42的检索结果和步骤43的搜索结果,生成检索信息;步骤45:利用ChatGLM对步骤44生成的检索信息进行调整与总结并返回给用户。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第三十研究所 结合AI Agent的暗网领域知识图谱构建与检索的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。