买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市信联征信有限公司
申请日:2024-12-27
公开(公告)日:2025-01-24
公开(公告)号:CN119357415A
专利技术分类:...使用从内容中自动派生的元数据[2019.01]
专利摘要:本发明属于数据处理技术领域,具体涉及一种基于征信标签体系增强的RAG大模型智能问答方法及系统,通过引入专门设计的征信分词模型和征信标签体系,能够更加准确地捕捉征信领域的专业词汇和语义关系,并将这些特征转化为向量表示存储于向量数据库中。当用户提出问题时,系统可以通过匹配用户问题与数据库中的标签标题向量来快速定位最相关的文本块,实现高精度的信息检索和答案生成。因此,本发明不仅提升了智能问答系统的响应速度和准确性,还确保了答案的专业性和可靠性,有效解决了现有技术中征信领域智能问答不够精准的问题。
专利权项:1.一种基于征信标签体系增强的RAG大模型智能问答方法,其特征在于,包括以下步骤:对各种渠道获取的大文本数据进行预处理,将非文本数据转换为文本格式,去除特殊字符和不相关信息,并分割长篇文档为多个文本块;使用包含基于规则和基于深度学习的分词模型对文本块中的专业词汇、高频词汇、核心词语、上下文关系进行提取;引入包含征信领域专业词汇、规定特色标签、复杂语义标注、词性标注在内的征信标签体系,对文本块打上基础标签和征信标签;基于分词打标的结果,形成标签标题,并通过句子嵌入式模型将文本块与标签标题转化为向量表示,存入向量数据库中。
百度查询: 深圳市信联征信有限公司 一种基于征信标签体系增强的RAG大模型智能问答方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。