上海勘察设计研究院(集团)股份有限公司苏辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海勘察设计研究院(集团)股份有限公司申请的专利基于领域引导BERT的岩土工程语义嵌入检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119903168B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411869841.6,技术领域涉及:G06F16/334;该发明授权基于领域引导BERT的岩土工程语义嵌入检索方法是由苏辉;李元昊;王维;李鸣洲;杨石飞;罗永康;李蕊设计研发完成,并于2024-12-18向国家知识产权局提交的专利申请。
本基于领域引导BERT的岩土工程语义嵌入检索方法在说明书摘要公布了:本发明属于人工智能岩土工程技术领域,提出了一种基于领域引导BERT的岩土工程语义嵌入检索方法,旨在解决岩土工程信息检索中信息分散、语义不一致及检索效率低下的问题。该方法通过收集岩土领域的多种文本资料,构建结构化的训练数据集,并引入领域引导注意力机制优化BERT模型,实现对领域关键术语的动态建模。采用Siamese架构实现高效的语义嵌入学习与优化,提高语义相似度计算的准确性。通过设计对比损失和注意力正则化损失的总损失函数,结合AdamW优化器进行模型训练。本发明能够显著提升岩土工程信息检索的精准性与效率,为岩土工程领域的知识管理和信息检索提供有力支持。同时,本发明还涉及用于存储和处理相关数据的存储器或服务器配置。
本发明授权基于领域引导BERT的岩土工程语义嵌入检索方法在权利要求书中公布了:1.一种基于领域引导BERT的岩土工程语义嵌入检索方法,其特征在于,包括以下步骤: 步骤A:数据源获取,收集岩土领域的多种文本资料,包括项目报告、工程案例分析、实验数据、标准规范文件、论文和技术指南,并进行知识抽取与清洗; 步骤B:构建结构化的训练数据集,包括分段处理、人工标注和样本均衡;其中,分段处理将长篇文档按语义自然段或逻辑分段切分生成短文本片段;人工标注针对分段后的文本片段生成问题-答案对;样本均衡通过数据增强技术扩充稀少类型问题的数据量; 步骤C:数据预处理,数据预处理包括领域关键因素提取和分段长度调整,构建岩土工程知识表,使用知识表匹配文本中的术语,生成领域关键因素标记,用于指导注意力机制的权重分配,并测试不同文本分段长度对模型性能的影响; 步骤D:构建岩土工程语义嵌入模型,该模型基于BERT,通过在BERT的注意力机制中引入领域引导注意力机制Domain-GuidedAttention对领域关键术语进行动态建模,并采用Siamese架构实现高效的语义嵌入学习与优化; 模型接收输入的句子对,通过BERT的分词器进行预处理,将自然语言转化为BERT所需的输入格式,包括词索引序列、注意力掩码以及关键术语标记;两个共享权重的BERT模型分别对句子进行独立编码,生成对应的特征向量表示;通过领域引导注意力机制对关键术语的注意力得分进行动态调整,生成增强注意力分布用于优化句子的特征表示;采用平均池化操作对每个句子的特征向量进行处理,生成固定大小的句子嵌入向量;使用余弦相似度计算句子对的嵌入表示之间的相似度分数; 步骤E:模型训练、测试与预测,设计使用对比损失和注意力正则化损失的总损失函数,通过AdamW优化器和学习率调度器进行模型训练;在测试集上评估模型性能,使用余弦相似度均值、语义检索任务的准确率和召回率以及F1指标衡量模型性能;针对不同分段长度版本的数据集测试模型的表现,分析最佳分段策略对模型性能的影响。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海勘察设计研究院(集团)股份有限公司,其通讯地址为:200093 上海市杨浦区水丰路38号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励