买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:曹琼瑶;王鑫;陈鑫
摘要:基于大语言模型提示微调的招标文件半结构自动生成方法和装置,其方法包括:步骤1,基于利用有向无环词图、隐马尔可夫模型,对招标文件数据预处理;步骤2,基于TextRank无监督关键短语提取方法,从经过预处理的招标文件数据中提取关键短语,对招标文件的重点内容进行标注提示;步骤3,基于P‑tuning提示微调方法,利用大语言模型对招标文件数据和关键短语进行建模,设置不同初始化参数;对招标文件数据进行二次MASK机制消除模型微调过程中的学习偏差同时提高特征提取准确性,关键短语仍使用传统方式进行特征提取;步骤5,构建过滤注意力机制,对特征向量嵌入结果进行一定的过滤:去除无用的干扰信息,保留关键信息;步骤6,基于最大边缘相关性算法,将经过半结构化处理的基础招标文件与提取的招标文件中关键信息进行结合,输出得到最终的招标文件。
主权项:1.基于大语言模型提示微调的招标文件半结构自动生成方法,其特征在于,包括以下步骤:步骤1:利用有向无环词图DirectedAcyclicWordGraph,DAWG和隐马尔可夫模型HiddenMarkovModel,HMM,对项目类别内对应的相关招标文件进行预处理,相关文件包括招标文件样本及相关资料,对其进行精确地识别和剔除无关数据;步骤2:应用基于TextRank的无监着学习方法从中提取关键短语;突出招标文件中的重点内容,为大语言模型的微调提供标注提示,提高模型对关键信息的感知能力;步骤3:通过P-tuning提示微调方法,利用大型预训练语言模型对招标文件及其关键短语进行深度建模;设置针对性的初始化参数,使模型能在更广泛的语境下进行精准的特征提取和内容理解;步骤4:采用二次MASK机制对招标文件数据进行处理,消除在模型微调过程中出现的学习偏差;由步骤3得到的关键短语则通过传统方法提取特征,确保处理的全面性和深度;步骤5:构建过滤注意力机制,对步骤4中得到的特征向量嵌入结果进行精细过滤;通过去除无关的干扰信息,同时保留关键信息,进一步优化模型的输出质量;步骤6:基于最大边缘相关性算法,将大语言模型处理后得到的关于招标的关键内容与大语言模型通过半结构化处理招标文件资料得到的基础版招标文件进行有效结合,输出最终的招标文件;确保了招标文件的完整性与正确性,还利用大语言模型的高级语义理解能力,提高了生成内容的相关性和创新性。
全文数据:
权利要求:
百度查询: 曹琼瑶 王鑫 陈鑫 基于大语言模型提示微调的招标文件半结构自动生成方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。