Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于大语言模型的论文选题辅助方法、系统、介质和设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:福建师范大学协和学院

摘要:本发明涉及一种基于大语言模型的论文选题辅助方法、系统、介质和设备,引入了第一用户信息,则第二选题评测报告的生成过程中考虑到当前用户的学术信息,基于第一选题评测报告、第二选题评测报告生成综合选题评测报告,将多个综合选题评测报告汇总后形成最终选题评测报告并展示,而不是直接进行自动选题的形式,可以给需要进行论文写作的用户一个选题范围的评估,并且这一最终选题评测报告中的内容与用户当前的学术信息相关联,使得用户可以从自身角度出发筛选适合自己的论文选题,节省选题阶段用户的工作量。

主权项:1.一种基于大语言模型的论文选题辅助方法,其特征在于,包括:获取论文选题范围,所述论文选题范围包括论文选题所涉及的研究领域,从文献数据库中筛分出所述论文选题范围所涵盖的文献并将筛选出的文献按照论文选题所涉及的研究领域进行一次分类,以生成多个第一选题数据集;对每一所述第一选题数据集执行如下步骤:记所述第一选题数据集中的文献为第一文献,将所述第一文献依次输入至分类模型中,所述分类模型基于每一接收的所述第一文献的研究领域进行二次分类,得到与所述第一选题数据集对应的多个第二选题数据集,记所述第二选题数据集中的文献为第二文献;逐一对所述第二文献的文字内容进行识别,生成以第二选题数据集为最小单位的第一文字内容;根据所述第一文字内容生成当前所述第二选题数据集对应的第一选题评测报告;以及获取第一标签集合以及第一用户信息,所述第一标签集合内含有多个第一预设标签,每一所述第一预设标签对应于一个调研类别,所述第一用户信息包含有当前用户的学术信息,所述学术信息包括当前用户对应的学术水平信息、学术研究领域以及学科成绩分布中的至少一项;根据所述第一标签集合、第一用户信息以及所述第一文字内容在所述文献数据库中进行检索并分析,以生成当前所述第二选题数据集的第二选题评测报告;根据所述第一选题评测报告以及所述第二选题评测报告生成当前所述第二选题数据集的初版选题评测报告,再将多个所述初版选题评测报告汇总以生成当前所述第一选题数据集的综合选题评测报告;将多个所述综合选题评测报告进行汇总,以形成最终选题评测报告并展示;所述方法还包括:获取论文配图信息以及论文文字信息,所述论文配图信息包括多个配图;对所述论文文字信息按照第一预设方式进行内容识别并切分,得到多个文字内容信息组,每一所述文字内容信息组包含有一个第一中心主题;对多个所述配图进行图像识别,得到所述配图对应的配图内容信息,每一所述配图内容信息具有一个第二中心主题;将所述第一中心主题与所述第二中心主题进行匹配,得到图文匹配结果,并根据所述图文匹配结果并生成第一图文索引;以及将所述配图按照所述图文匹配结果插入至相匹配的所述文字内容信息组中,得到最终含有配图的文字内容信息组,并生成第二图文索引;将所述配图按照所述图文匹配结果插入至相匹配的所述文字内容信息组中还包括:查询所述文字内容信息组中的第一预设关键字段,所述第一预设关键字段为包含有引用某一配图的文字表述;根据所述第一预设关键字段对所述文字内容信息组按照段落进行划分,得到第一文字段落区域以及第二文字段落区域,所述第一文字段落区域为含有第一预设关键字段的段落区域,所述第二文字段落区域为未含有第一预设关键字段的段落区域;根据所述第一预设关键字段在所述第一文字段落区域内插入与所述第一预设关键字段相对应的配图,并将其记为第一配图;以及对所述第二文字段落区域中的文字内容信息按照第二预设方式进行内容识别,并按照识别的结果将所述第二文字段落区域中的段落逐一与多个所述配图按照关联度的高低进行排序;在所述第二文字段落区域中选取与每一所述配图关联度最高的段落,并将各个所述配图对应插入至与之关联度最高的段落的下方位置,以及在对应的所述关联度最高的段落中插入第二预设关键字段,所述第二预设关键字段记录有引用对应的配图的文字表述,以及,将所述第二文字段落区域中的配图记为第二配图;所述方法还包括:获取论文内容信息,对所述论文内容信息按照第三预设方式进行内容识别并切分,得到第一切分文本;在所述第一切分文本中提取出第二标签集合,所述第二标签集合内含有多个第二预设标签,所述第二预设标签含有当前所述论文内容信息的方案信息的关键词;以及获取当前所述论文内容信息的基础论文信息,所述基础论文信息包括所述论文涉及的具体研究领域以及论文作者信息;根据所述第二标签集合、所述基础论文信息在所述文献数据库中进行查重检索,得到疑似重复文本;对所述疑似重复文本以及所述第一切分文本进行重复率计算,判断当前所述第一切分文本的重复率是否置于预设阈值范围内,若是,则执行以下操作:对所述第一切分文本按照词组语义进行划分,得到多个重复语句;将每一所述重复语句输入至simCSE算法模型中,所述算法模型的输出结果为基于所述重复语句的语义生成的重组句段,采用所述重组句段对所述重复语句进行替换,得到重组后的若干第二切分文本;将若干所述第二切分文本展示在备选框中,并在所述备选框中显示当前所述第二切分文本的重复率,以及接收对所述备选框中的所述第二切分文本的选择指令,将所述第一切分文本替换为被选择的所述第二切分文本。

全文数据:

权利要求:

百度查询: 福建师范大学协和学院 基于大语言模型的论文选题辅助方法、系统、介质和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。