买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学技术信息研究所
摘要:本发明公开了一种科技领域网络热点话题发现的方法,包括定义科技领域分类标准,构造few‑shot提示;将多个媒体文章输入到大模型中,大模型结合few‑shot提示对输入的文章进行科技领域细分;利用大模型抽取各文章的摘要并向量化;将第一篇文章归为领域的一个主题,并建立索引存入科技细分领域主题向量库;对于之后的文章,利用大模型对多个文章摘要进行改写,并将多个改写好的文章摘要利用RAG技术进行多级检索、多路召回,以从向量库中召回TopN个最相似的主题;利用大模型判断新输入的文章是否属于TopN个最相似的主题之一,并根据判断结果采用相应的方式生成主题描述和主题名称。优点是:大减少了人工标注的成本,提高了科技细分领域分类的准确性。
主权项:1.一种科技领域网络热点话题发现的方法,其特征在于:包括如下步骤,S1、定义科技领域分类标准,构造few-shot提示;S2、将多个媒体文章输入到大模型中,大模型结合few-shot提示对输入的文章进行科技领域细分;S3、基于科技领域细分结果,利用大模型抽取各科技文章的摘要,并将文章摘要向量化;S4、将第一篇文章归为领域的一个主题,并将其按细分的领域类别建立索引存入科技细分领域主题向量库;对于第一篇文章之后的文章,利用大模型对多个文章摘要进行改写,并将多个改写好的文章摘要利用RAG技术进行多级检索、多路召回,以从科技细分领域主题向量库中召回TopN个最相似的主题;S5、利用大模型判断新输入的文章是否属于TopN个最相似的主题之一,并根据判断结果采用相应的方式生成主题描述和主题名称。
全文数据:
权利要求:
百度查询: 中国科学技术信息研究所 一种科技领域网络热点话题发现的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。