上海大学费敏锐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海大学申请的专利基于优化算法的科技服务资源数据处理方法、系统及其计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115794985B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211526404.5,技术领域涉及:G06F16/31;该发明授权基于优化算法的科技服务资源数据处理方法、系统及其计算机可读存储介质是由费敏锐;吴限;周文举;仵大奎;易开祥;徐昱琳设计研发完成,并于2022-12-01向国家知识产权局提交的专利申请。
本基于优化算法的科技服务资源数据处理方法、系统及其计算机可读存储介质在说明书摘要公布了:本发明提供了一种基于智能优化算法的文本数据处理方法,该数据处理方法能够将科技资源的文本数据进行数据提取、数据预处理、特征选择和特征分析,最终得到准确率最高、特征量少的特征向量和词库数据,有效提高了运行分类器的效率和性能。还涉及一种相应的系统,包括:数据提取模块,从科技服务资源数据库中提取各类服务数据并根据行业添加分类标签;数据预处理模块,清洗原始数据,处理得到特征向量和特征词库并根据交叉验证划分训练和测试数据集;特征选择模块,使用二进制榕树生长优化算法进行特征选择,以获得分类准确率及特征量最优的解集;特征分析模块,从初始文本特征向量的特征词中得到最优特征词,并显示在特征热力图和词云中。最终处理后的数据实现将科技服务资源文本数据转换为有利于分类器处理的最优特征向量。
本发明授权基于优化算法的科技服务资源数据处理方法、系统及其计算机可读存储介质在权利要求书中公布了:1.一种基于优化算法的科技服务资源数据处理方法,其特征在于,所述的方法包括以下步骤: 1从科技服务数据库中提取各类资源库的数据,用于作为后续特征提取与分析的原始数据集,并根据所述的科技服务资源库中的行业对相应的数据添加分类标签; 2对提取的数据集进行数据清洗、汉语分词、去停用词、特征向量化处理,得到初始文本特征向量和特征词库,用于后续进行特征提取和分析,并根据交叉验证方法划分训练数据集和测试数据集; 3使用基于二进制榕树生长优化BBTGO算法的特征选择方法,对所述的文本特征向量进行优化,以获得机器学习算法分类准确率及特征量最优解集,其中,所述最优解集用于得到科技服务文本特征;所述二进制榕树生长优化BBTGO算法采用二进制编码框架,每个枝叶个体表示一组特征子集,其中个体的比特位由0、1编码,分别表示该位置上的特征项被选中或不选中状态;并通过生根算子、多树干算子、调节算子和重生算子实现对特征种群的优化; 4使用上述步骤获得的特征选择最优解,从初始文本特征向量的特征词中得到最优特征词,并显示在特征热力图和词云中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大学,其通讯地址为:200444 上海市宝山区上大路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。