中电信数智科技有限公司刘婷雯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电信数智科技有限公司申请的专利一种基于数据湖的文本预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115392229B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211132627.3,技术领域涉及:G06F40/274;该发明授权一种基于数据湖的文本预测方法是由刘婷雯;王宏昊;顾鹏;梁仝玉;张诗昭;郭明月设计研发完成,并于2022-09-17向国家知识产权局提交的专利申请。
本一种基于数据湖的文本预测方法在说明书摘要公布了:本发明公开了一种基于数据湖的文本预测方法,属于人工智能技术领域,包括:获取应用产生的初始文本数据;对初始文本数据进行筛选,将合格文本数据作为元数据放入文本类型数据池中;构建文本消歧模型;根据元数据和相应的元数据标识生成原数据集合;根据元数据、相应的原过程数据和相应的元数据标识生成原过程数据集合;将原数据集合和原过程数据集合分别输入至文本消歧模型,获得原数据拟合值和原过程数据拟合值;将相应的元数据和原过程数据组合为关键词;构建马尔可夫链关键词预测模型,根据上一次用户提问的关键词的热冷转变概率,预测用户下次可能发起的关键词热冷转变概率;输出用户可能关心的问题的预置方案。
本发明授权一种基于数据湖的文本预测方法在权利要求书中公布了:1.一种基于数据湖的文本预测方法,其特征在于,包括: S101:获取应用产生的初始文本数据,并存储在创建的初始数据湖中; S102:对所述初始文本数据进行筛选,将合格文本数据作为元数据放入文本类型数据池中,将不合格文本数据放入杂项数据池中; S103:构建文本消歧模型; S104:将所述元数据和相应的元数据标识之间建立关联关系,并生成原数据集合; S105:将所述元数据和相应的原过程数据内容组成元过程数据集合,在所述元过程数据和相应的元数据标识之间建立关联关系,并生成原过程数据集合; S106:将所述原数据集合和所述原过程数据集合分别输入至所述文本消歧模型,获得原数据拟合值和原过程数据拟合值; S107:在所述原数据拟合值和所述原过程数据拟合值之间的差值小于预设比例的情况下,将相应的元数据和原过程数据组合为关键词,将所述关键词放入知识库中; S108:构建马尔可夫链关键词预测模型,根据上一次用户提问的关键词的热冷转变概率,预测所述用户下次可能发起的关键词热冷转变概率; S109:根据所述用户下次可能发起的关键词热冷转变概率,输出所述用户可能关心的问题的预置方案; 其中,所述S102具体包括: S1021:在所述文本数据满足以下不合格条件之一的情况下,将不合格的文本数据放入杂项数据池中: 数据的长度小于预设长度; 数据的数值重复; 数据的波动小; 数据存在乱码; S1022:在所述文本数据同时满足以下合格条件的情况下,将合格的文本数据作为元数据放入文本类型数据池中: 数据的长度大于或者等于预设长度; 数据的数值不重复; 数据的波动大; 数据不存在乱码; 其中,所述预设长度为30kb; 其中,在所述S106之后,还包括: S110:在所述原数据拟合值和所述原过程数据拟合值之间的差值大于或者等于所述预设比例的情况下,对相应的元数据和原过程数据进行过滤; 其中,所述原过程数据内容包括数据来源、日期、地点和描述; 其中,所述预设比例为10%。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信数智科技有限公司,其通讯地址为:100036 北京市海淀区复兴路33号13层东塔13层1308室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励