Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 福建大智网络科技有限公司张飞杨获国家专利权

福建大智网络科技有限公司张飞杨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉福建大智网络科技有限公司申请的专利一种政务文本纠错方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443088B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411533169.3,技术领域涉及:G06F40/232;该发明授权一种政务文本纠错方法及系统是由张飞杨;李威;李星建;陈当遥;林关城设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。

一种政务文本纠错方法及系统在说明书摘要公布了:本发明涉及一种政务文本纠错方法及系统,该方法包括:构建并训练政务文本纠错模型,包括:获取原始政务长文本,并进行数据预处理,获得政务短句数据集DS1;对DS1进行政务文本混淆处理,获得混淆‑正确文本对数据集DS2;对DS2中文本进行错别字混淆与字音获取,获得字形字音数据集DS3;整合DS2与DS3得到整体纠错数据集DS4;采用DS3训练语言特征嵌入模型Modelemb;采用DS4训练以Modelemb为嵌入模型的政务文本纠错模型Modelfix;将待检测政务文本进行分句预处理,得到多句待检测政务短句,再输入政务文本纠错模型,得到纠错结果,并替代出错的政务短句,形成纠错后的政务文本。该方法及系统可以有效地检测政务文本中出现的文本错误并纠正,且具有较高的检测效率和准确度。

本发明授权一种政务文本纠错方法及系统在权利要求书中公布了:1.一种政务文本纠错方法,其特征在于,包括: 构建并训练政务文本纠错模型,包括以下步骤: 步骤A1:获取政务相关文本作为原始政务长文本; 步骤A2:对原始政务长文本进行数据预处理,获得政务短句数据集DS1; 步骤A3:对政务短句数据集DS1进行政务文本混淆处理,获得混淆-正确文本对数据集DS2; 步骤A4:对混淆-正确文本对数据集DS2中文本进行错别字混淆与字音获取,并计算混淆前后样本的字形、字音匹配度特征,获得字形字音数据集DS3; 步骤A5:将混淆-正确文本对数据集DS2与字形字音数据集DS3整合得到整体纠错数据集DS4; 步骤A6:采用字形字音数据集DS3训练获得语言特征嵌入模型Modelemb; 步骤A7:将模型Modelemb用作政务文本纠错模型的嵌入模型,采用整体纠错数据集DS4训练政务文本纠错模型Modelfix; 将待检测政务文本进行分句预处理,得到多句待检测政务短句,再逐一输入政务文本纠错模型,得到纠错结果;然后,采用得到的纠错结果替代出现错误的政务短句,形成纠错后的政务文本; 所述步骤A3具体包括: 步骤A31:设定政务文本混淆规则集Rule={R1,R2,…,Rm};其中,混淆规则表示如下: Rj=Fakej→Realj 其中,Rj为政务文本混淆规则集中第j条混淆规则,Realj为真实政务文本片段,Fakej为实际书写中常与Realj混淆的混淆政务文本片段,j=1,2,…,m,m为政务文本混淆规则集中样本数; 步骤A32:根据政务文本混淆规则集Rule中的混淆规则对政务短句数据集DS1中的真实政务短句进行混淆处理,形成初始混淆政务短句数据集{S1′,S2′,…,Sl′};其中,混淆政务短句表示如下: S′i=Si.replaceRealt,Faket 其中,S′i为生成的混淆政务短句,Si为政务短句数据集DS1中的真实政务短句,Realt和Faket分别为混淆规则Rt中记录的真实政务文本片段和混淆政务文本片段,x.replacey,z为替换函数,表示将字符串x中的片段y替换为片段z;i=1,2,…,l,l为初始混淆政务短句数据集中样本数; 步骤A33:将生成的混淆政务短句与对应的真实政务短句组合,形成初始混淆-正确文本对数据集ds2={C1,C2,…,Cl};其中的混淆-正确文本对表示如下: Ci=S′i,Si 其中,Ci为混淆-正确文本对,S′i为混淆政务短句,Si为S′i对应的真实政务短句; 步骤A34:为使训练时模型能够学习判别无误政务文本的能力,向初始混淆-正确文本对数据集ds2中添加无误文本对,得到混淆-正确文本对数据集DS2={C1,C2,…,Ck};添加的无误文本对表示如下: Cq=S′q,Sq 其中,Cq为无误文本对,S′q为无误文本对中的混淆政务短句,Sq为无误文本对中S′q对应的真实政务短句,且S′q=Sq,即无误文本对中混淆政务短句等同于对应的真实政务短句,q=l+1,l+2,…,k,k为混淆-正确文本对数据集中样本数;所述混淆-正确文本对数据集DS2={C1,C2,…,Ck}对应有混淆政务短句数据集{S′1,S′2,…,S′l,S′l+1,…,S′k}。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福建大智网络科技有限公司,其通讯地址为:350003 福建省福州市鼓楼区软件大道89号福州软件园C区40号楼一层116室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。