Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 河海大学王文玉获国家专利权

河海大学王文玉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉河海大学申请的专利一种结合句法信息和预训练语言模型的中文文本语法纠错方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119578411B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411669276.9,技术领域涉及:G06F40/253;该发明授权一种结合句法信息和预训练语言模型的中文文本语法纠错方法是由王文玉;韩立新设计研发完成,并于2024-11-21向国家知识产权局提交的专利申请。

一种结合句法信息和预训练语言模型的中文文本语法纠错方法在说明书摘要公布了:本发明公开了一种结合句法信息和预训练语言模型的中文文本语法纠错方法,通过在预训练语言模型ChineseBART中融入句法信息,可有效提升中文语法纠错能力。该方法包括以下步骤:导入数据集并转换为目标格式;利用HanLP生成句法信息,将词性标签和依存关系转化为向量,与默认词嵌入进行融合;编码阶段使用句法增强的多头自注意力机制及残差网络;解码阶段利用自注意力机制和编码器‑解码器注意力机制结合句法信息进行生成,结合残差网络让解码器逐步优化;使用BeamSearch来生成多个候选句,依据句法一致性和语义合理性选取最优候选句。本发明通过结合句法信息和预训练语言模型,让模型学习句子的语义信息并关注句法结构,有助于提升模型的中文语法纠错能力。

本发明授权一种结合句法信息和预训练语言模型的中文文本语法纠错方法在权利要求书中公布了:1.一种结合句法信息和预训练语言模型Chinese BART的中文文本语法纠错方法,其特征在于包括以下步骤: 步骤一:导入数据集,将相关数据集转换为目标格式,即源句‑目标句这样的语句对形式; 步骤二:词嵌入融合句法信息,利用BERT分词器SentencePiece进行分词和编码处理,获得BART默认的中文文本词嵌入;并利用自然语言处理工具HanLP生成句法信息,包括依存句法树和词性标签,将词性标签和依存关系转化为向量表示,让词向量和词性标签向量分别通过线性层,然后相加,以便得到融合了句法信息的词嵌入; 步骤三:编码器编码,使用句法增强的多头自注意力机制Syntactic‑Attention,对于句法依存关系密切的词对,赋予更高的注意力分数从而使编码器更关注句法结构;在每层编码中,还引入了残差网络结构Residual Network,将每一层的输入通过残差连接传递给下一层,减少梯度消失问题,提高对输入文本细节的捕捉能力; 步骤四:解码器解码,继续使用掩码多头自注意力机制,让解码器仅在每一步生成时看到先前生成的词;同时使用的交互注意力机制,会关注编码器的输出,结合残差网络让解码器逐步优化生成的句子;句法信息在交互注意力中进一步作为辅助条件,帮助解码器生成符合句法规则的输出; 步骤五:句法信息的Beam Search调优,使用Beam Search来生成多个候选句,然后通过句法规则进行打分,最终选择最合适的输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学,其通讯地址为:210000 江苏省南京市鼓楼区西康路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。