佛山大学闫凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉佛山大学申请的专利一种AI生成文本检测方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121435960B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512015050.8,技术领域涉及:G06F40/211;该发明授权一种AI生成文本检测方法、系统、设备及介质是由闫凯;刘闻睿;韩咏;易宇声;齐浩亮;孔蕾蕾设计研发完成,并于2025-12-30向国家知识产权局提交的专利申请。
本一种AI生成文本检测方法、系统、设备及介质在说明书摘要公布了:本发明公开了一种AI生成文本检测方法、系统、设备及介质,涉及文本处理技术领域,本发明将待检测的中文文本句子转化为一个由声调类别构成的声调类别序列,此过程利用汉语声调的类别作为音韵结构的一种量化指标,将文本分析从高维、高成本的语义空间转换至低维、高效率的音韵特征空间,不依赖特定模型的训练数据,可适应于多模型的文本检测;而后对生成声调类别序列进行N‑gram分析,并计算各N‑gram组合的出现频率,以形成特征向量,最终通过一个预训练的分类模型进行AI生成文本判断,此过程在处理时的计算类型主要为字符串处理及频率统计,避免多次调用模型时模型的不一致问题,以对AI生成文本进行精准的检测。
本发明授权一种AI生成文本检测方法、系统、设备及介质在权利要求书中公布了:1.一种AI生成文本检测方法,其特征在于,包括以下步骤: 获取待检测的中文文本句子,以及预设标准的中文文本句子和AI生成的中文文本句子; 针对待检测、预设标准及AI生成的中文文本句子,获取中文文本句子内每个汉字的拼音及声调标注,基于预设的声调类别映射规则,将每个汉字的声调标注映射到一个声调类别,以将中文文本句子转化为一个由声调类别构成的声调类别序列; 基于声调类别序列,构建覆盖1至N阶的N-gram模型,并获取声调类别序列内所有的N-gram组合;统计声调类别序列中每一个N-gram组合的出现次数,并计算每一个N-gram组合的相对频率,将所有N-gram组合的频率值进行排列,得到表征待检测、预设标准及AI生成的中文文本句子音韵节奏模式的特征向量; 根据表征待检测、预设标准及AI生成的中文文本句子音韵节奏模式的特征向量,获取检测的中文文本句子的概率值,并将概率值与预设概率阈值进行比较,判断待检测的中文文本句子是否为AI生成文本; 所述声调类别序列的获取,包括: 使用拼音转换工具G2PM库获得中文文本句子内每个汉字的拼音及声调标注; 根据预设的声调类别映射规则,将每个汉字的声调标注映射为一个声调类别,以将整个中文文本句子转化为一个由声调类别构成的声调类别序列; 其中,声调类别映射规则是基于汉语声调的音高变化模式来定义的; 将声调1、2声设置为类别P,将3、4声设置为类别Z,将轻声设置为类别W; 所述判断待检测的中文文本句子是否为AI生成文本,包括: 将预设标准及AI生成的中文文本句子音韵节奏模式的特征向量转换为结构化数据集,利用结构化数据集训练优化的分布式梯度提升库XGBoost模型,得到训练后的XGBoost模型; 将表征待检测的中文文本句子音韵节奏模式的特征向量输入训练后的XGBoost模型中,输出一个概率值,将概率值与预设概率阈值进行比较; 若概率值高于或等于预设概率阈值时,则判断待检测的中文文本句子为AI生成文本;若概率值低于预设概率阈值时,则判断待检测的中文文本句子为人类生成文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人佛山大学,其通讯地址为:528225 广东省佛山市禅城区江湾一路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励