买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中移(苏州)软件技术有限公司;中国移动通信集团有限公司
摘要:本申请提供一种注释识别方法、装置、设备及计算机可读存储介质,所述方法包括:对获取的待识别的程序代码进行分割处理,得到至少一个文字行,所述程序代码包括代码和注释;根据所述文字行的行首字符确定所述文字行的行开始符,并根据所述文字行的行末字符确定所述文字行的行结束符;基于所述行开始符和所述行结束符,确定所述程序代码中的注释标识;基于所述注释标识对所述程序代码进行注释识别,得到识别结果。本申请能够在不预知具体编程语言的前提下,实现对程序代码中的注释进行识别,不依赖具体编程语言,具有通用性,能够提高对无法预知具体编程语言的注释识别的准确率。
主权项:1.一种注释识别方法,其特征在于,所述方法包括:对获取的待识别的程序代码进行分割处理,得到至少一个文字行,所述程序代码包括代码和注释;根据所述文字行的行首字符确定所述文字行的行开始符,并根据所述文字行的行末字符确定所述文字行的行结束符;基于所述行开始符和所述行结束符,确定所述程序代码中的注释标识;基于所述注释标识对所述程序代码进行注释识别,得到识别结果;所述根据所述文字行的行首字符确定所述文字行的行开始符,包括:提取各个文字行中的第一个非空白字符;当确定当前文字行的第一个非空白字符不为英文字符时,将当前文字行的第一个非空白字符确定为当前文字行的行开始符;当确定当前文字行的第一个非空白字符为英文字符时,将空字符确定为当前文字行的行开始符;所述根据所述文字行的行末字符确定所述文字行的行结束符,包括:提取各个文字行中的最后一个非空白字符;当确定当前文字行的最后一个非空白字符不为英文字符、且不为中文字符时,将当前文字行的最后一个非空白字符确定为当前文字行的行结束符;当确定当前文字行的最后一个非空白字符为英文字符或中文字符,且当前文字行存在行开始符时,将空字符确定为当前文字行的行结束符;当确定当前文字行的最后一个非空白字符为英文字符或中文字符,且当前文字行不存在行开始符时,将当前文字行的下一个文字行的行结束符确定为当前文字行的行结束符;所述基于所述行开始符和所述行结束符,确定所述程序代码中的注释标识,包括:基于所述文字行包括的字符,确定所述文字行中包括的目标分词的个数,所述目标分词的词性不为名词;基于各个文字行的行开始符和目标分词的个数,确定注释开始标识,并基于各个文字行的行结束符和目标分词的个数,确定注释结束标识;将所述注释开始标识和所述注释结束标识确定为注释标识;所述基于各个文字行的行开始符和目标分词的个数,确定注释开始标识,包括:基于各个文字行的目标分词个数和各个文字行的行开始符,确定不为空字符的各个行开始符的总支持数,所述行开始符的总支持数为所述行开始符对应的各个文字行中包括的目标分词个数的总和;确定各个行开始符对应的目标文字行的总行数,所述目标文字行为只包括名词分词的文字行;计算所述不为空字符的各个行开始符的总支持数与对应的总行数的差值,得到不为空字符的各个行开始符的开始支持数;将最大开始支持数对应的行开始符确定为注释开始标识;所述基于各个文字行的行结束符和目标分词的个数,确定注释结束标识,包括:基于各个文字行的目标分词个数和各个文字行的行结束符,确定不为空字符的各个行结束符的总支持数,所述行结束符的总支持数为所述行结束符对应的各个文字行中包括的目标分词个数的总和;确定各个行结束符对应的目标文字行的总行数,所述目标文字行为只包括名词分词的文字行;计算所述不为空字符的各个行结束符的总支持数与对应的总行数的差值,得到不为空字符的各个行结束符的结束支持数;将最大结束支持数对应的行结束符确定为注释结束标识。
全文数据:
权利要求:
百度查询: 中移(苏州)软件技术有限公司 中国移动通信集团有限公司 注释识别方法、装置、设备及计算机可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。