买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:支付宝(杭州)信息技术有限公司
摘要:本说明书实施例提供一种从文本中检测中文拼音的方法和装置。该拼音检测方法包括,从目标文本中截取待检测的目标字符串,并针对目标字符串,执行若干次子串匹配操作。上述子串匹配操作具体包括,针对目标字符串中的当前子串,判断其是否属于拼音字典。若不属于拼音字典,针对当前子串进行添加或回退的第一更新;若当前子串属于拼音字典,更新临时匹配序列,并在目标字符串完成整体匹配时,将临时匹配序列中的拼音添加到针对目标文本的匹配拼音列表中,而在目标字符串尚未完成整体匹配时,通过截取后续子串对当前子串进行第二更新。直到针对目标文本完成检测。
主权项:1.一种从文本中检测中文拼音的方法,包括:从目标文本中截取待检测的目标字符串;针对目标字符串,执行若干次子串匹配操作,所述子串匹配操作包括:针对从所述目标字符串中截取的当前子串,判断当前子串是否属于拼音字典;基于其不属于拼音字典,针对当前子串进行第一更新;基于其属于拼音字典,更新临时匹配序列,并在所述目标字符串完成整体匹配时,将临时匹配序列中的拼音添加到针对所述目标文本的匹配拼音列表中,在所述目标字符串尚未完成整体匹配时,对所述当前子串进行第二更新;其中,所述第一更新包括:在所述当前子串符合拼音规则的情况下,在其后添加下一字符,作为第一更新后的当前子串;在所述当前子串不符合拼音规则的情况下,基于所述临时匹配序列中最新的匹配子串和当前子串的首个字符,形成第一更新后的当前子串;所述第二更新包括,在所述目标字符串中,以所述当前子串的结束位置以起始位置,截取字符串作为第二更新后的当前子串。
全文数据:
权利要求:
百度查询: 支付宝(杭州)信息技术有限公司 从文本中检测中文拼音的方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。