买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:云知声智能科技股份有限公司
摘要:本申请公开了一种文本处理方法、装置、设备及介质。对于待处理文本中每个非首次出现的字符,进行了详细的位置信息标注。这种标注不仅帮助多意图文本理解大模型识别字符的重复出现,更重要的是,它提供了字符在文本中的具体位置信息。这使得多意图文本理解大模型在理解文本时,能够更准确地判断字符间的关联性和上下文关系,从而减少了因上下文理解错误而导致的幻觉问题。由于多意图文本理解大模型只需输出每种意图的首字信息,后续可以基于每种意图的首字信息,快速定位并提取出对应的子句,避免了多意图文本理解大模型进行复杂的遍历和匹配过程,进一步缩短了解码耗时。
主权项:1.一种文本处理方法,其特征在于,所述方法包括:获取待处理文本;其中,所述待处理文本包含有至少一种意图;对所述待处理文本中每个位置的字符,若当前位置的字符在所述待处理文本中非首次出现,则在当前位置对该字符标注位置信息;通过预先训练的多意图文本理解大模型,基于意图切分文本提示以及标注后的待处理文本,确定所述至少一种意图分别对应的首字信息;其中,所述意图切分文本提示用于提示所述多意图文本理解大模型对所述标注后的待处理文本进行意图切分,以及被标注字符的标注内容表征该被标注字符的位置信息,任一意图对应的首字信息包括所述待处理文本中该意图的子句的首位字符、以及在所述首位字符为所述被标注字符时所述首位字符的位置信息;根据所述至少一种意图分别对应的首字信息,确定所述待处理文本中所述至少一种意图分别对应的子句。
全文数据:
权利要求:
百度查询: 云知声智能科技股份有限公司 文本处理方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。