买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请实施例提供了一种服务器及文本纠错方法,服务器被配置为:对接收到的语音命令进行语音识别,得到待纠错文本;对所述待纠错文本进行检错,得到所述待纠错文本对应的待纠错实体;通过多种召回方法对所述待纠错实体进行候选召回,得到多个候选实;根据所述待纠错实体在多个预设层面的特征计算每个候选实体的概率,根据每个候选实体的概率确定所述待纠错实体对应的纠错后实体。本申请实施例通过多种召回方法对所述待纠错实体进行候选召回,实现了多视角召回,得到的候选实体数量众多且非常全面,根据每个候选实体的概率确定纠错后实体,提高了纠错准确率,能够很好地解决常见文本错误类型的文本错误。
主权项:1.一种服务器,其特征在于,所述服务器被配置为:对接收到的语音命令进行语音识别,得到待纠错文本;对所述待纠错文本进行检错,得到所述待纠错文本对应的待纠错实体;通过多种召回方法对所述待纠错实体进行候选召回,得到多个候选实体;根据所述待纠错实体在多个预设层面的特征计算每个候选实体的概率,根据每个候选实体的概率确定所述待纠错实体对应的纠错后实体;其中,所述多个预设层面包括拼音层面、字层面、语义层面和热度层面;所述待纠错实体在所述拼音层面的特征包括所述待纠错实体的拼音与所述候选实体的拼音之间的第一编辑距离,所述待纠错实体在所述字层面的特征包括所述待纠错实体的文本与所述候选实体的文本之间的第二编辑距离,所述待纠错实体在所述语义层面的特征包括将所述待纠错实体和所述候选实体依次输入预训练的语义向量模型得到的第一语义向量和第二语义向量,所述待纠错实体在所述热度层面的特征包括所述候选实体的实时热度值;其中,所述对所述待纠错文本进行检错,得到所述待纠错文本对应的待纠错实体,包括:通过纠错规则判定所述待纠错文本是否需要纠错;若判定需要纠错,则通过语言模型判定所述待纠错文本是否为实体,若判定不需要纠错,则将所述待纠错文本确定为所述待纠错实体;若通过所述语言模型判定所述待纠错文本为非实体,则通过端到端模型识别所述待纠错文本对应的待纠错实体。
权利要求:
百度查询: 海信视像科技股份有限公司 服务器及文本纠错方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。