买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江方正印务有限公司
摘要:本发明公开的智能数字报自动摘要与语音交互聊新闻方法及系统,采用自注意力层组建神经网络用于文本智能摘要生成方法,系统包含:算法、调度、唤醒、搜索、语音识别、合成、聊天新闻技术,尤其是关于智能摘要、聊天新闻,实现对海量新闻智能高效提炼总结文本的主旨,简练易读,个性化新闻推荐,话题识别与跟踪。实时拾音、超声滤除,注意力神经网络解决传统文本的高维度,数据稀疏及缺乏语义方法,在语音输出中,赋予“精选、能听、会说、懂你、会答”式的智能人机交互体验。
主权项:1.一种智能数字报自动摘要与语音交互聊新闻方法,其特征在于,包括以下步骤:S1、获取数字报文本;S2、通过所述获取数字报文本,然后在深度学习模型的训练中所包含的标题、文本的特征信息,注意力神经网络对数字报文本特征文字信息进行分析、处理得出交叉熵损失函数;基于自注意力Attention机制的神经网络模型,利用向量矩阵特征的通道信息及空间信息设计注意力的自注意力模块,使模型能够把“注意力”放在更有用的信息上,该模块应用Attention神经网络架构,对计算交叉熵作为模型损失函数,最大池化得到的信息通道和空间的选择,提出CBAM模块的注意力能力得到最终的摘要结果;S3智能语音交互唤醒模式唤醒词“小新”,得到“能听、会说、懂你、会答”式的智能语音输入口;其中,在自注意力神经网络中,通道信息代表着文档量化处理doc2vec词向量不同的特征信息,通过对通道进行选择使网络更能注意到doc2vec词向量中对任务有用的信息,为实现对通道的选择,计算特征doc2vec词向量的全局平均池化及全局最大池化信息,通过全连接层后相加来得到通道注意力参数,其中两者共用相同的全连接网络, 通过分别对各通道的特征识别的文字序列的每个坐标进行全局最大及平均池化特征向量矩阵,然后对特征向量矩阵进行自注意力得到空间注意向量矩阵, 解决了对数字电子报自动摘录、多语义的自动摘要处理、语音识别与交互、语音聊新闻;其中所述S3包括:S31、语音识别、搜索技术系统中智能语音交互,包括麦克风,输出包括扬声器;S32、基于语音活动检测VAD模型,包括模式控制,所述模式控制分别与所述语音预处理、所述语音识别、所述搜索和所述输出电连接;所述模式控制用于获取模式信息,并将当前模式信息分别发送给所述语音预处理、所述语音识别、所述搜索和所述输出;在非唤醒模式下,所述模式控制根据所述语音预处理的对于目标语音是否为设定的唤醒词的判断结果,并在所述目标语音是为设定的唤醒词的情况下,生成唤醒状态标识,并将该唤醒状态标识分别输出给所述语音预处理、所述语音识别、所述搜索和所述输出;在唤醒模式下,所述模式控制获取应答内容输出完毕的时间节点,并实时监控所述语音预处理是否获取到目标内容;如在设定时间内,未获取到目标内容,则生成非唤醒状态标识,并将该非唤醒状态标识分别输出给所述语音预处理、所述语音识别、所述搜索和所述输出;S33、基于深度学习对语音交互聊天新闻还包括历史关联;所述历史关联分别与所述搜索、所述语音识别电连接;所述历史关联用于在进入唤醒模式时;并在唤醒模式时获取所述搜索到的应答内容,将该应答内容记录在所述历史关联中;所述搜索根据从历史关联中获取与所述目标内容相关的历史信息,并根据所述历史信息和所述目标内容获取应答内容;所述历史关联还用于在输出应答内容被打断后,将对应的所述应答内容从所述历史关联中删除;S34、具有多个场景模型,所述语音处理模块具有知识模型、相似度辅助模型、深度学习模型;调度内置有多意图判断处理、多模型算法解析、数据策略引擎、整合处理;所述计算结果生成将获得的多个文本导入时序神经网络进行训练,得出一个高维度的特征向量;自注意力神经网络以高维度的特征向量为输入进行回归操作;将自注意力神经网络得到的特征向量与数据库对应的特征向量进行比对,选出相似度最高的结果,将选出的相似度最高的结果以音频作为输出,完成的搜索语音交互聊天新闻内容,以语音形式反馈给读者。
全文数据:
权利要求:
百度查询: 浙江方正印务有限公司 一种智能数字报自动摘要与语音交互聊新闻方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。