首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于语音识别的门诊电子病历生成方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军海军青岛特勤疗养中心

摘要:本发明属于语音识别领域,具体是一种基于语音识别的门诊电子病历生成方法及系统,本发明利用少量的原始语音数据集进行WGAN模型的训练,用训练生成的更多相似语音来扩充原始语音数据集,形成用于语音识别模型训练的语音识别数据集;对交流语音进行处理,得到带有时间序列的多个语音帧片段,将相邻时刻的语音帧片段进行绑定作为语音识别模型的输入,去预测这些语音帧片段的目标输出,得到交流文本,对交流文本进行结构化处理,生成当前患者的电子病历并输出。本发明通过对语音识别模型生成当前患者的电子病历,使医生有更多时间专注于患者护理,提高工作效率,降低运营成本。

主权项:1.一种基于语音识别的门诊电子病历生成方法,其特征在于,包括以下步骤:利用少量的原始语音数据集进行WGAN模型的训练,用训练生成的更多相似语音来扩充原始语音数据集,形成用于语音识别模型训练的语音识别数据集;对语音识别数据集进行划分,形成训练集、验证集和测试集;构建一个LFR-DFSMN模型,利用训练集的语音数据训练LFR-DFSMN模型,在训练过程中利用验证集上评估模型性能,更新模型参数,训练完成后,利用测试集上评估模型的最终性能,得到所需的语音识别模型;利用拾音器实时获取医生与患者的交流语音,对交流语音进行处理,得到带有时间序列的多个语音帧片段,将相邻时刻的语音帧片段进行绑定作为语音识别模型的输入,去预测这些语音帧片段的目标输出,得到交流文本,对交流文本进行结构化处理,生成当前患者的电子病历并输出;WGAN模型的目标函数表示为: (1);式(1)中:x表示少量的原始语音数据集的原始语音片段,是x上的固定分布,sup表示式(1)中所有1-Lipschitz利普利兹连续函数f的上界,式(1)中具有一个隐含随机变量空间,生成器g是到x的映射,是映射过程中的一个参数,即,代表的是参数的分布函数;将原始语音片段转化成的语音输入给式(1)进行训练,代表原始语音作为真实样本的期望,与代表的生成语音的期望,与达到纳什平衡时,停止训练,得到更多相似语音;不能达到纳什平衡时,继续训练,直到能到达纳什平衡;构建一个LFR-DFSMN模型的步骤包括:构建基础网络结构,基础网络结构包括输入层、隐藏层、CFSMN层、DFSMN层和输出层;每一个CFSMN层均引入了记忆模块,在相邻的CFSMN层的记忆模块之间进一步引入跳转连接,并加入步长因子s,形成模型的DFSMN层;整合基础网络结构的输入层、隐藏层、CFSMN层、DFSMN层和输出层,得到LFR-DFSMN模型;第层记忆模块在第t个时刻的输出表示为: (2);其中,表示第-1层记忆模块在第t个时刻的输出;表示第层记忆模块在t时刻的输出;和分别代表回看的阶数和向前看的阶数;表示元素相乘;表示层中,第i个历史时刻时间步的权重;表示层中,第j个未来时刻时间步的权重;表示层第j个未来时刻时间步,是未来时刻的步长因子;表示层第i个历史时刻时间步,是历史时刻的步长因子;构建的LFR-DFSMN模型采用了8层DFSMN,其中每层DFSMN的单元数设置为1024,前后步长设置为40,并将DFSMN的输出经过归一化处理后,代入激活函数swish中,最终得到下一层的输出,在每层DFSMN中,正则化处理的丢失率设置为0.5。

全文数据:

权利要求:

百度查询: 中国人民解放军海军青岛特勤疗养中心 一种基于语音识别的门诊电子病历生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。