点读笔的语音识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及语音识别技术领域，尤其涉及一种点读笔的语音识别方法。所述方法包括以下步骤：基于示范发音数据对用户跟读数据进行跟读发音评分，生成跟读发音分数；对跟读发音分数进行低分数据筛选，生成发音不合格数据；对发音不合格数据进行细粒度分析，生成音素错误数据；利用摄像头设备进行口型采集，生成跟读口型数据；基于发音不合格数据对跟读口型数据进行错误口型筛选，生成错误口型数据；对错误口型数据进行口型示范纠错，生成纠错过程数据；根据纠错过程数据进行难点聚类划分，生成重难点发音数据；根据重难点发音数据进行发音训练，生成优化发音数据。本发明通过分析用户跟读数据与跟读口型数据，以实现提高语音纠错的准确性。

主权项：1.一种点读笔的语音识别方法，其特征在于，包括以下步骤：步骤S1：获取示范发音数据与用户跟读数据；基于示范发音数据对用户跟读数据进行跟读发音评分，生成跟读发音分数；步骤S2：利用预设的分数阈值对跟读发音分数进行低分数据筛选，生成发音不合格数据；对发音不合格数据进行细粒度分析，生成音素错误数据；步骤S3：利用摄像头设备进行口型采集，生成跟读口型数据；基于发音不合格数据对跟读口型数据进行错误口型筛选，生成错误口型数据；步骤S4：对错误口型数据进行变化特征分析，生成口型变化特征数据；根据口型变化特征数据进行异常点标记，生成综合口型异常数据；其中，步骤S4包括以下步骤：步骤S41：对错误口型数据进行唇部开合分析，生成唇部开合运动数据；基于唇部开合运动数据对错误口型数据进行开口时间图像截取，生成开口图像数据；步骤S42：根据开口图像数据进行齿位开合分析，生成齿位开合运动数据；基于齿位开合运动数据对开口图像数据进行开齿时间图像截取，生成开齿图像数据；步骤S43：对开齿图像数据进行降噪平滑处理，生成清晰开齿图像数据；根据清晰开齿图像数据进行舌尖位置标记，生成舌尖运动轨迹数据；步骤S44：将唇部开合运动数据与齿位开合运动数据与舌尖运动轨迹数据进行时序关联，生成口型变化特征数据；其中，步骤S44包括以下步骤：步骤S441：将唇部开合运动数据与齿位开合运动数据与舌尖运动轨迹数据进行时序关联，生成口型运动变化数据；步骤S442：对口型运动变化数据进行轨迹图像转换，生成二维侧方运动图；步骤S443：利用角度变化评估公式，并根据二维侧方运动图对舌尖运动轨迹数据进行运动倾向分析，生成运动方向特征数据；其中，角度变化评估公式如下所示：；式中，为角度平均变化值，为评估的开始时间，为评估的结束时间，为时间变化的索引值，为反余弦函数，为时间为时的舌尖位置横坐标，为时间为时的舌尖位置横坐标，为时间为时的舌尖位置纵坐标，为时间为时的舌尖位置纵坐标，为时间为时的舌尖位置横坐标，为时间为时的舌尖位置纵坐标，为角度偏差修正值；步骤S444：利用运动方向特征数据对舌尖运动轨迹数据进行轨迹模糊估计，生成舌尖运动优化数据；步骤S445：根据舌尖运动优化数据对二维侧方运动图进行运动补充，生成侧方运动优化图；步骤S446：基于侧方运动优化图进行运动特征评估，生成口型变化特征数据；步骤S45：根据口型变化特征数据进行异常变化点标记，生成口型异常范围数据；步骤S46：根据音素错误数据对口型异常范围数据进行异常时间点标记，生成综合口型异常数据；步骤S5：基于综合口型异常数据进行口型示范纠错，生成纠错过程数据；根据纠错过程数据进行难点聚类划分，生成重难点发音数据；根据重难点发音数据进行发音训练，生成优化发音数据。

全文数据：

权利要求：

百度查询：深圳市润东来科技有限公司点读笔的语音识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种纱线张力调节装置

下一篇：一种基于机器视觉的装配在线检测平台

相关技术

一种纱线张力调节装置

一种基于机器视觉的装配在线检测平台

大型集装箱船艉轴辅助安装装置

酿造结构及酿造装置

一种光伏支架及其单元结构

车盖后视装置、行人预警装置、行人预警方法及相关装置

发动机壳体铝铸件气密性检测治具及检测设备

一种建筑造价测绘装置

一种可靠性高的多芯高储能薄膜电容器

一种酸碱液回收利用装置

一种可收集废料的雕塑加工底座

一种具有碰撞缓冲功能的检测浮标

识别相关技术

一种易识别的视觉识别检查装置_宁波众翔智能科技有限公司_202420471493.6

号码识别方法_中移互联网有限公司_202411164755.5

识别TAU的抗体_普罗塞纳生物科学有限公司_201980073684.9

识别介质和物品_日本瑞翁株式会社_202380028686.2

实时尖峰检测和识别_元平台技术有限公司_201980053249.X

喷墨头晶片识别电路_研能科技股份有限公司_202410187633.1

喷墨头晶片识别电路_研能科技股份有限公司_202410187632.7

射频识别读取器_佐藤控股株式会社_202280093788.8

基于双流信息融合的人体动作识别方法和识别系统_中南民族大学_202411229887.1

餐饮内容识别方法以及餐饮内容识别系统_技嘉科技股份有限公司_202011107570.2

语音相关技术

训练文本转语音模型、文本转语音的方法、装置及设备_支付宝(杭州)信息技术有限公司_202410801337.6

一种将IOT设备与多品牌语音助手实现语音控制的方法_广州云智易物联网有限公司_202310568734.9

基于智能语音的加油监测装置_中国石油天然气股份有限公司_202323368855.3

语音情绪识别方法和装置_镁佳(北京)科技有限公司_202411113970.2

语音导览方法及系统_云南腾云信息产业有限公司_202411108561.3

一种适用于车内语音识别系统的语音端点检测方法及模块_清华大学苏州汽车研究院(相城)_202110677109.9

语音驱动唇形生成方法、装置及存储介质_武汉人工智能研究院_202310856520.1

语音实时翻译方法、系统与可视化终端_语联网(武汉)信息技术有限公司_202210420352.7

目标说话人语音提取方法和装置_腾讯科技(深圳)有限公司_202311626816.0

语音记录方法、装置、设备、存储介质及程序产品_维沃移动通信有限公司_202410968926.3

方法相关技术

编码方法及其设备、解码方法及其设备_三星电子株式会社_202411414455.8

显示面板及其制备方法、驱动方法、显示装置_京东方科技集团股份有限公司_202310558383.3

像素电路及其驱动方法、显示面板及其驱动方法_合肥维信诺科技有限公司_202310798771.9

图像生成方法、模型的训练方法、图像处理方法、设备和介质_京东方科技集团股份有限公司_202411178775.8

样本集生成方法、分类模型训练方法及数据分类方法_华晨宝马汽车有限公司_202310537850.4

可重复印标光缆及其制备方法、印标方法和重复印标方法_长飞光纤光缆股份有限公司_202310578778.X

时隙同步方法、时隙分配方法、通信方法及其系统_北京智芯半导体科技有限公司_202411480890.0

任务处理方法、信息抽取方法、文本分类方法、任务处理模型训练方法及基于任务处理模型的信息处理方法_阿里巴巴达摩院(杭州)科技有限公司_202410851095.1

车位检测方法、有效性判断方法、泊车方法、设备和介质_安徽蔚来智驾科技有限公司_202210639084.8

一种计算机系统、启动方法、睡眠方法及唤醒方法_华为技术有限公司_202310574053.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

点读笔的语音识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务