一种基于姓氏的语音识别系统及方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：深圳市三宝创新智能有限公司

摘要：本发明公开了一种基于姓氏的语音识别系统及方法，包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元：所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元，本发明不仅简单便捷，有效地实现高准确率快速姓氏汉字的识别，同时针对姓氏多种易混淆的可能设计一系列的处理方式，提高了语音识别的性能以及识别率，减轻了系统计算负担。

主权项：一种基于姓氏的语音识别系统，包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元：其特征在于，所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。

全文数据：一种基于姓氏的语音识别系统及方法技术领域[0001]本发明涉及语音识别技术领域，尤其涉及一种基于姓氏的语音识别系统及方法。背景技术[0002]语言是人类相互交流最常用、最有效、最重要和最方便的通信形式，语音是语言的声学表现，与机器进行语音交流是人类一直以来的梦想。随着计算机技术的飞速发展，语音识别技术也取得突破性的成就，人与机器用自然语言进行对话的梦想逐步接近实现。语音识别技术的应用范围极为广泛，不仅涉及到日常生活的方方面面，在军事领域也发挥着极其重要的作用。它是信息社会朝着智能化和自动化发展的关键技术，使人们对信息的处理和获取更加便捷，从而提高人们的工作效率。发明内容[0003]本发明的目的在于提供一种基于姓氏的语音识别系统及方法，以解决上述背景技术中提出的问题。[0004]为实现上述目的，本发明提供如下技术方案：一种基于姓氏的语音识别系统，包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。[0005]作为本发明的进一步技术方案:所述语音获取单元为M6027麦克风。[0006]作为本发明的进一步技术方案:所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。[0007]一种基于姓氏的语音识别方法，包含以下步骤：A、用户输入一串语音；B、系统获取语音信号，通过声学模型对语音进行特征提取，在声学模型得出发音序列后，利用语言模型从候选文字序列中找出概率最大的字符串序列；C、从汉字字符串序列中提取出表示姓氏的汉字，通过收集的全部汉字及其拼音字典，可将汉字转换为拼音，若其为多音字，只转换为其中某一个拼音；D、如果该姓氏为单字姓氏，则将其拼音加入列表list，针对姓氏拼音做易混淆发音的处理，以及查找多音字的处理，并将结果全部保存到list中；E、如果该姓氏为双字姓氏，则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音，每个字都可得一个列表，将两个列表进行两两任意组合，找出这些拼音组合对应所有姓氏；F、根据得到的拼音列表，可查找到每个拼音对应的姓氏汉字，列出说话人所表达的全部可能姓氏汉字；G、最终获取对应姓氏汉字列表。[0008]与现有技术相比，本发明的有益效果是:本发明不仅简单便捷，有效地实现高准确率快速姓氏汉字的识别，同时针对姓氏多种易混淆的可能设计一系列的处理方式，提高了语音识别的性能以及识别率，减轻了系统计算负担。附图说明[0009]图1是一种基于姓氏的语音识别系统的结构框图图2是一种基于姓氏的语音识别方法的流程图。具体实施方式[0010]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。[0011]请参阅图I-2,本发明实施例中，一种基于姓氏的语音识别系统，其包括语音获取单元、语音处理单元、姓氏模型单元和预训练单元。[0012]语音获取单元:该单元负责利用M6027麦克风对用户发出的命令进行语音信号采样，并将用户语音信号传送至语音处理单元进行处理，使其通过语音识别，转换为汉字字符串。[0013]语音处理单元:单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。[0014]其中声学模型特征提取模块是利用声学模型对语音信号进行特征提取，将语音转换为声学表示的输出，给出语音是属于某个声学符号的概率；语言模型特征提取模块是在声学模型给出发音序列后，从候选文字序列中找出概率最大的字符串序列；混淆处理模块中有四种处理形式，一为平舌音和翘舌音处理，针对姓氏的拼音，判断是否以z、s或者c开头，若以z、s或者c开头，继续判断拼音中是否存在h，若存在，则去掉;若不存在，则在拼音的第二个位置加上h;二为前鼻音和后鼻音处理，对于后鼻音:字母g—般出现在拼音的开头或者结尾，判断姓氏拼音中是否包或者ing，若包含，则去掉拼音结尾的g，对于前鼻音:an、en和in—般出现在拼音的结尾，判断姓氏拼音中是否存在an、en或者in，若存在，继续判断拼音的最后一位是否为g，若不是，则在拼音的结尾加上g。三为鼻音n和边音1处理，判断姓氏拼音的开头是否为n，若为n，则将开头的n换为1。判断拼音的开头是否为1，若为1，则开头的1换为n;四为多音字处理，在将姓氏汉字转换为拼音的过程，若用户说出的姓氏为多音字，且其并未按照多音字在姓氏中的正确拼音读出，系统根据35个多音字的正确姓氏发音和其他发音的列表，判断所输入拼音是否在其他发音中，若在其他发音中，则取出正确姓氏发音。35个多音字的正确姓氏发音和其他发音的列表通过是系统己有的全部汉字及其拼音的列表中找出姓氏中的所有多音字，其中单字姓氏中有28个多音字，双字姓氏中有7个多音字。[0015]单双姓氏处理模块，其中对于单姓氏，先将单字姓氏的拼音加入列表list，针对姓氏拼音做易混淆发音的处理，以及查找多音字的处理，并将结果全部保存到list中。而对于双姓氏，将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音，每个字都可得一个列表，将两个列表进行两两任意组合，找出这些拼音组合对应所有姓氏。[0016]姓氏模型单元:收集的全部汉字及其拼音字典，其要覆盖尽可能多的汉字，并以此构建姓氏模型。[0017]预训练单元:通过系统构建的构建姓氏模型进行预先训练提取姓氏的识别模式，进行姓氏汉字的提取。[0018]本发明的工作原理是:其工作流程如图2所示：1.用户输入一串语音。[0019]2.系统获取语音信号，通过声学模型对语音进行特征提取，在声学模型得出发音序列后，利用语言模型从候选文字序列中找出概率最大的字符串序列。[0020]3.从汉字字符串序列中提取出表示姓氏的汉字，通过收集的全部汉字及其拼音字典，可将汉字转换为拼音，若其为多音字，只转换为其中某一个拼音。[0021]4.如果该姓氏为单字姓氏，则将其拼音加入列表list，针对姓氏拼音做易混淆发音的处理，以及查找多音字的处理，并将结果全部保存到list中。[0022]5.如果该姓氏为双字姓氏，则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音，每个字都可得一个列表，将两个列表进行两两任意组合，找出这些拼音组合对应所有姓氏。[0023]6.根据得到的拼音列表，可查找到每个拼音对应的姓氏汉字，列出说话人所表达的全部可能姓氏汉字。[0024]7•最终获取对应姓氏汉字列表。

权利要求：1.一种基于姓氏的语音识别系统，包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:其特征在于，所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。2.根据权利要求1所示的一种基于姓氏的语音识别系统，其特征在于，所述语音获取单元为M6027麦克风。3.根据权利要求1所示的一种基于姓氏的语音识别系统，其特征在于，所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。4.一种基于姓氏的语音识别方法，其特征在于，包含以下步骤：A、用户输入一串语音；B、系统获取语音信号，通过声学模型对语音进行特征提取，在声学模型得出发音序列后，利用语言模型从候选文字序列中找出概率最大的字符串序列；C、从汉字字符串序列中提取出表示姓氏的汉字，通过收集的全部汉字及其拼音字典，可将汉字转换为拼音，若其为多音字，只转换为其中某一个拼音；D、如果该姓氏为单字姓氏，则将其拼音加入列表list，针对姓氏拼音做易混淆发音的处理，以及查找多音字的处理，并将结果全部保存到1ist中；E、如果该姓氏为双字姓氏，则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音，每个字都可得一个列表，将两个列表进行两两任意组合，找出这些拼音组合对应所有姓氏；F、根据得到的拼音列表，可查找到每个拼音对应的姓氏汉字，列出说话人所表达的全部可能姓氏汉字；G、最终获取对应姓氏汉字列表。

百度查询：深圳市三宝创新智能有限公司一种基于姓氏的语音识别系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种汽车零部件冲压加工用夹具

下一篇：一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

相关技术

一种汽车零部件冲压加工用夹具

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

一种高速砂尘温控系统

一种鱼类产卵行为与生态水文指标响应关系量化方法

一种可组装与分离的混合装置及其使用方法

一种硼酸钾/石墨烯纳米复合润滑添加剂及其制备方法和复合润滑油

一种组合式固定件依附锁定器

一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

一种飞机复合材料部件超规范修理专家系统

一种基于梯度语义属性嵌入的无监督用户对齐方法

一种汽车动力总成振动强度的分析方法、系统及介质

一种分层架构下的无人机网络动态任务卸载方法

识别相关技术

生物识别方法、设备_安克创新科技股份有限公司_202310268307.9

提升AI识别学习能力_华为技术有限公司_201980068228.5

一种物体识别方法、物体识别装置及电子设备_深圳市锐明技术股份有限公司_202080002303.0

手语识别模型训练方法、识别方法、装置、设备及介质_乐山师范学院_202410905261.1

高识别准确率的黑色烟雾识别及展示方法_杭州普鹤科技有限公司_202410978719.6

意图识别模型的训练方法、意图识别方法、装置和介质_京东科技信息技术有限公司_202410760843.5

图像识别模型的训练方法、图像识别方法及设备_北京达佳互联信息技术有限公司_202110791423.X

车外环境识别装置及车外环境识别方法_株式会社斯巴鲁_201910439393.9

意图识别方法、意图识别模型训练方法、装置及设备_京东科技控股股份有限公司_202110465878.2

一种遮挡物识别系统及识别方法_陕西兴际通通信有限公司_202310246086.5

姓氏相关技术

一种采用姓氏分类的储存柜_武汉东湖学院_202323145110.0

姓氏识别方法、装置及计算机可读存储介质_招商银行股份有限公司_202311093597.4

一种方便使用的手账姓氏印章_北京吾逸物文化有限公司_201922085137.2

一种姓氏传承的系统_毛彦锋_201910051420.5

一种汉语姓氏的识别方法、装置及服务器_阿里巴巴集团控股有限公司_201510088804.6

一种姓氏所属语种的识别方法、装置及服务器_阿里巴巴集团控股有限公司_201510088920.8

一种基于姓氏的语音识别系统及方法_深圳市三宝创新智能有限公司_201711440127.5

一种葫芦式姓氏文化阁_杨雨欣_201720423681.1

基于Y染色体分子标记高效推断姓氏的方法_中国科学院北京基因组研究所_201710868578.2

一种互联网加姓氏族园_北京姓氏族园投资有限公司_201610552372.4

方法相关技术

煤的评价方法和混煤的制备方法以及焦炭的制造方法_杰富意钢铁株式会社_202080019357.8

蚀刻方法_株式会社力森诺科_202280091493.7

测试结构、失效定位方法以及失效分析方法_上海华力微电子有限公司_202410692646.4

图像检测方法、模型训练方法及相关装置_马上消费金融股份有限公司_202410202420.1

资源配置方法、资源发送方法、资源测量方法及电子设备_成都爱瑞无线科技有限公司_202411141003.7

动态密钥生成方法、升级包加密方法、软件升级方法_广汽埃安新能源汽车股份有限公司_202410720762.2

界面显示方法、视频发布方法、视频编辑方法及装置_北京达佳互联信息技术有限公司_202210945497.9

搬运方法_浜松光子学株式会社_202410706496.8

检测装置、检测方法、鞋垫、训练方法和识别方法_宁波荣勃通机电科技有限公司_202110935805.5

七阶WENO格式的构造方法及应用方法_四川大学_202410095523.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于姓氏的语音识别系统及方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务