买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:知学云(北京)科技股份有限公司
摘要:本发明涉及人工智能语音陪练隐私保护技术领域,具体为用于人工智能语音陪练的隐私保护方法,方法包括,用户在与人工智能语音陪练交流时,对用户语音特征去标识化;构建隐私信息筛选器,对含有隐私内容的语音信息进行模糊化处理;用户在完成与人工智能语音陪练后,自行选择是否将陪练数据进行存储;构建加密模型,对选择存储的语音陪练数据进行加密,并构建对应的用户访问权限,本发明提供的隐私保护方法,解决了在与人工智能进行语音交流时会出现的语音特征泄露的问题,并且通过构建隐私内容过滤器,可以过滤在交流时不经意间说出的自身隐私问题。
主权项:1.用于人工智能语音陪练的隐私保护方法,其特征在于:包括,用户在与人工智能语音陪练交流时,对用户语音特征去标识化;构建隐私信息筛选器,对含有隐私内容的语音信息进行模糊化处理;用户在完成与人工智能语音陪练后,自行选择是否将陪练数据进行存储;构建加密模型,对选择存储的语音陪练数据进行加密,并构建对应的用户访问权限;所述对用户语音去标识化包括,用梅尔频率倒谱系数提取用户语音特征、对用户语音特征注入扰动以及生成新语音特征的语音信息;所述梅尔频率倒谱系数包括,语音信号预处理、分帧、傅里叶变换、梅尔滤波以及离散余弦变换;所述语音信号预处理包括对语音信号进行降噪,去除语音信号中除人声的杂音;所述分帧是将语音信号分成短时段的帧,并使用窗函数来加权每一帧,令原始语言信号为,第帧的信号为;所述傅里叶变换是对每一帧的帧行傅里叶变换,得到语音信号的频谱信息,令第帧的频谱为,傅里叶变换的具体公式为: ;其中,N是语音信号的长度,是语音信号在时域的取样值,是傅里叶变换在频域的值,是虚数单位;所述梅尔滤波包括,将频谱通过一组梅尔滤波器,梅尔滤波器在梅尔频率上均匀分布,梅尔频率的计算公式如下: ;其中,f为频率,梅尔滤波的中心频率为: ;其中,为傅里叶变换的点数,为梅尔频率,为采样率;所述离散余弦变换是对取对数后的梅尔滤波器的输出进行离散余弦变换,得到梅尔频率倒谱系数;令第i帧的梅尔频率倒谱系数为,m为系数的索引: ;其中,M为离散余弦变换系数的个数,k为参数;梅尔频率特征向量即为,表示语音信号在梅尔频率倒谱上的特征;所述对用户语音特征注入扰动包括,对每个梅尔滤波器的中心频率注入频率扰动,选择正态分布中的随机值作为注入的频率扰动数值;梅尔滤波器在注入扰动后,输出新的梅尔频率倒谱系数,将新的梅尔频率倒谱系数还原成语音信息,实现用户输入语音特征的去标识化;所述隐私信息筛选器包括,训练机器学习模型,识别语音信息中的隐私内容,所述隐私内容包括敏感信息和身份信息;利用自然语言处理技术,将用户输入的语音信息转换成文本信息,将文本信息机器学习模型识别文本信息中的隐私内容,把隐私内容进行模糊化处理后,通过文本转语音技术重新转换成语音;所述训练机器学习模型的步骤如下:构建数据集,数据集划分为训练集、验证集和测试集,将包含隐私内容的文本标签标记为1,不含隐私内容的标签标记为0,通过训练集训练机器学习模型识别隐私内容的文本,并通过验证集和测试集验证机器学习模型的性能,当机器学习模型的性能达到要求时,停止训练。
全文数据:
权利要求:
百度查询: 知学云(北京)科技股份有限公司 用于人工智能语音陪练的隐私保护方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。