买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:元域数造(厦门)科技有限公司
摘要:本发明公开了一种基于AIGC的外语训练内容生成方法,包括以下步骤:构建语料数据库和原始素材库;针对语料数据库进行场景分类;获得素材特征库并进行场景分类;获得匹配的语料子数据库和素材特征子数据库;基于内容生成获得场景图像;对场景图像进行场景识别和匹配度计算;显示场景图像并进行口语训练;收集发音错误信息进行校正训练。本发明能够根据学习者的能力水平选定学习内容,并基于学习内容生成外语场景图像,能够帮助学习者在外语学习过程中进行理解和记忆。
主权项:1.一种基于AIGC的外语训练内容生成方法,其特征在于,包括以下步骤:S1、构建语料数据库和原始素材库,所述语料数据库包含用于外语训练的语料数据,所述原始素材库包含携带文本信息和图像信息的原始素材数据;S2、针对所述语料数据库,根据预先设定的场景类别对语料数据进行场景分类,并基于场景类别将语料数据库划分为多个语料子数据库;S3、针对所述原始素材库,利用问答模型获得素材特征数据库,所述素材特征库至少包括特征ID、语义特征及对应的图像区域,基于素材特征数据库的语义特征按照预先设定的场景类别进行场景分类,并基于场景类别将素材特征数据库划分为多个素材特征子数据库;S4、获取拟进行外语训练的场景类别信息,基于场景类别信息匹配语料子数据库和素材特征子数据库,针对当下匹配的语料子数据库,随机提取一组目标语料数据;S5、针对每个目标语料数据,利用问答模型进行解析,获得对应的一组训练语义特征P,,其中P为该组训练语义特征的集合,pi为第i个训练语义特征,m为训练语义特征的总数量,基于训练语义特征在相应的素材特征子数据库中查找匹配的语义特征及对应的图像区域素材Q,,其中Q为该组训练语义特征的集合,为第j个图像区域素材,n为图像区域素材的总数量,基于AIGC内容生成方法生成一组场景图像D,,其中D为该组场景图像的集合,Dk为第k个场景图像,s为场景图像的总数量;S6、对步骤S5生成的场景图像进行场景识别,判断是否与场景类别信息匹配,若否则剔除,若是则通过语义相关性分析计算场景图像和训练语义特征之间的匹配度得分并进行排序,保留匹配度得分最高的场景图像作为目标场景图像,所述语义相关性分析通过以下方法实现:利用问答模型对场景图像进行解析,获得一组场景语义特征Dkr,,其中,Dkr为第k个场景图像Dk解析的场景语义特征的集合,为第Dkr为第k个场景图像Dk解析的第j个场景语义特征,r为解析的场景语义特征的总数量;将获得的一组场景语义特征Dkr与对应的一组训练语义特征P进行特征映射;计算场景语义特征和训练语义特征的特征相似性值,将特征相似性值作为匹配度得分,所述特征相似性值通过下式计算:,其中,WDk,P为第k个场景图像Dk的场景语义特征与训练语义特征P的特征相似性值,Tji为与pi两个特征的距离权重,cj,i为与pi两个特征的距离;S7、将目标语料数据和对应的目标场景图像通过显示设备进行显示,训练者进行口语训练,通过声音接收设备获得训练者的语音数据,对语音数据进行分析,获得口语训练得分,若口语训练得分大于预设得分阈值则通过显示设备显示下一个目标语料数据和对应的目标场景图像,若口语训练得分小于预设得分阈值则提示重新训练;S8、收集训练者口语训练过程中的发音错误信息,基于发音错误信息对应的外语单词获得校正训练数据集,基于校正训练数据集在语料子数据库提取出一组匹配的目标语料数据,并执行步骤S5。
全文数据:
权利要求:
百度查询: 元域数造(厦门)科技有限公司 一种基于AIGC的外语训练内容生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。