买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:合肥霍因科技有限公司
摘要:本发明涉及语义映射技术领域,具体公开了一种基于人工智能和大数据的标准化语义映射方法及系统,包括:步骤S1:将历史待映射数据划分为各个语句段,将全部语义特征向量划分为若干类;将语义特征向量的总数超过所述数目阈值的一类记为高频类,并选出中心向量;步骤S2:逐个对比映射结果和中心映射结果的可替换词汇,获得中心映射结果的替换词;步骤S3:将高频类的中心向量、全部语义特征向量、中心映射结果与全部替换词进行存储,得到映射库,并得到若干拟映射结果;步骤S4:选取出中心向量与语义向量语义相似度最高的高频类,获取该高频类内与语义向量相似度最高的语义特征向量对应的拟映射结果,作为待映射语句段的映射结果。
主权项:1.一种基于人工智能和大数据的标准化语义映射方法,其特征在于,包括以下步骤:步骤S1:获取历史待映射数据和历史映射结果数据;将所述历史待映射数据划分为各个语句段;获取语句段的语义特征向量,根据所述语义特征向量两两之间的夹角大小将全部语义特征向量划分为若干类;设定数目阈值,将语义特征向量的总数超过所述数目阈值的一类记为高频类,在所述高频类的语义特征向量中选取出中心向量;步骤S2:在所述历史映射结果数据中,获取语义特征向量的映射结果,记中心向量的映射结果为中心映射结果;对映射结果和中心映射结果进行分词处理,得到若干个词汇;根据各词汇的词性选取出可替换词汇,所述可替换词汇包括名词和形容词词性的词汇;逐个对比映射结果和中心映射结果的可替换词汇,将映射结果中与所述中心映射结果相同位置上不同的可替换词汇记为替换词;步骤S3:将高频类的中心向量、全部语义特征向量、中心映射结果与全部替换词进行存储,得到映射库;在所述映射库中,依次更换中心映射结果中的替换词,得到若干拟映射结果;各语义特征向量与一个拟映射结果相关联;步骤S4:获取待映射语句段的语义特征向量,记为语义向量;获取所述语义向量与各高频类的中心向量的语义相似度,当所述语义相似度超过预设相似度阈值时,选取出中心向量与所述语义向量语义相似度最高的高频类;根据所述映射库,获取该高频类内与语义向量相似度最高的语义特征向量对应的拟映射结果,作为所述待映射语句段的映射结果。
全文数据:
权利要求:
百度查询: 合肥霍因科技有限公司 一种基于人工智能和大数据的标准化语义映射方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。