基于一致性度量的文本隐喻检测方法、装置、电子设备及存储介质

导航：龙图腾网> 最新专利技术> 基于一致性度量的文本隐喻检测方法、装置、电子设备及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国科学院新疆理化技术研究所

摘要：本发明公开了一种基于一致性度量的文本隐喻检测方法、装置、电子设备及存储介质，该方法将预处理后文本数据分别输入至待检测文本编码器和目标词基本用法编码器；从待检测文本编码器中提取目标词语境特征和文本语境特征、目标词基本用法编码器中提取目标词基本用法特征和词性特征；通过选择偏好违背程序、隐喻识别程序和语义对比程序分别度量目标词语境特征和文本语境特征一致性、目标词语境特征和目标词基本用法特征一致性、文本语境特征和目标词基本用法特征一致性；最后将一致性度量结果与POS向量拼接输入至分类器以检测隐喻；该发明通过一致性度量及增加语义对比程序模块，更加有效利用隐喻特征信息，提高了文本隐喻检测准确率。

主权项：1.一种基于一致性度量的文本隐喻检测方法，其特征在于，该方法是由文本预处理、编码器编码、文本特征提取、特征一致性度量、词性拼接及分类器分类以检测隐喻，具体操作按以下步骤进行：a、文本预处理：将待检测文本语句及目标词基本用法文本进行预处理，包括：文本清洗中的剔除停用词、数字无关信息、文本大小写转换，去除超文本标记语言标签以保留纯文本信息、通过正则表达式处理换行符、制表符特殊字符、删除重复字符以减少噪音，并进行词干提取或词形还原，使用自然语言处理工具包为文本词汇添加词性标记、使用拼写检查工具处理拼写错误，根据任务需求对文本进行截断或填充，以确保模型在处理文本时具有一定的规范和统一性；b、编码器编码：使用预训练语言模型DeBERTa作为待检测文本编码器和目标词基本用法编码器，分别对预处理后的待检测文本及目标词基本用法文本进行编码，获取待检测文本语句及目标词基本用法文本向量表示；c、文本特征提取：从编码后的待检测文本向量表示中使用加权平均方式提取出目标词语境特征和文本语境特征，从编码后的目标词基本用法文本向量表示中提取出目标词基本用法特征和目标词词性特征；d、特征一致性度量：通过选择偏好违背程序计算目标词语境特征和文本语境特征的一致性，判断目标词语义与其上下文语义一致性来检测隐喻；通过隐喻识别程序计算目标词语境特征和目标词基本用法特征的一致性，判断目标词的基本用法和目标词在当前语境中含义的一致性来检测隐喻；通过语义对比程序计算文本语境特征和目标词基本用法特征的一致性，比较目标语句语义与目标词的基本用法的一致性来检测隐喻；e、词性拼接：将步骤d中通过选择偏好违背程序、隐喻识别程序和语义对比程序计算的一致性特征与步骤c中提取的目标词词性特征进行串联拼接，得到更丰富的特征表示；f、分类器分类：使用分类器对步骤e拼接后特征表示进行分类，判断该文本是否包含隐喻表达，以检测隐喻。

全文数据：

权利要求：

百度查询：中国科学院新疆理化技术研究所基于一致性度量的文本隐喻检测方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种接头密封效果好的光伏水泵控制器

下一篇：一种能够调节的建筑幕墙防脱落装置

相关技术

一种接头密封效果好的光伏水泵控制器

一种能够调节的建筑幕墙防脱落装置

一种紧固件退火箱

一种具有多向角度可调的直播设备

一种材料转运用可调节式托盘架

一种新型材质的中央空调出风口

绝缘手套晾晒架

一种应用在电机转子上的绝缘磁钢片

一种复合补强片

一种防跑偏的3D打印材料输送装置

一种耐寒高弹性电源线

一种高缓冲钻头

方法相关技术

图像处理模型训练方法、图像处理方法、视频处理模型训练方法及视频处理方法_阿里巴巴(中国)有限公司_202410891514.4

操作指导方法、高炉的操作方法、铁水的制造方法、操作指导装置_杰富意钢铁株式会社_202180047086.1

样本构建方法、代码处理方法及电子设备_浙江大华技术股份有限公司_202411469887.9

搬送装置、移载方法、搬送方法及半导体装置的制造方法_JSW阿克迪纳系统有限公司_202280094733.9

数据存储方法、读取方法、装置及电子设备_平凯星辰(北京)科技有限公司_202411467374.4

无线接入处理方法、信息传输方法及设备_维沃移动通信有限公司_202210435209.5

模型训练方法及元数据处理方法_中电信人工智能科技(北京)有限公司_202410990728.7

请求处理方法、页面展示方法和装置_中国建设银行股份有限公司_202411164829.5

测试结构、失效定位方法以及失效分析方法_上海华力集成电路制造有限公司_202411037918.3

通信方法及装置_华为技术有限公司_202010486439.5

检测相关技术

用于检测设备的方法、检测设备_罗伯特·博世有限公司_202380033372.1

图像检测装置以及图像检测方法_聚晶半导体股份有限公司_202010483394.6

电压检测电路和电压检测方法_惠州亿纬锂能股份有限公司_202411345737.7

检测装置_株式会社日本显示器_202380033183.4

削骨器械磨损检测装置、磨损检测系统以及磨损检测方法_上海电气集团股份有限公司_202210168422.4

氯化氢浓度检测装置及其检测方法_天辰齐翔新材料有限公司_202411455328.2

一种视频异常检测装置及检测方法_合肥工业大学_202411116866.9

一种光学组件检测装置及其检测方法_江西联昊光电有限公司_202311339311.6

物体检测装置以及物体检测方法_株式会社电装_201980086107.3

AGM电池隔板损坏检测方法及检测终端_风帆有限责任公司_202111451494.1

装置相关技术

面发光装置、显示装置以及照明装置_松下知识产权经营株式会社_202380031514.0

光源装置及包括光源装置的显示装置_三星显示有限公司_201911354799.3

吸烟装置与吸烟装置的切换装置_深圳市双盈电子科技有限公司_202420184359.8

编码装置、解码装置、以及记录介质_松下电器(美国)知识产权公司_202410826083.3

制动装置、驱动单元和工业装置_ABB瑞士股份有限公司_202080106699.3

编码装置、解码装置、以及记录介质_松下电器(美国)知识产权公司_202410826078.2

电化学装置和电子装置_宁德新能源科技有限公司_202411072267.1

密封装置以及铣轮装置_徐州景安重工机械制造有限公司_202411050805.7

电化学装置和电子装置_宁德新能源科技有限公司_202411070203.8

天线装置和通信装置_株式会社村田制作所_202080058233.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于一致性度量的文本隐喻检测方法、装置、电子设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务