基于古文典籍的知识抽取方法、系统及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江大学;宁波市天一阁博物院(宁波市保国寺古建筑博物馆);杭州银美科技有限公司

摘要：本发明公开了一种基于古文典籍的知识抽取方法，涉及自然语言处理技术领域，包括S1：选择带标点符号的古文典籍文本在预训练模型上进行预训练以及微调，获得预测古文典籍标点符号模型；S2：将文本输入预测古文典籍标点符号模型中，得到含有标点符号的文本；S3：对含有标点符号的文本预处理，得到词向量文本；S4：对词向量文本进行实体抽取和分类，并标注需要关系抽取的实体为主体，得到标记文本；S5：对标记文本进行预处理，得到词向量+位置向量文本；S6：对词向量+位置向量文本进行关系抽取，获得实体‑关系‑实体结构的三元组关系数据集；本发明还提供了一种运行上述方法的系统以及存储系统的存储介质，能够有效的对古文进行知识抽取。

主权项：1.一种基于古文典籍的知识抽取方法，其特征在于：包括如下步骤：S1：选择带标点符号的古文典籍文本在预训练模型上进行预训练以及微调，获得预测古文典籍标点符号模型；S2：将文本输入步骤1中得到的预测古文典籍标点符号模型中，得到含有标点符号的文本；S3：对含有标点符号的文本进行词向量化预处理，得到词向量文本；S4：通过实体识别模型对词向量文本进行实体抽取和分类，并标注需要关系抽取的实体为主体，得到标记文本；S5：对标记文本进行词向量+位置向量的预处理，得到词向量+位置向量文本；S6：通过关系抽取模型对词向量+位置向量文本进行关系抽取，获得实体-关系-实体结构的三元组关系数据集；S7：根据步骤S6生成的三元组关系数据集，生成知识图谱。

全文数据：

权利要求：

百度查询：浙江大学宁波市天一阁博物院(宁波市保国寺古建筑博物馆) 杭州银美科技有限公司基于古文典籍的知识抽取方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：机载光电设备反射镜均热化控温装置

下一篇：一种基于AI的纸币识别方法及纸币清分机

相关技术

机载光电设备反射镜均热化控温装置

一种基于AI的纸币识别方法及纸币清分机

一种高压线路电气控制机构

基于数字收银机按键的力反馈控制方法及系统

一种水中抗分散裂缝修复注浆料及其制备方法

一种新型鹅星状病毒疫苗及其制备方法与应用

挖掘装置极限工况的结构优化方法、装置、设备及介质

图像检测方法、装置、设备、存储介质及程序产品

一种注册终端设备的方法及装置

芯片内测试电路

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于古文典籍的知识抽取方法、系统及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务