中南大学段俊文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中南大学申请的专利一种基于双仿射的生物医学文档结构化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116595179B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310609957.5,技术领域涉及:G06F16/353;该发明授权一种基于双仿射的生物医学文档结构化方法是由段俊文;郭怀;王建新设计研发完成,并于2023-05-26向国家知识产权局提交的专利申请。
本一种基于双仿射的生物医学文档结构化方法在说明书摘要公布了:本发明公开了一种基于双仿射的生物医学文档结构化方法,包括获取生物医学文档数据集,并针对数据集进行数据预处理;采用预处理后的数据,通过双仿射方法构建生物医学文档分类初步模型;采用构建的初步模型,通过对抗训练完成初步模型的参数更新,构建最终的文档分类模型;采用构建的最终文档分类模型,完成生物医学文档的分类结构化处理;本发明通过双放射直接计算出每个跨度的分类分数,能够降低模型的时间开销;而且本发明的分类效率提升、分类准确度增加。
本发明授权一种基于双仿射的生物医学文档结构化方法在权利要求书中公布了:1.一种基于双仿射的生物医学文档结构化方法,包括如下步骤: S1.获取生物医学文档数据集,并针对数据集进行数据预处理;具体包括: 获取的生物医学文档数据集为公开数据集; 数据预处理具体包括:数据集中提供“句子级别”的标注数据,{S1,S2,…,Si,…,Sn}为一篇包含n个句子的文献,经过句子级别的标注后形成句子和标签对{S1,y1,S2,y2,…,Si,yi,…,Sn,yn},其中,n是文档中包含的句子数量,Si是文档中第i个句子,yi是第i个句子的类别标签; 将句子级别的标注转换成“跨度级别”的标注,具体包括:将一篇包含n个句子的已标注文档{S1,y1,S2,y2,…,Si,yi,…,Sn,yn}中相邻的具有相同类别标签的句子进行合并、组成一个“跨度”,如果某个句子与左右相邻的句子的标签均不相同,则这个句子单独组成一个长度为1的“跨度”;采用三元组s,e,y表示一个“跨度”,其中,s表示跨度中第一个句子在文献中的下标,e表示跨度中最后一个句子在文献中的下标,y表示跨度的标签类别;经过上述的转换,将已标注文档{S1,y1,S2,y2,…,Si,yi,…,Sn,yn}表示为m个跨度三元组{s1,e1,y1,s2,e2,y2,…,si,ei,yi,…,sm,em,ym},其中,m是处理之后获得的跨度数量,且m≤n;si是第i个跨度中第一个句子在原始文献中的下标;ei是第i个跨度中最后一个句子在原始文献中的下标;yi是第i个跨度的类别标签; S2.采用步骤S1预处理后的数据,通过双仿射方法构建生物医学文档分类初步模型; S3.采用步骤S2构建的初步模型,通过对抗训练完成初步模型的参数更新,构建最终的文档分类模型; S4.采用步骤S3构建的最终文档分类模型,完成生物医学文档的分类结构化处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中南大学,其通讯地址为:410083 湖南省长沙市岳麓区麓山南路932号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励