中国科学院地理科学与资源研究所王曙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院地理科学与资源研究所申请的专利基于上下文语境的网络文本有偏地理信息自校正方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443082B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411618411.7,技术领域涉及:G06F40/205;该发明授权基于上下文语境的网络文本有偏地理信息自校正方法是由王曙;诸云强设计研发完成,并于2024-11-13向国家知识产权局提交的专利申请。
本基于上下文语境的网络文本有偏地理信息自校正方法在说明书摘要公布了:本发明公开了一种基于上下文语境的网络文本有偏地理信息自校正方法、装置、存储介质和计算机系统,包括:解析获得段落目标语句的待校正地理信息,具体指时间信息和空间信息;从段落目标语句多个时间信息和空间信息中筛选分析,进行地理信息的自校正;从段落上下文邻接语句中进行地理信息筛选判断,确定可自校正的时间信息和空间信息;利用上下文精准语境进行地理信息自校正。本发明可有效利用上下文信息中的相关地理信息内容,减少目标语句中地理信息的偏差,使获取的目标地理信息更加精准,适用于新闻、社交媒体等含地理信息的网络文本,更好地服务于网络地理信息资源的利用。
本发明授权基于上下文语境的网络文本有偏地理信息自校正方法在权利要求书中公布了:1.一种基于上下文语境的网络文本有偏地理信息自校正方法,其特征在于,包括以下步骤:S1、解析获取指定段落P目标语句St中待自校正的地理信息要素GeoInfo;S2、基于目标语句St中的多个信息,按照句内自校正算法,对地理信息要素GeoInfo进行自校正;步骤S2包括以下子步骤:S2-1、使用时间识别方法或空间位置识别方法,对地理信息要素GeoInfo所在语句St进行识别;S2-2、获取句内时间要素的顺序化序列Tt={Tti},其中序列中的每一时间要素按照其在文本中的出现顺序排列,i表示该时间要素在文本中从前到后出现的顺序;并且字符连续的时间要素描述t1t2t3需额外记录为一个Ttsi,其构成顺序化序列Tts={Ttsi};S2-3、获取句内空间位置要素的顺序化序列Lt={Lti},其中序列中的每一空间位置要素按照其在文本中的出现顺序排列,i表示该空间位置要素在文本中从前到后出现的顺序;并且字符连续的空间位置要素描述l1l2l3需额外记录为一个Ltsi,其构成顺序化序列Lts={Ltsi};S2-4、根据句内时间自校正函数公式: 将待自校正的时间信息To进行校正运算,其中,To是输入的待自校正的时间信息;Tts[1]表示步骤S2-2中连续时间要素描述顺序化序列Tts的首个值;Tt[1]表示步骤S2-2中顺序化序列Tt的首个值;ft表示句内时间自校正函数;S2-5、根据句内空间位置自校正函数公式: 将待自校正的空间位置信息Lo进行校正运算,其中,Lo是输入的待自校正的空间位置信息;Lts[1]表示步骤S2-3中连续空间位置要素描述顺序化序列Lts的首个值;fl表示句内空间位置自校正函数;S3、从段落P包含的上下文语句{Sk}中,按照段落自校正算法,进行地理信息筛选判断;步骤S3包括以下子步骤:S3-1、依次解析段落P包含的上下文语句{Sk},分别得到每个语句的时间要素顺序化序列Tsk={Tskj},以及字符连续的时间要素顺序化序列Tsks={Tsksj},其中,Sk表示段落P中的第k个句子,j表示该时间要素在句子k中从前到后出现的顺序;S3-2、依次解析段落P包含的上下文语句{Sk},分别得到每个语句的空间位置要素顺序化序列Lsk={Lskj},以及字符连续的空间位置要素顺序化序列Lsks={Lsksj},其中,Sk表示段落P中的第k个句子,j表示该空间位置要素在句子k中从前到后出现的顺序;S3-3、确认并找到段落P中的首个字符连续的时间要素,根据下面公式进行筛选: 其中,Ts0表示首个字符连续的时间要素,Tsks表示步骤S3-1中的字符连续时间要素顺序化序列,表示从段落P第1个句子开始到待自校正的时间信息所在第t个语句St;S3-4、确认并找到段落P中,距离待校正空间位置要素距离最近的,字符连续的空间位置要素,根据下面公式进行筛选: 其中,Ls0表示首个字符连续的空间位置要素,Lsks表示步骤S3-2中的字符连续空间位置要素顺序化序列,表示从段落P第1个句子开始到待自校正的空间位置信息所在第t个语句St;S4、利用句内及段落两层上下文精准语境,校正地理信息要素GeoInfo;步骤S4包括以下子步骤:S4-1、根据上下文精准语境中的时间要素自校正公式: 将待自校正的时间信息To进行校正运算,其中,To是输入的待自校正的时间信息;gt表示上下文精准语境中的时间要素自校正函数;Ts0表示步骤S3-3中首个字符连续的时间要素;ftTo表示步骤S2-4中句内时间自校正函数的结果;S4-2、根据上下文精准语境中的空间位置要素自校正公式: 将待自校正的空间位置信息Lo进行校正运算,其中,Lo是输入的待自校正的空间位置信息;gl表示上下文精准语境中的空间位置要素自校正函数;Ls0表示步骤S3-4中首个字符连续的空间位置要素;flLo表示步骤S2-5中句内空间位置自校正函数的结果;S4-3、得到地理信息要素GeoInfo={To,Lo}的上下文语境自校正结果{gtTo,glLo}。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院地理科学与资源研究所,其通讯地址为:100101 北京市朝阳区大屯路甲11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。