Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于文本的银行业务知识库处理装置及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:廊坊银行股份有限公司

摘要:本发明涉及银行业务技术领域,特别是涉及基于文本的银行业务知识库处理装置及方法。包括:获取单元,用于获取至少两个银行的银行年报,并提取分别之所对应的资产业务文本以及负债业务文本;转换单元,用于转换得到第一词向量、第二词向量、第一文本数据词列表以及第二文本数据词列表;第一计算单元,用于计算第一词向量和第二词向量之间的关联度;第二计算单元,用于计算第一文本数据词列表和第二文本数据词列表之间的关联度;处理单元,用于判断两个银行之间的资产业务关联等级;预测单元,用于根据资产业务关联等级预测系统性风险等级。本发明通过引入文本数据作为银行关联的评定指标,为预测商业银行系统性风险提供了准确的支持。

主权项:1.基于文本的银行业务知识库处理装置,其特征在于,包括:获取单元,用于获取至少两个银行的银行年报,并根据两个所述银行年报提取分别与两个所述银行所对应的资产业务文本以及负债业务文本;其中,所述资产业务文本包括第一资产业务文本和第二资产业务文本,所述负债业务文本包括第一负债业务文本和第二负债业务文本,所述第一资产业务文本和所述第一负债业务文本与两个所述银行中的一个相对应,所第二资产业务文本和所述第二负债业务文本与两个所述银行中的另一个相对应;转换单元,用于根据所述第一资产业务文本和所述第一负债业务文本转换为第一词向量,以及根据所述第二资产业务文本和所述第二负债业务文本转换为第二词向量,所述转换单元还用于根据所述第一资产业务文本和所述第一负债业务文本转换为第一文本数据词列表,以及根据所述第二资产业务文本和所述第二负债业务文本转换为第二文本数据词列表;第一计算单元,用于通过余弦相似度计算所述第一词向量和所述第二词向量之间的关联度;第二计算单元,用于通过Jaccard相似度计算所述第一文本数据词列表和所述第二文本数据词列表之间的关联度;处理单元,用于根据余弦相似度的计算结果以及Jaccard相似度的计算结果判断两个所述银行之间的资产业务关联等级;预测单元,用于根据所述资产业务关联等级预测系统性风险等级;所述预测单元内设置有文本获取模块,所述文本获取模块用于根据大数据技术获取涉诉数据,所述涉诉数据包括裁判文书网数据以及涉诉案件数据;所述预测单元内还设置有文本提取模块,所述文本提取模块还用于对所述涉诉数据进行关键词提取,并根据预设风险识别模型预测信贷风险等级,所述风险识别模型内有若干预设关键词,以及若干预设信贷风险等级,所述预设信贷风险等级由高到低划分为:三级信贷风险等级、二级信贷风险等级、一级信贷风险等级;其中,当所述涉诉数据中出现的关键词与所述风险识别模型中预设的若干关键词一致率大于等于30%时,输出所述一级信贷风险等级,当所述风险识别模型中预设的若干关键词一致率大于等于60%时,输出所述二级信贷风险等级,当所述风险识别模型中预设的若干关键词一致率大于等于90%时,输出所述三级信贷风险等级;所述预测单元内还设置有文本微调模块,所述文本微调模块用于当所述涉诉数据中出现的关键词与所述风险识别模型中预设的若干关键词一致率小于30%时,对所述涉诉数据中出现的关键词进行提取,并根据提取结果将不存在于所述风险识别模型中的若干所述预设关键词增加至所述风险识别模型中;所述第一计算单元用于通过以下公式计算所述第一词向量和所述第二词向量之间的关联度: ;式中,sim-cosx,y为所述第一词向量和所述第二词向量之间的关联度,用于确定两个所述银行之间的资产业务关联度,所述xi为第一词向量,yi为第二词向量;所述处理单元内预先设定有第一预设余弦相似度关联度T01,第二预设余弦相似度关联度T02,第三预设余弦相似度关联度T03,第四预设余弦相似度关联度T04,且0<T01<T02<T03<T04<1;所述处理单元内预先设定有第一预设资产业务关联等级A1,第二预设资产业务关联等级A2,第三预设资产业务关联等级A3,第四预设资产业务关联等级A4,且A1<A2<A3<A4;所述处理单元还用于根据所述第一词向量和所述第二词向量之间的关联度计算结果j与各预设余弦相似度关联度之间的关系选定相应地资产业务关联等级作为两个所述银行之间的资产业务关联等级;当j<T01时,选定所述第一预设资产业务关联等级A1作为两个所述银行之间的资产业务关联等级;当T01≤j<T02时,选定所述第二预设资产业务关联等级A2作为两个所述银行之间的资产业务关联等级;当T02≤j<T03时,选定所述第三预设资产业务关联等级A3作为两个所述银行之间的资产业务关联等级;当T03≤j<T04时,选定所述第四预设资产业务关联等级A4作为两个所述银行之间的资产业务关联等级;所述第二计算单元用于通过以下公式计算所述第一文本数据词列表和所述第二文本数据词列表之间的关联度: ;式中,sim-jaccard为所述第一文本数据词列表和所述第二文本数据词列表之间的关联度,A为第一文本数据词列表的集合,B为第二文本数据词列表的集合,其中,分子表示两个向量的交集中非零元素个数,分母表示两个向量并集中非零元素个数;所述处理单元内预先设定有第一预设Jaccard相似度关联度K01,第二预设Jaccard相似度关联度K02,第三预设Jaccard相似度关联度K03,且K01<K02<K03;所述处理单元还用于根据所述第一文本数据词列表和所述第二文本数据词列表之间的关联度计算结果i与各预设Jaccard相似度关联度之间的关系对各预设资产业务关联等级进行调升处理并将调升后的资产业务关联等级作为两个所述银行之间的资产业务关联等级;当i<K01,且j<T01时,对所述第一预设资产业务关联等级进行调升一级处理,并将所述第二预设资产业务关联等级作为两个所述银行之间的资产业务关联等级;当i<K01,且T01≤j<T02时,对所述第二预设资产业务关联等级进行调升一级处理,并将所述第三预设资产业务关联等级作为两个所述银行之间的资产业务关联等级;当i<K01,且T02≤j<T03时,对所述第三预设资产业务关联等级进行调升一级处理,并将所述第四预设资产业务关联等级作为两个所述银行之间的资产业务关联等级;当K01≤i<K02,且j<T01时,对所述第一预设资产业务关联等级进行调升两级处理,并将所述第三预设资产业务关联等级作为两个所述银行之间的资产业务关联等级;当K01≤i<K02,且T01≤j<T02时,对所述第二预设资产业务关联等级进行调升两级处理,并将所述第四预设资产业务关联等级作为两个所述银行之间的资产业务关联等级;当K02≤i<K03,且j<T01时,对所述第一预设资产业务关联等级进行调升三级处理,并将所述第四预设资产业务关联等级作为两个所述银行之间的资产业务关联等级;所述预测单元还用于通过以下公式计算系统性风险: ;式中,mesi,t为系统性风险衡量指标,asset-cosi,t为两个所述银行之间的资产业务关联度,lnscalei,t为银行资产总计的对数值,epui,t为经济政策不确定指数,fdirrii,t为外国直接投资监管限制指数,npli,t为银行不良贷款率,ldri,t为银行存贷比,ui,t为随机扰动项,a0为常数项,a1至a6为回归系数;所述预测单元还用于根据计算得到的所述系统性风险的数值g与预设系统性风险危险值g0之间的关系预测系统性风险等级;其中,当g>g0时,将第一系统性风险等级作为预测的所述系统性风险等级;当g>1.2g0时,将第二系统性风险等级作为预测的所述系统性风险等级;当g>1.4g0时,将第三系统性风险等级作为预测的所述系统性风险等级;当g>1.6g0时,将第四系统性风险等级作为预测的所述系统性风险等级。

全文数据:

权利要求:

百度查询: 廊坊银行股份有限公司 基于文本的银行业务知识库处理装置及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。