首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于TF-IDF算法和TextRank算法的智能阅卷方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南阳理工学院

摘要:本申请实施例公开了一种基于TF‑IDF算法和TextRank算法的智能阅卷方法、装置、设备及存储介质,属于大数据处理技术领域,该方法包括:获取阅卷人员预先写入的标准答案;基于TF‑IDF算法和TextRank算法对所述主观题答案集进行文字关键词提取;获取待审阅的答题文档;基于Matlab模型的BP神经网络算法获取选择答案测试集;使用Tesseract‑OCR文字识别技术,获取主观答案测试集;基于TF‑IDF算法和TextRank算法对所述主观答案测试集进行文字关键词提取;分别获取选择题的分值和主观题的分值,再获取最终分值。本申请有助于教师或者审阅人员进行快速阅卷,节省了人力物力和时间消耗。

主权项:1.一种基于TF-IDF算法和TextRank算法的智能阅卷方法,其特征在于,包括下述步骤:获取阅卷人员预先写入的标准答案,基于消息队列的形式,将所述标准答案读出到文档中,生成选择题答案集和主观题答案集;基于TF-IDF算法和TextRank算法对所述主观题答案集进行文字关键词提取或者基于TF-IDF算法和TextRank算法对主观答案测试集进行文字关键词提取,包括:步骤一,基于TF-IDF算法对所述主观题答案集或者主观答案测试集进行文字关键词提取,获取到若干关键词,具体步骤如下,基于预设分词工具,对所述主观题答案集或者主观答案测试集中所有文字按照词性进行分词处理,获取到若干词语片段,统计所述词语片段的总个数N,基于预设的算法公式:计算每一个词语片段在所述主观题答案集或者主观答案测试集中的权重,其中,T为每一个所述词语片段在所述N中出现的总次数;步骤二,基于TextRank算法对所述主观题答案集或者主观答案测试集进行文字关键词提取,获取到若干关键词,具体步骤如下,基于预设分词工具,对所述主观题答案集或者主观答案测试集中所有文字按照词性进行分词处理,获取到若干词语片段,统计所述词语片段的总个数N,对所述若干词语片段构建网络节点模型,使用textrank函数,获取每一个词语片段在所述主观题答案集或者主观答案测试集中的权重;步骤三,将所述步骤一获取到的权重基于从高到低的顺序排序,选择出前m个权重对应的词语片段,作为关键词的第一候选词集,同时,将所述步骤二获取到的权重基于从高到低的顺序排序,选择出前m个权重对应的词语片段,作为关键词的第二候选词集;步骤四,将所述第一候选词集和第二候选词集中的词语片段进行匹配,若存在某个词语片段,同时属于第一候选词集和第二候选词集,则将所述词语片段进行筛选,加入到最终候选集中,将所述最终候选集中的词语片段作为主观题答案集或者主观答案测试集的特征文字;同时,直接获取选择题答案集中的全部字符,作为选择题答案集的特征文字;获取待审阅的答题文档,并对其进行扫描,获取到所述答题文档的扫描图片;基于Matlab模型的BP神经网络算法识别出所述扫描图片中的字母部分,若所述扫描图片中的字母部分为连续片段,则将所述字母部分作为选择答案测试集;基于预设汉字语言包,使用Tesseract-OCR文字识别技术,识别出答题图片中的汉字部分,作为主观答案测试集;将所述选择答案测试集中元素与所述选择题答案集的特征文字进行对比,获取到两两相同的字母个数,将所述个数与单个选择题对应的分值进行相乘,获取到所述选择答案测试集对应的实际分值M1;基于TF-IDF算法和TextRank算法对所述主观答案测试集进行文字关键词提取,所述TF-IDF算法具体包括对于所述主观题答案集中内容进行采用结巴分词的方式,对候选关键词计算结果进行倒序排列,得到排名前TopN个词汇作为所述主观题答案集的关键词,将提取到的文字关键词作为主观答案测试集的特征文字,将所述主观答案测试集的特征文字与所述主观题答案集的特征文字进行相似度计算,使用百分比的格式表示所述相似度,并基于预设的算法公式M2=c×D:,获取到主观答案测试集的实际分值M2,其中,c为所述相似度,D为主观题的总分值;基于预设的加值法M=M1+M2,分别获取所述选择答案测试集对应的实际分值M1和所述主观答案测试集的实际分值M2,获取到M,即为本次阅卷的最终分值。

全文数据:

权利要求:

百度查询: 南阳理工学院 基于TF-IDF算法和TextRank算法的智能阅卷方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。