买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华中师范大学
摘要:本发明属于教育信息化领域,提供一种基于句法分析与关键词检测的MOOC课程评价方法,该方法通过对MOOC课程论坛的讨论区发帖内容进行依存句法分析抽取出包含特定内容的部分,进而通过对指定关键词进行检测、评分,从而得到关于课程各方面质量的评分以及总体评分。本发明方法可以为MOOC课程质量的评价提供可靠、有参考价值的依据,帮助提高MOOC课程质量,从而帮助学生选择合适自己的课程、帮助教师改善自己开设的课程。
主权项:1.一种基于句法分析与关键词检测的MOOC课程评价方法,其特征在于该方法包括以下步骤:1从MOOC课程论坛的讨论区数据中检索出需评价课程的发帖内容;2对步骤1检索出的发帖内容进行句法分析,提取出内容中包含的关系三元组,提取发帖内容中包含的主谓宾、动宾关系,以及包含课程名称的句子;具体过程如下:2-1提取讨论区发帖内容MOOC课程论坛的讨论区数据为记录了每个帖子的课程id、课程名称、作者id、帖子类型、主贴id、帖子id、标题、内容数据的CSV文件,使用Python的pandas模块的read_csv方法对CSV文件进行读取,从CSV文件中提取出待评价课程的课程id、课程名称、标题、内容数据;具体的,定义search方法:将CSV文件以矩阵数据表的形式读入,根据搜索需要设定对应的搜索条件,若需要搜索一门课程的所有发帖则设定课程名称为搜索条件,若需要搜索标题或者内容包含特定关键词的发帖则设定关键词为搜索条件,若需要搜索某一帖子的所有主贴、回帖内容则设定主贴id为搜索条件,对矩阵数据表中的数据的对应部分进行逐一检索,若符合搜索条件,则整条数据保存至一个新的矩阵数据表,并在整个搜索过程结束后将新的矩阵数据表进行输出,为之后的步骤使用;2-2对发帖内容进行依存句法分析使用Python的pyltp模块的Segmentor对象的segment方法对步骤2-1提取出的数据进行分词,再使用Postagger的postag方法对分词结果进行词性标注,最后使用Parser的parse方法进行依存句法分析;2-3对依存句法分析结果进行处理对依存句法分析的结果,提取出其中包含特定依存关系对的部分,具体来说,首先提取出其中包含主谓宾关系的部分,在pyltp模块中,主谓宾关系在依存句法分析中由主谓关系和动宾关系两种依存关系组合而成,若语句中的某个动词与其他词语之间同时存在主谓关系和动宾关系,即可认为语句中包含了主谓宾关系,再提取出仅包含动宾关系的部分,同时,若该句子包含了待评价课程的名称,也将该句子提取出来;2-4对处理结果进行补全对步骤2-3中经过处理得到的结果进行补全:若得到的词语存在定中关系,将对应的定语添加到结果中;若得到的词语为动词,且存在主谓宾关系,则将每个动词对应的主语、宾语也添加到结果中;重复此操作,直到没有新词语可以被添加;补全的结果即为句法分析过程的输出结果;3对步骤2提取出的关系按关键词进行检测,提取出包含关键词的部分,进行情感分析得到情感分值;具体过程如下:3-1关键词的选择与扩充制定课程评价指标及其对应的评分权重,进而对对应的评价指标选取若干关键词,构成评价体系;对选取的关键词进行扩充,扩充关键词需与基础关键词相关,使用Python的synonyms模块的nearby方法,得到与基础关键词相关的一系列词语,再选取其中与课程评价有关的词语作为扩充关键词,最终得到关键词列表;3-2按关键词进行检索评分对于句法分析过程的输出结果,按步骤3-1中得到的关键词列表对每个关键词进行检索,对检索得到的结果,使用Python的paddlehub模块进行情感分析,并得到情感倾向分值,所得到的情感分值在-1到1区间内,小于0的分数代表消极倾向,大于0的分数代表积极倾向,0代表情感中性;4将步骤3中各项评价指标的分值按一定的权重进行汇总,得到课程的总体评分。
全文数据:
权利要求:
百度查询: 华中师范大学 一种基于句法分析与关键词检测的MOOC课程评价方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。