摘要
文章针对学生管理论坛学习行为分析需求,基于自然语言处理技术,利用scrapy爬虫框架对中国继教网初中数学学生管理论坛进行文本数据挖掘,开展机器学习环境下的文本挖掘学生学习问题的深入分析。利用论坛师生学习数据信息,探讨数据挖掘在数学学习论坛中具体应用方法,着重针对文本数据建立LDA模型、聚类分析,梳理教学过程中出现的高频词,帮助教育者针对性处理教育问题。
引文
[1]白杨.大数据环境下的文本挖掘教学内容探讨[J].无线互联科技,2018,15(9):86-87.
[2]吴刚勇,张千斌,吴恒超,顾冰.基于自然语言处理技术的电力客户投诉工单文本挖掘分析[J].电力大数据,2018,21(10):68-73.
[3]陈慧.基于特征细分的中文情感分析研究[D].上海:上海师范大学,2018.
[4]蔡永明,长青.共词网络LDA模型的中文短文本主题分析[J].情报学报,2018,37(3):305-317.
[5]左明章,赵蓉,王志锋,李香勇,徐燕丽.基于论坛文本的互动话语分析模式构建与实践[J].电化教育研究,2018,39(9):51-58.
[6]何声清,綦春霞.数学学优生和后进生学习表现及其影响因素的差异研究——基于我国6个地区的大规模测试[J].教育科学研究,2018(3):54-60.
[7]陈迪,代艳君,王志锋.论坛主题挖掘研究综述[J].计算机工程与应用,2017,53(16):36-44.
[8]何恩贵,杜丙新.中文文字云图生成技术的研究及应用[J].中国电化教育,2013(8):116-120.