密级:
本 科 毕 业 论 文
(设 计)
题 目基于贝叶斯知识追踪的学生知识点掌握度预测研究
学 院: 数学与信息科学学院
专 业: 计算机科学与技术 班级: 2025级二班
学生姓名: 姜月玲 学号: 20250612235
指导教师: 职称:
二○二五年五月
南昌师范学院毕业论文原创性声明和使用授权说明
原创性声明
本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果。未使用 AIGC 技术进行代写、剽窃、伪造等违规行为。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式表明。本人完全意识到本声明的法律后果由本人承担。
作者签名: 日期:
论文版权使用授权书
本论文作者完全了解学校有关保留、使用论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权南昌师范学院可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本论文。
保密□,在________年解密后适用本授权书。
本论文属于:
不保密☑。
(请在以上相应方框内打“√”)
作者签名: 日期:
导师签名: 日期:
摘 要
随着在线教育平台的蓬勃发展,海量的学生行为数据为个性化学习提供了新的契机。准确追踪学生对知识点的掌握状态是自适应学习系统的核心问题。本研究旨在利用贝叶斯知识追踪(BKT)模型,基于学生的答题序列数据,动态预测其知识点掌握概率。 本文首先回顾了教育数据挖掘及知识追踪的国内外研究现状,重点阐述了贝叶斯知识追踪模型的理论基础及隐马尔可夫模型的构建原理。其次,采用 ASSISTments 2009-2010 "Skill Builder" 公开数据集,对数据进行清洗、筛选与预处理。接着,使用 Python 语言及 PyBKT 库实现了 BKT 模型,并对模型的四个核心参数(先验概率、学习率、猜测率、失误率)进行了训练与估计。 实验结果表明,BKT 模型在单技能追踪任务中表现出良好的预测性能,AUC 值达到 0.75 以上。通过对参数的分析,发现该知识点对初学者具有一定的难度,且随着练习次数的增加,学生的掌握概率显著上升。本研究验证了 BKT 模型在教育数据挖掘中的有效性,为教学干预提供了数据支持,具有一定的理论意义与应用价值。
关键词:贝叶斯知识追踪;教育数据挖掘;个性化学习;隐马尔可夫模型
Abstract
With the vigorous development of online education platforms, massive student behavior data has provided new opportunities for personalized learning. Accurately tracking students' mastery of knowledge points is the core issue of adaptive learning systems. This study aims to use the Bayesian Knowledge Tracing (BKT) model to dynamically predict students' probability of mastering knowledge points based on their answer sequence data.
This paper first reviews the domestic and international research status of educational data mining and knowledge tracing, focusing on the theoretical basis of the Bayesian Knowledge Tracing model and the construction principles of Hidden Markov Models. Secondly, the ASSISTments 2009-2010 "Skill Builder" public dataset was used for data cleaning, screening, and preprocessing. Then, the BKT model was implemented using the Python language and the PyBKT library, and the four core parameters of the model (prior probability, learning rate, guess rate, and slip rate) were trained and estimated.
Experimental results show that the BKT model performs well in single-skill tracking tasks, with an AUC value exceeding 0.75. Through the analysis of the parameters, it was found that the knowledge point has a certain difficulty for beginners, and the students' mastery probability increases significantly with the number of exercises. This study verifies the effectiveness of the BKT model in educational data mining, provides data support for teaching intervention, and has certain theoretical significance and application value.
Keywords: Bayesian Knowledge Tracing; Educational Data Mining; Personalized Learning; Hidden Markov Model