如何通过一场考试来衡量学生的能力呢?
发布于 2021-11-13 11:24 ,所属分类:数学资料学习库
点击下方gongzhong号,回复资料分享,收获惊喜
前言
本期开始之前,小编想问大家一个问题:对于一场数学考试,分数高的应试者一定比分数低的应试者能力高吗?答案显然是否定的。那如何通过一场测试来衡量一个人在某方面的能力呢?当然是项目反应理论(item response theory, IRT)![1]
IRT 简介
IRT
理论引入了试题(item)
的难度、区分度、猜测参数等来对应试者的实际能力进行参数估计,并建立相关的概率模型求解。
通俗来说,传统的测试理论表明正确率就是知识点掌握程度,而IRT
是通过正确率来推测知识点掌握程度。例如,有两个应试者 A 与 B 考试,假如在没有猜题的情况下,A 和 B 得到了相同的分数,那么传统测验理论就会认为二者能力相同,但事实上, A 比 B 做出的题目要难很多,故在IRT
下, A 比 B 的能力要高。
模型简介
项目特征曲线
IRT
理论的其它构建都依赖于项目特征曲线 (item characteristic curve, ICC), 该曲线反映了答对题目的概率与应试者能力大小的关系,曲线通常会由于所引用item
参数不同而不同。一个item
的ICC
曲线图如fig1
所示。
上图所示是一个近乎理想的例子,当值为 0 时,答对题目的概率为 0.5,当值为 -5 时,答对概率几乎为 0,当值为 +5 时,答对概率几乎为 1。
1P model
一参数模型中只引入了难度参数,又称 B 参数或阈值参数,该参数值衡量了一个item
的难度。
相关资源