中国学术文献网络出版总库

刊名: 教育研究
主办: 中国教育科学研究院
周期: 月刊
出版地:北京市
语种: 中文;
开本: 大16开
ISSN: 1002-5731
CN: 11-1281/G4
邮发代号:2-277

历史沿革:
专题名称:教育理论与教育管理
期刊荣誉:社科双效期刊;国家新闻出版总署收录;中国期刊网核心源刊;CSSCI 中文社会科学引文索引来源期刊;北京大学《中文核心期刊要目总览》来源期刊;
创刊时间:1979

基于spss小学数学试卷信度和效度分析

【作者】 黄安将

【机构】 广西百色市田阳县第七小学

【摘要】
【关键词】
【正文】  摘 要:试卷是教育测量中最有力的工具。信度和效度作为反映试卷质量的重要指标。试卷命题质量的优劣,直接影响着对教与学进行评估的有效性和决策的科学性。本文以百色市某县小学二年级期中数学试卷为例,基于spss从信度、效度视角对试卷命题进行质量分析,得出结论:2015年百色市某县小学二年级期中数学试卷的克朗巴哈α=0.865,KMO=0.728,经过分析可得出结论:百色市某县小学二年级期中数学试卷命题质量基本上合格。但仍有较大的改进空间。
  关键词:spss;信度分析;效度分析;试卷分析
  1.引言
  测验是教育测量中最有力的工具。基于试卷分析,可以诊断、评估教与学能力,理性分析优劣,进而优化教学提高教学质量。积累编制试卷经验,提高教师编制试卷的水平,夯实优质题库建设的基础。
  SPSS是一种应用最为广泛的统计软件,本文运用SPSS 16.0软件,以信度、效度指标为视角, 本文以小学二年级期中数学为例卷进行定量分析,目的是为试卷定量分析技术提供参考与借鉴。
  2.数据录入
  打开SPSS16.0,进入SPSS16.0的数据编辑器界面。
  2.1定义变量
  用鼠标单击数据编辑器左下方的Variable View标签,就进入定义变量的显示界面。在左起第一列输入变量名,在第一行的第一个单元格中输入“xh”,定义变量xh的小数位为0,变量xh的标签为“学生编号”,其余均用SPSS16.0的默认值。从第二行的第一单元格起,输入“T1”,“T2”……余此类推,直到在第二十五行的第一单元格输入“T24”为止;定义“T1”、“T2”……“T24”小数位取1,定义“T1”、“T2”……的标签为“第1题”、“第2题”……“第24题”为止。除名称栏、小数位栏和标签栏由上述定义外,其余均用SPSS16.0的默认值。
  2.2输入数据
  单击Data view的标签,进入数据编辑器界面,就可以开始输入数据。输入数据时,在第一行的第一个单元格中输入学生学号1,从第一行第二列起,直接输入第一个个案(考生)在各个题目相应的得分, 在第二行的第一个单元格中输入学生学号2,第二行第二列起输入第二个个案(学生)在各个相应题目上的得分,依次类推,直到把测试对象的所有数据输入完整为止。
  3.试卷分析
  3.1信度分析
  3.1.1信度分析操作方法
  信度(reliability)是衡量试题可靠性与稳定性的指标,信度高说明考生分数不易受偶然因素造成的误差的影响,分数可以比较真实地反映学生的实际水平。考试信度计算一般采用克伦巴赫系数法。
  测试对象的所有原始数据输入完整后,我们便可以进行项目(题目)分析。单击数据编辑器上面菜单栏的Analyze(分析),将鼠标移动到下拉菜单的Scale(尺度分析)处,单击下一级菜单的Reliability Analysis(可靠性分析),进入可靠性分析对话框。在左边备选框中选中要进入分析的项目T1——T24共24个变量,点击中间方向按钮,使之进入右边Items(项目)框。点击Model(模型)处的下拉菜单,选中Alpha模型;点击Statistics 按钮,弹出ReliabilityAnalysis(可靠性): Statistics(统计量)对话框,在Descriptives for(描述性)栏中选Item(项)、Scale(度量)和Scale if item deleted(如果项已删除则进行度量)项;在Sum-maries(摘要)栏选择Correlations(相关性);在Inter-Item(项目之间栏选Cor-relations项,其余用默认值,点击Continue(继续)钮,返回Reliability Analysis对话框,再点击OK按钮即完成分析。
  表3-1可靠性统计量








       
  3.1.2信度的数据分析
  信度是指测验能否稳定地反映受测者的实际水平的程度,信度的大小一般用克朗巴哈α系数表示。一般认为,克朗巴哈α系数大于0. 9,信度很好,达到最好的标准化考试水平。克朗巴哈α系数在0.8~0.9,对于学校考试而言,非常好。测验结果才能稳定地反映学生的知识水平和能力水平,克朗巴哈α系数小于0. 7,则测验结果是很不可靠的。需要努力做出很大的改进。见表3-1可知由于α=0.865,而基于标准化的A1pha =0.904,可以认为该班的测验结果基本是可靠的。
  3.2效度分析
  3.2.1操作方法
  效度分析使用的与信度分析所采用的同一数据,单击analyse(分析),单击analyse菜单下的Data Reduction(数据降维)子菜单中的factor analysis(因子分析),出现factor analysis(因子分析)对话框,将左边方框中的题目T1~T24   选入右边的variable(变量)下的空框中,接着对factor analysis(因子分析)中的五个按钮 “Descriptives(描述)…”、“Extraction(抽取) …”、“Rotation(旋转) …” 、“Scores(得分) …” 、 “options (选项) …”中的选项进行选择,在Descriptives选项卡中,在 Statistics栏下勾选“initial solution ”选项,在Corrtation Matrix栏下勾选“ KMO and Bartlett,s test of sphericity”,选好后单击“continue“(继续)。返回到factor analysis(因子分析)界面,依次单击其余按钮,对其对应的选项卡进行选择。在“抽取”选项卡中,对“方法”选项栏下选择“主成分”;对“分析”选项栏下选择“相关性矩阵”; 对“抽取”选项栏下选择“特征值大于1”; 对“显示”选项栏下选择“未旋转的因子解”; 选好后单击“continue”(继续)。在“旋转”选项卡中,对“方法”选项栏下选择“Direct Oblimin”,Delta取值为“0”,对“显示”选项栏下选择“选择解”,最大收敛性迭代次数为“25”; 在“因子等分”选项卡中,对“方法”选项栏下选择“回归”,勾选“保存为变量”选项和“显示因子得分系数矩阵”选项;在“选项”选项卡中,对“缺失值”选项栏下选择“按列表排除个案”, 对“系数显示格式”选项栏下选择“按尺寸排序”。最后,单击“OK”按钮。
  3.2.2数据分析
     








  效度(validity)是指测验所测量到的东西和它所计划要测量的东西相符合的程度。效度通常用KMO值作为衡量的尺寸,根据一般经验认为:KMO值 < 0.5,表明试卷不适合考试;0.5 < KMO < 0.7,表明试卷不太适合考试;0.7 < KMO < 0.8,表明试卷一般;0.8 < KMO < 0.9表明试卷适合考试;KMO > 0.9, 表明试卷非常适合考试,KMO越接近于1,表明考试的效度越高。本试卷KMO=0.728,说明该试卷的有效度一般。
  高质量的试卷需要运用经典真分数理论和恰当的测量工具及科学量化的评价指标对组成试卷的项目进行分析,经过评估证明具有达标信度的试卷才能正式使用。考试后应及时进行试卷题目分析,把每次考试的优秀项目累积起来,才能构成一门课程的高质量的题库。
  参考文献:
  [1]许世红,胡中锋编著.数学试卷分析方法[M].上海:华东师范大学出版社,2009
  [2]孙杰远主编.教育统计学[M].北京:高等教育出版社,2010.12
  [3]曹玉茹,郑戟明.SPSS在成绩分析中的应用研究[J].福建电脑,2012,6:152