刊名: 教育研究
主办: 中国教育科学研究院
周期: 月刊
出版地:北京市
语种: 中文;
开本: 大16开
ISSN: 1002-5731
CN: 11-1281/G4
邮发代号:2-277
历史沿革:
专题名称:教育理论与教育管理
期刊荣誉:社科双效期刊;国家新闻出版总署收录;中国期刊网核心源刊;CSSCI 中文社会科学引文索引来源期刊;北京大学《中文核心期刊要目总览》来源期刊;
创刊时间:1979
提高高等数学测验有效性的策略与实践
【作者】 王 龙
【机构】 (上海政法学院 上海)
【摘要】提高教学质量始终是高教改革的主旋律,高等数学作为一门重要的基础课程,也面临着诸多方面的改革与创新。本文就是在多年的数学教改实践和深入探索的基础上来探讨教学过程中的一个重要的环节——教学评价的手段——测验的有效性。本文首先探索了考试的两个重要参数:效度与信度在高数测验中的基本内涵,进而探索这两个要素之间的辩证关系,最后提出了提高高数测验的信度与效度的具体措施,旨在为提高数学教学质量创造必不可少的条件。【关键词】高数测验 效度 信度 有效性
【正文】
大家知道,高数测验的目的主要就是检查前一段时间教师的教和学生的学的情况,可以说,从深层次上讲,测验的有效性直接关系到“教”措施和“学”的规律。然而,高数测验后的效果不一定完全是这样,甚至是事与愿违,最突出的问题就是:学的好坏并不一定与成绩的高低相对应,且这种现象发生的概率并不小,它确实影响了许多学生刻苦学习高数的热情,严重挫伤了一批学生的积极性和信心,对提高高等数学的教学质量极为不利。为什么会发生这种现象呢?经过多年的教学实践和不断地探索研究,笔者认为其主要原因就是测验试卷的效度和信度问题,通过大量调查发现:在许多高数实际教学中,尽管有很多的测验试卷都有较高的区分度,但许多老师对高数试卷的效度和信度却没有引起高度重视。试卷的区分度高只是测验成绩可能有高、中、低之分,甚至学生总体成绩还可能服从正态分布,但这并不意味着试卷的效度和信度高。如果试卷的效度和信度不高,那就会出现前述的现象,即无效测验现象,它是广大教师最不愿意看到的情景,因此,探索高等数学测验试卷的效度和信度不仅具有一定的理论意义,更具有一定的实际价值。
一、高数考试效度、信度的基本内涵
(一)高数测验效度的基本概念
尺子是用来测量物体长度的,没有人用尺子去测量物体的重量。这是因为人们知道对测量物体长度这一目标来说是有效的,但对测量物体的重量这一目标是无效的。可见,测量的有效与否取决于人们是否明确测量目标。可见,效度是指实际测量到的与与所要测量的目标之间相符合的程度。效度要解决两个基本问题:(1)本测验要测量的是什么目标;(2)本测验对于所要测量的目标能测到多好的程度。如果一个测验不能很好地解决这两个问题,则其有效性必然是低的,而高数测验主要涉及以下几种类型的效度:
1、效标效度
这里的效标效度是指用某次测验的分数与同学科、同内容标准测验的分数的相关系数来衡量效度,我们称标准测验为效标;
2、内容效度
内容效度是指用测验内容对预定目标范围的知识和能力的反映程度来衡量效度,是指测验题目与与测验目的、教学内容相一致的程度;
3、结构效度
结构效度是指测验对所要测量的某种心理学结构概念,目的在于用心理学概念说明分数的意义,用心理学理论来对测验结果加以解释和探讨。
(二)高数测验信度的基本概念
信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。简言之就是测试结果的可信度、可靠度,即考分的一致性。例如, 我们可以这样来检验测试的信度:使用同样一份试卷,在两种不同的场合、环境中,在较短的时间间隔内施与同样的学生,如果测试结果基本吻合,那么证明测试是有信度的。一份试卷的测试结果如果缺乏信度,就没有使用价值,同时也减弱了考试的公正性,正如前面所述,“学与教的情况与测验结果相关系数低”就是典型的一例。
二、高数测验信度和效度之间的辩证关系
首先,值得注意的是:对目标比较单一的测验来说,信度和效度是一致的。因此,只要要求高信度,一般就同时保证高效度。然而,对于检测目标较多且不甚关联的异质性测验,特别是高等数学测验来说,则应既要重视信度,又要重视效度。甚至当效度太低时,可不惜损失些信度来保证效度。
(一)高数测验信度是测验效度的必要条件
高数测验信度是测验效度的必要条件意味着没有高信度必然就没有高效度。例如由于考题质量有问题;外部因素的影响;或者考题的难度不合适,既然考试是非公允的、不科学的、不合适的,考试的信度是偏低的。考生就无法发挥出其应有的水平,考生的最终得分就无法解释考试者的最初出题初衷,考试者的预期测试目的并未完全实现,因而考试的效度必然会受到一定的影响。因此,测验效度是建立在测验信度的基础上的,离开了高信度,高效度就无法实现。
(二)高数测验信度并非是测验效度的充分条件
简言之,有了高信度未必就有高效度。这可从高数测验较为重要的两个效度:内容效度和结构效度来探索。首先,如果测验虽然具备了考试的高信度,但考试内容效度低,也就是,考试内容缺乏关联性、适用性、覆盖性、明确性,那么测验的高效度就无法实现。同样,如果考试结构效度低,也就是,测试结构欠科学,不合理,人们就无法确定考试考分的含义是否与考试者的期望值一致。
三、设想与措施
(一)关于效度
1、提高效标效度的措施
笔者经过大量的调查,结果发现,大部分效度差的测验试卷所存在的问题主要就是:第一,测量的目标不明确或者目标与客观实际不符,导致这种情况发生的原因很多,如:许多专业都开设高等数学,但对它们的要求有很大区别;许多高校本身对高等数学的要求也在不断变化的,有的学校原来安排高等数学的学时是130学时,现在却安排160学时,特别是新办高校和新升本高校对于高数教学教学的积淀还不是很深厚,从而导致阶段性测验考试的目标并不很明确或不恰当等等。而且由于现在是大众化教育,学生的来源和基础与以往都有很大地不同。第二,是一些高数教师对测验考试试卷的效度不够重视,考试前没有充分的估计和做必要的预测。
高等数学,它不像高中数学,有全国统一的高考试卷或省市制定的高考试卷作为参考标准,那么应该如何如何制定效标?笔者认为,应考虑以下参考因素:(1)不同的专业;(2)不同的生源(重点大学与一般本科大学应有所不同);(3)不同的时间段,在充分考虑以上因素的基础上,由省市考试院的专家和有丰富经验的高数教师共同制定不同水平的试卷,再依据不同层次、不同类型的试卷,随机抽取具有代表性的一批学生进行测验考试,以确定效标。
2、提高结构效度的措施
(1)测验试卷要结构严谨、符合逻辑、层次分明,形成某种“结构网络”;
(2)清晰、准确地界定测试的环境条件和变量;
(3)避免采用单一方法或单一指标去代表或分析多维的、多层次的、多侧面的事物和变量。
(二)关于信度
首先,高数试题信度受很多因素的影响,最主要的因素为试题选样的广泛性和有效性。一般说来,试题选样越广越有效,对学生知识和能力的测量就越可靠。正因如此,笔者倾向于使用客观性试题,一份客观性试题能容纳很多分离式题目, 不赞成使用过多的主观性试题。
其次,提高测验的有效性应以提高效度为实际导向,离开效度谈信度是没有实际意义的,考试效度更多地反映出考试者预期目的与被测试者实际完成任务之间的关系。它更多地试图探索教师的“教”与学生的“学”的一种直接关系,具有很强的现实意义。以效度作为信度的实际导向,会使考试朝向健康、安全的方向发展。这样的测试具有明确的针对性、对象性,能够起到查漏补缺、信息反馈的作用,能够成为检查教学、改进教学的有效手段,高效度也隐含高信度。
综上所述,就高数测验而言,有效的测验必须是可信的测验,但可信的测验未必是有效的测验;测验的可靠性低,其测验的有效性必低;測验的有效性低,其可靠性未必低;测验的有效性高,其可靠性必高。
参考文献:
[1]黄光扬.教育统计与测量评价新编教程[M].上海:华东师范大学出版社,2013,8.
作者简介:王龙(1959—),安徽安庆人,上海政法学院经济管理学院数学教研室主任、博士。研究方向:数学课程与教学论。
大家知道,高数测验的目的主要就是检查前一段时间教师的教和学生的学的情况,可以说,从深层次上讲,测验的有效性直接关系到“教”措施和“学”的规律。然而,高数测验后的效果不一定完全是这样,甚至是事与愿违,最突出的问题就是:学的好坏并不一定与成绩的高低相对应,且这种现象发生的概率并不小,它确实影响了许多学生刻苦学习高数的热情,严重挫伤了一批学生的积极性和信心,对提高高等数学的教学质量极为不利。为什么会发生这种现象呢?经过多年的教学实践和不断地探索研究,笔者认为其主要原因就是测验试卷的效度和信度问题,通过大量调查发现:在许多高数实际教学中,尽管有很多的测验试卷都有较高的区分度,但许多老师对高数试卷的效度和信度却没有引起高度重视。试卷的区分度高只是测验成绩可能有高、中、低之分,甚至学生总体成绩还可能服从正态分布,但这并不意味着试卷的效度和信度高。如果试卷的效度和信度不高,那就会出现前述的现象,即无效测验现象,它是广大教师最不愿意看到的情景,因此,探索高等数学测验试卷的效度和信度不仅具有一定的理论意义,更具有一定的实际价值。
一、高数考试效度、信度的基本内涵
(一)高数测验效度的基本概念
尺子是用来测量物体长度的,没有人用尺子去测量物体的重量。这是因为人们知道对测量物体长度这一目标来说是有效的,但对测量物体的重量这一目标是无效的。可见,测量的有效与否取决于人们是否明确测量目标。可见,效度是指实际测量到的与与所要测量的目标之间相符合的程度。效度要解决两个基本问题:(1)本测验要测量的是什么目标;(2)本测验对于所要测量的目标能测到多好的程度。如果一个测验不能很好地解决这两个问题,则其有效性必然是低的,而高数测验主要涉及以下几种类型的效度:
1、效标效度
这里的效标效度是指用某次测验的分数与同学科、同内容标准测验的分数的相关系数来衡量效度,我们称标准测验为效标;
2、内容效度
内容效度是指用测验内容对预定目标范围的知识和能力的反映程度来衡量效度,是指测验题目与与测验目的、教学内容相一致的程度;
3、结构效度
结构效度是指测验对所要测量的某种心理学结构概念,目的在于用心理学概念说明分数的意义,用心理学理论来对测验结果加以解释和探讨。
(二)高数测验信度的基本概念
信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。简言之就是测试结果的可信度、可靠度,即考分的一致性。例如, 我们可以这样来检验测试的信度:使用同样一份试卷,在两种不同的场合、环境中,在较短的时间间隔内施与同样的学生,如果测试结果基本吻合,那么证明测试是有信度的。一份试卷的测试结果如果缺乏信度,就没有使用价值,同时也减弱了考试的公正性,正如前面所述,“学与教的情况与测验结果相关系数低”就是典型的一例。
二、高数测验信度和效度之间的辩证关系
首先,值得注意的是:对目标比较单一的测验来说,信度和效度是一致的。因此,只要要求高信度,一般就同时保证高效度。然而,对于检测目标较多且不甚关联的异质性测验,特别是高等数学测验来说,则应既要重视信度,又要重视效度。甚至当效度太低时,可不惜损失些信度来保证效度。
(一)高数测验信度是测验效度的必要条件
高数测验信度是测验效度的必要条件意味着没有高信度必然就没有高效度。例如由于考题质量有问题;外部因素的影响;或者考题的难度不合适,既然考试是非公允的、不科学的、不合适的,考试的信度是偏低的。考生就无法发挥出其应有的水平,考生的最终得分就无法解释考试者的最初出题初衷,考试者的预期测试目的并未完全实现,因而考试的效度必然会受到一定的影响。因此,测验效度是建立在测验信度的基础上的,离开了高信度,高效度就无法实现。
(二)高数测验信度并非是测验效度的充分条件
简言之,有了高信度未必就有高效度。这可从高数测验较为重要的两个效度:内容效度和结构效度来探索。首先,如果测验虽然具备了考试的高信度,但考试内容效度低,也就是,考试内容缺乏关联性、适用性、覆盖性、明确性,那么测验的高效度就无法实现。同样,如果考试结构效度低,也就是,测试结构欠科学,不合理,人们就无法确定考试考分的含义是否与考试者的期望值一致。
三、设想与措施
(一)关于效度
1、提高效标效度的措施
笔者经过大量的调查,结果发现,大部分效度差的测验试卷所存在的问题主要就是:第一,测量的目标不明确或者目标与客观实际不符,导致这种情况发生的原因很多,如:许多专业都开设高等数学,但对它们的要求有很大区别;许多高校本身对高等数学的要求也在不断变化的,有的学校原来安排高等数学的学时是130学时,现在却安排160学时,特别是新办高校和新升本高校对于高数教学教学的积淀还不是很深厚,从而导致阶段性测验考试的目标并不很明确或不恰当等等。而且由于现在是大众化教育,学生的来源和基础与以往都有很大地不同。第二,是一些高数教师对测验考试试卷的效度不够重视,考试前没有充分的估计和做必要的预测。
高等数学,它不像高中数学,有全国统一的高考试卷或省市制定的高考试卷作为参考标准,那么应该如何如何制定效标?笔者认为,应考虑以下参考因素:(1)不同的专业;(2)不同的生源(重点大学与一般本科大学应有所不同);(3)不同的时间段,在充分考虑以上因素的基础上,由省市考试院的专家和有丰富经验的高数教师共同制定不同水平的试卷,再依据不同层次、不同类型的试卷,随机抽取具有代表性的一批学生进行测验考试,以确定效标。
2、提高结构效度的措施
(1)测验试卷要结构严谨、符合逻辑、层次分明,形成某种“结构网络”;
(2)清晰、准确地界定测试的环境条件和变量;
(3)避免采用单一方法或单一指标去代表或分析多维的、多层次的、多侧面的事物和变量。
(二)关于信度
首先,高数试题信度受很多因素的影响,最主要的因素为试题选样的广泛性和有效性。一般说来,试题选样越广越有效,对学生知识和能力的测量就越可靠。正因如此,笔者倾向于使用客观性试题,一份客观性试题能容纳很多分离式题目, 不赞成使用过多的主观性试题。
其次,提高测验的有效性应以提高效度为实际导向,离开效度谈信度是没有实际意义的,考试效度更多地反映出考试者预期目的与被测试者实际完成任务之间的关系。它更多地试图探索教师的“教”与学生的“学”的一种直接关系,具有很强的现实意义。以效度作为信度的实际导向,会使考试朝向健康、安全的方向发展。这样的测试具有明确的针对性、对象性,能够起到查漏补缺、信息反馈的作用,能够成为检查教学、改进教学的有效手段,高效度也隐含高信度。
综上所述,就高数测验而言,有效的测验必须是可信的测验,但可信的测验未必是有效的测验;测验的可靠性低,其测验的有效性必低;測验的有效性低,其可靠性未必低;测验的有效性高,其可靠性必高。
参考文献:
[1]黄光扬.教育统计与测量评价新编教程[M].上海:华东师范大学出版社,2013,8.
作者简介:王龙(1959—),安徽安庆人,上海政法学院经济管理学院数学教研室主任、博士。研究方向:数学课程与教学论。