导航菜单

一般能力倾向测验E和F版的新变化

葛盼盼

(扬州大学教育科学学院)

一般能力倾向测验由美国劳工部就业保险局自1934年起历时50年,耗资数亿美元编制而成,是应用较广的能力倾向测验。1995年美国完成了对一般能力倾向测验的第一次修订,即一般能力倾向测验E、F版产生。我国使用的版本仍然是是戴忠恒教授或方俐洛以日本劳动省1983年为蓝本修订的一般能力倾向测验。本文仅对美国第一次修订的改变进行研究归纳,以求对中国一般能力测验新版本的修订研究提供有益的启示。

1.施测过程中的修改

1.1题目时限的修改

1993年速度性研究的综述表明,速度测验比难度测验对答题纸、施测环境的改变更敏感[1]。答题纸与施测环境的改变会导致速度测验更大的改变。由于有时团体施测,实验环境中的偶然因素对测验会产生不可避免的影响,而降低速度性有利于减少实验环境变化的影响。最后新版本使用了更少的题目,并且对时限放宽了标准。当然这些改变是建立在这些题目能覆盖旧版题目难度和内容的基础上的。变化最大的是难度测验中三个分测验:立体图判断、语义、算术应用,它们题目数减少了,并增加了时间限制。[1]计算测验是包含速度成分的,所以计算测验的速度性没做改动。具体数据变化见表1和表2。

1.2指导语、记分、测验顺序

A-D版GATB总指导语和分测验指导语对测验策略的信息都是有限的,也没有讨论计分方法。新版则要求被试被告知测验是如何记分的并给以详细说明,这样让他们能够采取相应的答题策略以达到最大分数[2]。简而言之,新版指导语给被试提供测验应使用的策略的信息。具体包括测验和回答问题时应遵循的速度。

分测验的顺序发生了改变,难度测验由混在速度测验之间提到了速度测验前了。这样可以将GATB分为两大类,分别给予不同的总指导语,比如难度测验(第1、2和3部分)总指导语为:“下面三个部分请细心作答,你将有充足的时间回答每个问题。尽量回答每个问题。即使你不确定,也请做出猜测,完成题目再进行下一题。正确题记分,错误题不扣分。”[2]这些信息在分测验的指导语中会重复说明。从指导语可以看出,新的指导语对测验策略的提示更加明显。难度测验更加强调做题准确性,速度测验更加强调做题的速度性。

2.测验内容的修改

2.1形状匹配分测验的删除

测验的时限减低,时间增加,会导致测验总时间的增加,所以建议删掉形状匹配分测验或工具匹配分测验。最终删除形状匹配分测验而非工具匹配分测验的原因归结于三点。一,形状匹配分测验时限是6分钟,工具匹配时限是5分钟,两者时间几乎相同,从不导致总时间增加的目的出发,删除形状匹配分测验更符合目的。二,工具匹配能更好的预测形状知觉。工具匹配得分构成了形状知觉得分的65%,而形状匹配只占35%;工具匹配分测验与形状感知的相关系数高于形状匹配分测验与之的相关系数;三,删除形状匹配分测验的影响会很小。[3]新版的形状感知维度和旧版的相关达到0.99,工作家族二和三效度的不同可以忽略,因为形状感知维度只参与工作家族一的计算,而且一只占其中的3.53%。工作家族一在整个工作家族中的比例又相对较小,工作家族一有398个职业而总工作家族的数量却是12099,这398个工作制构成当今劳动力的2.5%。删除形状匹配分测验对形状感知维度的定义的影也较小,需要的改变很小,这样对成分结构(compositestructure)的影响也很小。此外,南部测评调查和发展中心建议改变双测试(dual-test)模式,这样形状感知维度只包含工具匹配这一测验,但是这在GATB中的九个维度中是有很多先例的。如书写知觉维度只包含名词比较分测验,言语能力维度只包含语义分测验。

2.2避免种族性别偏差进行的修改

对种族性别偏差修改较大是以下几个分测验:名称比较、立体图判断、语义、物体匹配、算术推理。[2]

名称比较-增加了非传统职业和企业中少数名族和女性有关的项目。日耳曼民族名字使用减少。

立体图判断-稍微修改了下指导语来减小可能的性别偏见。

2.3新版的测试更加灵活

主要表现在,可以只施测九种能力倾向中的六种能力倾向,可以不用测量难度测验,仍然能了解一个人的能力倾向。这样对不必要的能力倾向就不用浪费人力物力了。

3.新版本外观的变化

3.1分测验册子、答题卡与使用手册格式的变化

新的版本GATB的外表有了很大提升,让被试觉得更加友好。[4]根据最近的一些性向调查,确定每个分测验所属的确切区域;具体在分测验册子,答题卡以及使用者手册上发生了一些变化。由老版的两个测验册子变为一个单一的册子。删除了指导语中多余的没用的单词;调整了计算和算术推理题的空间以确保被试有足够的空间答题。[2]

每个分测验的变化如下:

算术推理-每个题目被放置在有两个垂直线一条水平线组成的空间内。每页两列的格式依然保存,但是每页题目数量减少了。用阿拉伯数字代替了原来的英文数字。

计算-也用了算术推理相同的格式。每页最多有8个题目。运算符号由原来的置于题目之上变为置于题目之中了。

名称比较-每页题数由50将为30题,每5题后面的水平线被空白线条代替,每题之间都有一段空白来区分两题。

物体匹配-印刷质量提升了,并将测验标题由工具匹配改为了物体匹配。

空间推理-提高了打印质量和分辨率。

语义-测验形式由水平的变为了垂直的。每页上的题目由30题减为不到10题。19个题目被分为每列五题的三列和只有四题的一列,每列都有两条垂直线和一条水平线隔开。

答题卡的变化:最明显的变化是答题纸上的答题圈由正圆变成了椭圆,并将每个答题纸的开始部分进行了统一。将多余的题目反应的空格涂上了阴影。[4]

使用手册的变化:使用手册将包括记分方法和转换表。使用辅助手段如颜色,目录册和表格等也增加课。使用手册尺寸缩小了,指定相应部分,增加更多的线索表格,并将列旁边的线缩短,这些措施都增加了使用手册的可用性与可阅读性。[2]

4.当前GATB新版本的发展趋势

我国使用的版本仍然是是戴忠恒教授或方俐洛以日本劳动省1983年为蓝本修订的一般能力倾向测验。通过这次的研究给我国修订GATB新版本提供了一些方向,中国版一般能力倾向测验(GATB)的再修订,同样也会减少题目数量,这主要是由于现代社会更加注重时效性,生活节奏加快,庞大的数量容易让人们产生抵触情绪。

虽然题目数量减少,但是要考虑题目的代表性,也就是说更少的题目也能测出相应的能力,像名称比较由150题降低到90题,题目减少了60题,留下的题目是经过详细筛选的,经过专家评定以及被试的预测,结果表明其代表性不比之前150题差。

同样,在新版本的修订时也要要考虑中国特有的文化差异因素以及民族性别差异。外国测验的修订,文化因素是很重要的一个方面,由于中国词汇与外国词汇的对应问题,这个问题需要英语专业以及文学专业的人精挑细选,争取做到字斟句酌。由于我国是一个多民族国家,在新版本的修订时,如果有充足的人力物力,也要考虑到不同民族的差异。

中国版GATB的界面也应更加人性化,给用户友好感。这点可以参考美国的修改,但由于我国文化也会有不同的审美标准,也由于中国固有的简朴节约的美德,在这方面也要因人因时而定。

5.不足与展望

在笔者查阅文献过程中发现,由于GATB是由美国劳工部修订的,其修订过程有很多文献只是用于政府报告,并未在杂志或期刊上刊登,有一部分测验内容的修订并未找到详细的修订资料,仅仅有文献的名称,但在获取文献的过程中发现了困难,比如对GATB中认知部分的修订,有待进一步研究与探讨。

此外本文涉及的GATB新版本的变化,在笔者的另一篇文章中也详细介绍了。[5]当然一种测验的变化与修订是密切相关的,考虑新版本的变化必然要考虑是如何修订的,这又是我国GATB修订工作的另一个参考点。这类的文献也是比较丰富的,最终将修订过程与最终的变化相结合,总结出利于我国GATB新版修订的方案。

教育期刊网 http://www.jyqkw.com
参考文献:

[1]NormanG.Peterson.(1993).ReviewofIssuesAssociatedwithSpeedednessofGATBTests.AmericanInstitutesforResearch.

[2]StevenJ.MellonJr.MichelleDaggett,VinceMacManusandBrianMoritsch.(1996).DevelopmentofGeneralAptitudeTestBattery(GATB)FormsEandF.PacificAssessmentResearchandDevelopmentCenter.

[3]WillisW.GainesJeannieP.Stroupe.(1994).IMPLICATIONOFDELETINGTHEFORMMATCHINGTESTFROMTHEGENERALAPTITUDETESTBATTERY.SouthernAssessmentResearch&DevelopmentCenter.

[4]DanielO.SegallReynaldoI.Monzon.(1995).EQUATINGFORMSEANDFOFTHEP&P-GATB.NavyPersonnelResearchandDevelopmentCenter.

[5]葛盼盼.2014.职业能力测量工具:从中国GATB现状与美国GATB发展角度谈一般能力倾向测验的修订[J].金田.2014(6):414.

下载文本