测评常用术语解释

       

        
       1. 心理测验
   心理测验是指在对心理特质进行测量时所使用的工具,有时也称心理量表。通常它是由一组精心设计的测试题目或项目组成,其作用在于抽取一组标准化的行为样本,通过对这组行为反应进行观察分析,测验者就可以对引起行为的心理活动做出推论和解释。 
心理测验是一种系统、科学、规范的施测和评定方式。包括:测验内容的标准化、测验实施过程的标准化、测评评分程序的标准化和测验结果解释的标准化。
   心理测验能够对人的许多方面进行比较客观的评价,尤其在评价潜在的、不易从行为表现中直接观察出来的素质时,如个性特征、智力、能力倾向、价值观、兴趣等,具有很好的评价效果和较高的使用价值。 
   心理测验的编制是一个严谨的过程,包括确定的测验题目、规范的施测流程、客观的评分方法和标准的结果解释。此外标准化测验还要有信度、效度和项目分析等数据作为支持,用以说明测验的有效性和准确性。编制一套标准化测验时,专业研究人员通常要经过:确定测量目的——题目的编写与排列——预测——题目修订——规范测试流程和测试要求——建立常模样本库——分析信度和效度指标——制定结果解释。因此,一套好的心理测验的编制成本比较高,其科学性和实际应用价值也非常高。

     2. 常模 
   一个人说:“今天测验,我得了70分。”我们听着这句话可能会感觉比较迷惑:他的成绩究竟属于优秀、普通还是较差?要回答这个问题,我们还需要把他的得分和他同年龄、同教育水平的群体的得分进行比较才能确定。这个群体的分数分布就是我们所说的常模。
   通俗地说,常模就是解释测评分数的参照标准,是一群人在同一测量工具中得分的分布。一般通过各种测评工具得到的分数称为原始分数,原始分数需要经过常模的比较才具有意义和参考价值,因此,在解释测验分数时要以一组测评者实际得分的平均数作为参照,然后以每个人实际得分与平均数的距离来描述他在群体中的相对位置。
   因此挑选合适的常模也是保证测验结果准确的关键因素。一般测验的常模需要依据性别、年龄、学历,甚至所在区域、岗位性质、职位高低、行业背景等进行细分。
   传统上,解释测验的分数线往往由设计者(领导或专家)主观确定,标准缺乏客观性,偏差较大,甚至经常掺入制定者的好恶和利益取向。而常模则是通过实际测评数据确定的非人为的分数解释标准,在获得正式的测评数据之前,谁也不能确定分数的参照点在什么位置,因此常模就是一种客观的标准。有无常模是区分现代人才测评与传统人才测评、主观测评与客观测评的重要标志。
   测量结果是否准确,常模(Norm)的适合性是非常关键的因素。常模是一群人在同一测量工具中得分的分布情形,这群人就是获得该常模的样本。某人在某一测量工具中的得分,需要经过常模的比较才具有意义和参考价值。例如,某人完成100题数学题,答对了70题,那么他的成绩属于优秀、普通还是不及格,就需要和他同年龄、同教育水平的群体进行比较。因此,为使测量结果更为准确,常模需要依据性别、年龄、学历,甚至所在区域、岗位性质、职位高低、行业背景等进行细分。 

  3. 称许性 
   “测谎仪”是很多人都知道的仪器,通常用它来测试人们在回答问题时是否撒谎。在心理测验中,也有类似的成分,俗称“测谎量表”,用来测试受测者是否真实地回答问题。有些被评价者受测评动机的影响,在完成某些测验(如个性特征测验)时,会揣测测验编制者的出题用意,掩饰自身的真实情况,选择那些公众认为好的答案来回答问题。受测者的这种隐瞒真实情况的倾向称之为称许性 。 
   称许性过高容易导致测评结果不能准确反映被评价者的实际情况,甚至与实际情况截然相反。为鉴别真实回答与虚假回答,测验编制者在非能力测评的测验中一般会加入称许性分量表(即测谎量表),通过分析被评价者在掩饰性分量表上的得分高低,了解其在测验过程中是否存在掩饰性以及掩饰程度,从而推断整个测验结果的准确性和有效性。

  4. 标准化测验 
   标准化测验是通过严格完整的程序编制的,具有事先确定的测验题目、规范的施测流程、客观的评分标准和标准的结果解释系统,此外还有测验的信度、效度和项目分析数据等相关资料用以说明测验的质量。因此,一套好的标准化测验的编制成本比较高,但相应地,它的科学性和价值也非常高,此外,一旦编制成功,它具有使用方便、经济、客观等特点。 
   编制一套标准化测验时,专业研究人员通常要经过如下几大步骤:确定与分析测量的目标和内容——题目的编写与排列——预测与题目分析——题目修订——规范测试程序和要求——样本收集与建立常模——信度效度等相关分析——制定结果解释
   标准化测验能够对人的许多方面进行比较客观的评价,尤其在评价底层潜在的、不易从行为表现中直接观察出来的素质时,显示出比较高的有效性,如个性特征、智力、能力倾向、价值观、兴趣等。

  5. 信度
   信度表示测量数据和结论的可靠性程度,即评价工具稳定地测评到它要测量的内容的程度。一般来说,检验信度有以下几种方法: 
   重测信度:在恰当的时间间隔前后,重复同样的测量,统计两次测量结果的匹配程度。 
   复本信度:用原本和复本同时进行测量,统计原本和复本测量结果的相关程度。 
   分半信度:在没有复本且不能重测的情况下,将同一测量内容的测验题目随机分成两组,统计两组测量结果的相关程度。 
   评分者信度:用于测量工具的标准化程度较低的情况下,比较典型的是评委主观评分的测量。不同评委的判分标准会影响测量的信度,因此需用计算两位评委评分的相关程度。

  6. 效度 
   效度表示评价的正确性程度,即评价工具准确地反映到它要测量的内容的程度。一般来说,检验效度有以下几种方法: 
   内容效度:系统地检查测量内容的适当性,即根据对要测量内容的了解去鉴别测验题目。
   准则效度:用已经被假设或定义为测量某一内容有效的工具作为效标,当用新的测量工具对该内容进行测量时,统计测量结果与效标测量结果的一致性程度。
   结构效度:系统地检查测量工具是否反映了要测量内容的概念和命题结构,这种方法常常在理论的研究中使用,因此也被称为理论效度。
从信度和效度的关系上来看,信度不高,效度必定不高;信度高,效度不一定高;效度不高,信度不一定不高;效度高,信度必定高。

  7. 百分位
   反映参测者在群体中的位置。例如,某被测者言语理解的百分位是83,表明该参测者在全体管理人员中,言语理解能力比83%的人强,处于前17%的位置。

  8. 标准九分
   它是一种标准分,将样本的测验原始得分划分为9部分,最高是9分,最低1分,除1和9的范围略大以外,其余均是以5为中心向两边各包含0.5个标准差的分数段。简单理解,即9为最高分,1为最低分,5为中间分。

  9. 人机对话测试
   将编制开发好的标准化测验通过软件技术加载在计算机上,并按照测验的规范要求设定操作程序。被评价者根据程序指引直接在计算机上答题,答题结束后,计算机自动统计各测量内容的得分,并对比事先设定的常模,得出测评结果。简单点说,人机对话测试就是在计算机上完成的测试。
   目前,人机对话测试分单机版、局域网版、远程网络版几大类型。随着经济高速发展,企业规模不断扩大,网络技术日新月异,远程网络版人机对话测试逐渐成为主流,它不仅避免了传统纸笔测试在人力、物力、时间上的资源浪费,以及分数统计误差,还能解决不同地区同时测试统一管理的问题。

  10. 投射测验
   主要用于对人格、动机等心理深层次内容的测量,它要求被评价者对一些模棱两可或模糊不清、结构不明确的刺激做出描述或反应,测评专家通过对这些反应的分析来推断被评价者的内在心理特点。投射测验基于这样一种假设:人们对外在事物的看法实际上反映出其内在的真实状态或特征。因此它可以使被评价者不愿表现的个性特征、内在冲突和态度更容易地表达出来,因而在对人格结构、内容的深度分析上有独特的功能。
   但由于投射测验在计分和解释上相对缺乏客观标准,对测验结果的评价带有浓重的主观色彩,因此对主试和评分者的要求很高,一般的人事管理人员较难直接使用。

  11. 胜任素质或胜任力 
   胜任素质的研究始于20世纪60年代后期,通常人们也将胜任素质称为胜任力。1973年,心理学家麦克利兰提出,胜任素质是指从第一手材料直接发掘的、真正影响工作业绩的个人条件和行为特征。  关于胜任素质,麦克利兰又总结了五个特点:
   1.了解绩效的最好途径是观察人们实际上做了什么而取得成功(即胜任力),而不是依靠基于智力之类的潜在特质和特性的假定。
   2.测量和预测绩效最好的办法是让人们表现出你想要测量的胜任力的关键方面,而不是实施一个测验来评估潜在的特质和特性。
   3.胜任力是可以学习和发展的,与此相反,特质和特性是遗传获得的,并且很难改变。
   4.胜任力是可见的、可理解的,人们可以理解并发展出达到绩效所必须的胜任力水平。
   5.胜任力和有意义的生活结果联系在一起,这些有意义的生活结果描述了人们在现实世界里一定会表现的方式,而绝非是只有心理学家才能理解的深奥的心理特质或构造。

  12. 素质模型或胜任力模型
   岗位素质模型(或胜任力模型)是指在组织中成功担当某一职位(角色)所需的知识、技能及个性特质的特殊组合。它能够对在一个特定的组织中从事某项工作需要什么样的能力、知识与个性特质,以及什么样的行为表现对工作的高绩效有最显著、直接的影响进行清晰的描述。同时,它也能充分反映、融合组织的战略发展需求、价值观和核心竞争力。
   素质模型由素质要素和素质级别两个部分组成。素质级别主要指同一职位类别不同岗位对能力素质的不同要求。因此每一素质模型都包含若干胜任素质,每一项胜任素质都有一条简短的定义和若干行为指标,每一行为指标又包含有一个叙述性定义和一个等级量表。

  13. 评估模型与素质模型的区别
   由于素质模型中的素质要素通常是一种原则或者行为目标,通用性较强,缺乏针对岗位的具体指标(如追求卓越、精益求精等);又或者有些素质要素中包含了很多测评指标(如系统思维可分解为分析能力、统筹规划等),较难对素质要素本身进行直接测量。因此在现代人才测评中又提出了评估模型的概念。
   评估模型是从岗位素质模型出发,将素质模型的各项素质要素作为一级指标,然后根据每个素质要素在特定企业和特定岗位中的要求,将每个一级指标分解为可直接测量的二级指标,一级指标和二级指标共同构成一个评估模型。评估模型中的二级指标一般从心理特征和能力层面将一级指标进行分解或合并,针对特定目标岗位,评估模型还说明了在每项测评指标上要求达到的等级。如同样在沟通协调能力上,对于银行的公司业务部总经理和风险管理部总经理的要求就有所不同。