首页 男生 其他 互联网名企工作方法论(套装共14册)

第七章 员工的发展是谷歌绩效的核心

  您可以在百度里搜索“互联网名企工作方法论(套装共14册) 艾草文学(www.321553.xyz)”查找最新章节!

  

  第七章 员工的发展是谷歌绩效的核心

  如果你设定了一个疯狂、有野心的目标,最后没能完成,你至少也能够实现一些了不起的成就。

  拉里·佩奇

  谷歌联合创始人

  在动画片《辛普森一家》中有一集名为《家长教师协会解散》(The PTA Disbands),剧中斯普林菲尔德小镇小学老师罢工,抗议学校在薪水、教学用品和食物上的投入太少。学校停课,孩子们只能各干各的事情。有一些孩子整天玩游戏,还有一些到处捣蛋。二年级的丽莎·辛普森惊慌失措:

  丽莎:如果没有州里批准的大纲和标准化测试,我的学习就要完蛋了。

  玛姬·辛普森(丽莎的母亲):亲爱的,或许你应该放松一点儿。

  丽莎:放松?我不能放松!也不能放弃、缓和或……我只能想出两个同义词?我的天啊!我变笨了!

  玛姬:好吧,最后你会发现没什么的。

  几天之后,丽莎的状况变得更糟了:

  丽莎:快看看我!给我评评分,给我排个名!我很好、很好、很好,啊,我太聪明啦!给我评评分!

  玛姬:荷马,我有些担心孩子,丽莎有点儿神经质了。今天早上我撞见她撕坏了自己的雨衣。

  我们每个人身上都有些许丽莎·辛普森的影子。小时候我们按个头高矮排队;有人给我们评分,告诉我们哪些行为属于出众的、令人满意的或是需要改进的;等我们长大一些,就会在班级里排名,与全国的平均水平做比较;我们申请大学的时候,会仔细考虑每一所学校的排名。我们生命的头20年都在与他人比较。

  等到我们成年之后,再创造的工作环境也与之类似,这也就一点不奇怪了。这就是我们所了解的。

  谷歌也未能免俗。我们需要员工了解自己的表现,而我们的考评体系也从最初复杂得有些滑稽逐步得到改善。一路走来,我们有很多惊人的发现。你们可以看到,我们仍在继续努力,但是我相当自信我们走的方向是对的。运气好的话,我可以帮助你们避免前进路上一些头痛的事情,让你们少走一些弯路。

  和绩效考评体系说“再见”

  今天的绩效管理体系最大的问题在于它们替代了切实管理员工的关键行动。密歇根州立大学的心理学博士伊莱恩·普拉克斯现任该领域的顶级咨询公司PDRI董事会主席,她发现,“这个问题有一个关键,绩效管理降档为一些指标,经常在规范的行政体系下变得支离破碎……尽管正式的绩效管理体系本意是要推动……公司期望沟通、设定短期目标和持续性指导等日常活动……但是这些行为似乎已经与正式的体系偏离了很远”。

  换言之,多数组织采用的绩效管理都成为墨守成规的官僚流程,不是为了改善绩效,而是为了管理而管理。员工恨它,经理恨它,就连人力资源部也恨它。

  关注过程而不关注目的,使狡猾的员工有了机会钻这个体系的空子。我曾经共事过的一名销售部主管唐(尽管这不是他的真名),在我们做评级、确定分红前的三个月就会开始来我的办公室。每年10月,他就开始做铺垫。“今年很困难,但是我们的团队非常努力,渡过了难关。”唐会这样汇报。到了11月,他会再次更新状况:“销售部伙计们的表现超出预想,逆势而上。”到了12月,我们就会听到一些详细的汇报:“小型商业团队已经完成了90%的任务,但是老兄,这个团队真是像英雄一样才赢得了这些订单。还要顺便说一句,我真不敢相信一月份时竟然会定下这么疯狂的目标,简直不可能完成!”

  我一直都没有意识到唐在耍花样,直到后来有一年,我们决定将分红的时间比往常推后一个季度,但是没有告诉唐。他提前6个月开始铺垫谈判。坦率地讲,这种行事方式也是他能成为一名优秀销售人员的原因,但是这段插曲也使我认识到体系中耍花招的程度有多严重。

  事实上,没有人喜欢当前的绩效管理状态。世界薪酬协会(WorldatWork)和希伯森咨询公司(Sibson)调查了750位高级人力资源从业人员,发现接受调查的人群中58%给自己公司的绩效管理体系评出了C或更糟的成绩。47%的人感觉这个体系有助于组织“实现战略目标”,仅有30%的人感觉员工信任这套体系。

  面对这种情况,时下常见的反应是妥协。

  Adobe公司、亿客行(Expedia,在线旅游网站)、瞻博网络(Juniper Networks,电脑硬件生产商)、凯利服务(Kelly Services,人力资源解决方案服务机构)和微软都取消了绩效考评。Adobe取消考评时称:

  有一次在印度出差,Adobe首席人力资源官丹娜·莫里斯在睡眠严重不足时接受了《经济学人》采访。莫里斯感觉“比平时更加不安”,她坦陈自己想要取消绩效考评的意愿。为了争取在采访内容公布之前发布通告,莫里斯与Adobe的公关部门沟通,迅速在公司内网发表了一篇博客。这篇博客在员工中引起了强烈反响,成为Adobe内网有史以来阅读最多的一条消息。全公司的员工展开了热烈的讨论,纷纷表达对考评流程的不满。根据莫里斯的说法,该现象传递出的深层意义是,员工“对于未足够认可他们贡献的考评体系已经不抱任何幻想”。对于莫里斯而言,采取必要行动已刻不容缓。

  “我们很迅速地做出决定,废止绩效考评,这样就意味着我们不再进行每年一度的正式书面评估。”莫里斯说,“此外,我们还要废除绩效排名和绩效评级,避免员工感觉自己被打上了标签。”

  Adobe在2012年夏季引入了“检查”(The Check-In)体系——一种不断向前推进的、实时反馈的非正式体系,以替代传统的绩效考评。 注释标题 Julie Cook Ramirez, ‘Rethinking the Review,’ Human Resource Executive HREOnline, July 24, 2013, http://www.hreonline.com/HRE/view/story.jhtml?id=534355695.

  凭直觉想来,这是个很有吸引力的做法;员工不高兴,那就抛弃他们不喜欢的体系。很简单。

  得到实时反馈意见难道不比等上一年更好吗?

  但是也没有任何证据显示这种体系可行。学术研究的痼疾在于衡量的尺度无法保持一致,“实时”可能是“立刻”,也可能是“几天之后”。大多数实时反馈体系都会迅速变成“干得好”体系,因为人们都喜欢对别人说一些好事。到底有多少次你的评价能够切实带来行为的变化?更普遍的评价是“会上干得非常漂亮”一类,而不是“我发现,你注意到顾客从桌前移开,似乎失去了兴趣,你立刻问他们有什么顾虑。你能够重新吸引他们的注意,做得非常好,你应该继续密切关注会议中的肢体语言”。

  说些泛泛的客套话要容易太多、太多。

  即便是在谷歌,我们的体系也远远算不上完美。对绩效管理的满意度一直以来都是Googlegeist年度调查中评分最低的部分。2013年初,只有55%的谷歌人认为绩效管理过程令人满意。虽然比其他公司30%的满意度要高,但依然很糟糕。抱怨最多的两个方面,一是用去太多时间,二是流程不够透明,由此引起员工对其公平性的担忧。那么我们做对了哪些事情,使我们的员工对评估体系的满意度达到其他公司的两倍,却还不够满意呢?我们又做错了什么呢?

  谷歌的绩效管理总是把目标设定为起点。在21世纪第一个10年的初期,谷歌的董事会成员约翰·杜尔向我们推荐了一种在英特尔非常成功的实践方法:OKR。目标必须具体、可度量、可检验;如果你达成所有结果,就能完成目标。比如,如果目标是将搜索质量提升x%,相应的关键结果是更好的搜索相关性(结果对用户而言多有用)和等待时间(多快找到搜索结果)。既要有质量标准,也要有效率标准,这一点非常重要,否则工程师完全可以解决一个问题而忽略另外一个问题。用上三分钟的时间才给你找到完美的结果是不够的,我们既要求相关性强,又要求速度。

  我们刻意设定了非常有野心的目标,知道不可能每次都实现这些目标。如果你完成了所有的目标,就说明设定的目标不够激进。负责监管Google X——开发出谷歌眼镜(一种置于眼镜内部的电脑,屏幕只有指甲大小)和自动驾驶汽车的团队——的阿斯特罗·泰勒这样描述:“如果你希望自己的汽车能达到时速50英里,没问题,你可以对汽车稍加改造。但是如果我告诉你跑500英里只能用1加仑的汽油,你就需要重新设计了。”我们不会把所有目标都设定得非常激进,但是如何选择需要一些智慧。恰如拉里经常说的:“如果你设定了一个疯狂、有野心的目标,最后没能完成,你至少也能够实现一些了不起的成就。”

  因此在季度刚开始的时候,拉里会设定公司的OKR,激励每个人设定的个人OKR要基本与谷歌整体相适应。我们不会让完美与良好形成对立。一旦你看到公司的目标,很容易就可以将其与自己的目标做对比。如果你落后得太多,要么给出一个合理的解释,要么就要重新设定。此外,每个人的OKR在内网里都是对所有人公开的,就放在电话号码和办公室位置的旁边。能够看到其他人和其他团队在做什么是一件非常重要的事情,而看到自己的目标与谷歌的目标相契合也能起到激励作用。最后,拉里的OKR会根据他在季度报告中说明的公司表现来设定沟通透明化的标准,并确定恰当的高要求目标。

  在目标的话题上,学术研究与你的本能结果一样:目标能够提升表现。但是,浪费大量的时间在公司上下逐级统一目标却不是很有效。这样做将耗费太多时间,而且公司上下的目标也很难统一起来。我们采用了一种以市场为基础的方式,随着时间的推移,我们的目标都将汇于一点,因为顶层的OKR已经众所周知,而且每个人的OKR也都清晰可见。偏离路线太远的团队会很引人注目,而为数不多的几项关乎所有人的工作也相对容易直接管理。直到现在为止,一切顺利!

  从41级绩效考评到5级考评量表

  2013年之前,每名谷歌人在每个季度末都会收到绩效考评结果。考评量表总共41级,绩效评分从1.0(表现糟糕)到5.0(表现惊人)。大致说来,低于3.0意味着偶尔或经常达不到期望值,3.0到3.4之间意味着能够达到期望值,3.5到3.9之间意味着超过了期望值,4.0到4.4之间意味着“大幅超过期望值”,4.4到4.9之间意味着“接近于惊人表现”,而5.0代表“表现惊人”。谷歌人的平均分在3.3到3.4之间。如果某人连续几个季度的平均分为3.7或更高,通常就能升职。这种做法没有任何创新可言。

  考评体系是否科学仍存在不确定性。考评分级为3个、5个、10个或50个到底有没有不同,至今也没有可靠的证据证明。我们的41级考评量表源自我们的工程师基因。能够准确区分表现3.3和3.4的员工能够令人感到满足。如果将多个季度的评分进行平均,就可以精确地区分3.325和3.350的表现。如果你认为小数点后三位的评分已经过时了,其实我们还有4001级的考评体系!我们开发出极为复杂精细的解析法,确保你的评分略高一点,就能得到略高一点的奖励。实际上这些并没有意义。尽管我们在组织考评上用了很多时间,但等到设定薪水和奖金的时候,管理者或后面的评审者有三分之二的时候会进行调整。我们的管理者每三个月就要用数千小时组织绩效考评,考评过程的精确程度近乎滑稽,却不能作为确定薪酬的可靠依据。

  同样一年进行4次绩效考评也遭遇到同样的窘境。我们采用这种方式,一方面是由于在谷歌迅猛发展的几年里,这样做有利于我们管理员工,另一方面是由于我们希望确保对员工的评估总能与实际匹配。然而,我们发现,一年中有多达24周的时间在分配考评任务、校准评级(我将用几页的内容解释校准评级的意义——这一点很重要)或就考评结果进行沟通。有些管理者喜欢这个频率,辩称这样可以迫使他们经常检查员工工作,以便发现绩效突然变差的员工。但这种评分体系只起到一种支撑作用。我在此无意要求他们停止检查未参加评估的员工,但是为了发现500名陷入困境的员工却要评估5000人,看起来似乎是一种浪费。

  2013年,我们用去大部分时间探索是否有更好的方法。我们尝试了各种替代方式,从没有工作分级到800个工作分级,这使几乎每个人在每个季度都因升职而士气上涨。我们研究了年度、季度、月度和实时绩效考评。我们考虑过3分和50分的考评分数体系。我们争论过是用数字还是某种主题词作为标签标注每一个绩效分类,甚至还反复考虑过无意义的主题词,以避免人们将注意力放在标签上。我甚至还提议加入水行侠、红三角或杧果(见图7-1)等考评等级。

  图7-1 谷歌人保罗·考恩制作了“大幅超过期望值的杧果”图形,用于解释我的一种考评分级建议

  图片由保罗·考恩提供 注释标题 任何阅读本书的谷歌人都可使用这张图片,我们已经得到保罗·考恩和科林·麦克米伦以及GCPA的同意。Memegen网站上出现的东西,可以保留在Memegen上!

  这个体系的意义在于,利用毫无意义的名称使人们忽略标签本身。当然,人们最终还是会给标签加上含义,很可能会将水行侠定义为最差的(水行侠似乎总是输给其他一些超级英雄)。我们组织了协调委员会、咨询委员会,甚至就一些问题开展员工投票。

  最终,我们总结了三条经验:

  ● 不可能达成一致意见。没有明确证据的情况下,所有人都可以成为专家,而且每一种方案都可能有人支持。人们对于绩效分级为5个还是6个之类的问题都很有主见。即便是对谷歌最不讨人喜欢的现行流程进行调整,也不可能找出一个令所有人满意的解决方案。尽管人们似乎不喜欢现有的体系,但是他们更不喜欢其他任何选择!

  ● 人们对待绩效管理非常严肃。比如,我们就绩效分类的标签征询谷歌人的意见,结果得到4200多张投票。大趋势倾向于严肃、明晰,而不是异想天开。

  ● 实验至关重要。没有外部证据的情况下,我们必须自己动手,与谷歌各个部门的管理者协作,帮助他们测试想法。在YouTube,他们尝试将所有人按照最高效到最低效的顺序进行排名,不论员工级别,排名之后发现最高效的两个人是中层员工,然后两人得到了YouTube最高的股权奖励。虽然获奖人的具体奖励并没有公布,但是每个人都知道有这样的事情发生。 注释标题 这个例子很容易令人想到艾伦·尤斯塔斯的格言:顶尖工程师的价值相当于普通工程师的300倍,而传统的绩效和薪酬体系都是依据等级制度而不是依据贡献来决定报酬的。 我们还在另外的部门尝试将绩效考评分为5级,管理者发现相比此前41级的绩效评估,在部分项目上满意度要高20%。

  我要特别强调这项工作对人力运营部而言的难度。我们的工作并非关乎生死,但是员工会抱怨、会抗议,最终可能会辞职。我们在谷歌面临的挑战在于,因为我们给了谷歌人太多的自由,因为我们以数据为导向,因为谷歌人关注公平性以及我们对待彼此的方式,所以要做出此类改变需要艰苦卓绝的努力。我们接触的每一个团队都对现行体系非常失望,但是每个团队又都不愿做一些新的事情。而单单是我们的YouTube部门,就提出十几种不同的新考评体系进行尝试。我非常自豪,人力运营团队在实现这些改变的过程中坚韧、有见解、细心,而我更要感谢那些与我们合作的团队,他们放弃了谷歌15年的传统,尝试了一些新的东西。

  根据我们的实验,2013年初我们停止了季度考评,改为6个月进行一次。虽然还有人抱怨,但并没有造成任何损失。这一改革立刻节省了50%的考评时间。

  2013年底,我们选定了全公司大约15%的员工,一共6200多位谷歌人,改为采用5级考评量表:需要改进、持续达到期望值、超过期望值、大幅超过期望值和表现杰出。与以前的标签类似,但是实际的评分级别变少了。

  我们秉持了医学的宗旨:Primum non nocere,即首先不要造成任何伤害。鉴于这是第一次尝试这种改变,我们设定的目标仅仅是达到与旧的考评量表相当的满意度、公平性和效率即可。我们发现,一旦跨越了最初的怀疑和认知阶段(“你说我不再是3.8是什么意思?我很努力地工作才得到3.8的!”),就不必再为0.1的评分差别而苦恼和浪费时间了。管理者也被迫与员工进行更有意义的对话,而不是将一切都隐藏在“你这个季度的考评分数提高了0.1,干得不错,继续努力”之类的话中。

  看到“准确性”没有丧失,我们长舒了一口气。我们将5级量表考评体系下谷歌人的感受与41级量表下谷歌人的感受做了对比。我们问了如下问题:

  ● 绩效水平低下的人识别出来了吗?

  ● 适合升职的人识别出来了吗?

  ● 讨论有意义吗?

  ● 过程公平吗?

  在全公司范围内,新流程的评价并不比旧的差。虽然看起来似乎只是一场得不偿失的胜利,但是我们长长地舒了一口气。有些谷歌人担心41级的考评量表所传递出的准确性会丧失,也就意味着我们的评分会不那么有用和有意义。但现实中谷歌人调查结果暴露出我们一直怀疑的一个问题:41级考评量表只是给了准确性的假象。

  多数谷歌人都承认,很多考评体系下多0.1或少0.1的评分并没有什么区别。比如,对3.1和3.2之间的差别从来都没有一致的结论。正如我们人力与创新实验室成员梅根·胡特所解释的:“这种状况下的考评可能既不可靠也没有效力。同一个人,同样的表现,但是由于考评人和校准团队的不同,她得到的评分可能是3.2,也可能是3.3。这就意味着考评不可靠。如果她得到了3.3,实际表现却只是3.2,那么就说明考评没有效力——评分没有反映实际情况。”

  因此,如梅根所说,考评体系并不完善。也就是说,我们应该告诉员工:“吉姆,你的绩效表现介于3.3和3.5之间。”但现实中我们并不是这么做的,管理者拿到一个分数,就会给分数赋予一定的含义。因此,如果某人的考评分数从3.3提升到3.5,就会认定他取得了进步,但实际上他的表现可能还保持在原来的水平。再想象一下,你的考评分数降低了,对你的评述也认为你的表现变差,但实际上只是测评的误差,这时你的处境该多么糟糕啊。

  接下来,发生了一些有趣的事情。这6200多位谷歌人分属8个不同的部门,其中总人数1000人的三个团队决定对5个绩效分类做进一步细分。比如,有一个团队将每一个分类进一步分为三个次级分类,这样明星谷歌人就可能得到“特别杰出”“中等杰出”“低水平杰出”的评定。图7-2显示的是最终的考评分布。我将所有的次级分类合成了5个主要分类,便于对比两种方式的区别。A组坚持了5个分类,B组有15个分类。

  图7-2 A组和B组的平均考评分布

  B组中有更多的绩效标签,他们期望能更细致地区分员工,但实际上区分度远不及A组。A组中5%的员工为“表现杰出”,B组中只有1%。我敢说,所有这些团队的总体表现都在同一水平上,他们给谷歌带来的价值相当,没有哪一个团队的成员优于另外一个。而B组中加入了更多的考评分类,不知不觉、无意识或错误地认定他们没有明星员工。虽本无意如此,但他们80%的顶级员工被排除在顶级绩效分类之外。

  在你阅读本书时,所有谷歌人都已经开始采用5级考评量表了。在2013年底,这还处于实验阶段,但最初的种种迹象都很好。第一,这种体系下员工能够得到更多的考评结果反馈,替代了以往3.2和3.3之间的模糊区别。第二,这种体系下的绩效分布更广。我们缩减了绩效考评的分类,管理者就更可能利用考评体系的两极。虽然关于绩效考评体系的学术研究尚无定论,而且谷歌人的反馈意见也都趋于中立,但是我发现5级分类的考评体系至少在上述两个方面具有优势。

  2014年中期,我们看到了更积极的效果。我们认为不同的工作所产生的影响力有所不同。如果你是一名工程师,你的新产品可能使100人或10亿人受益。如果你是一名招聘人员,即使再怎么努力,也不可能有足够的时间影响到10亿人。我们不再引导何为正确的考评分布之后,发现了4种各不相同的考评形态,能够更好地反映不同团队和个体的实际绩效特征。

  我们还发现,管理者对考评体系两极评级的使用翻了倍。获得最高评级的员工比例提高,更好地反映了实际绩效表现(跳到第十章,了解个中原因)。同时,落在最低一档绩效分类的耻辱感也有所降低,管理者可以相对轻松地与陷入困境的员工进行直接而真诚的交谈,帮助他们改进。

  经过反复的争论和一段时间的混乱,我们废除了过去那种不准确且浪费资源的考评体系,用一种更简单、更准确,且未增加校准时间的全新考评体系取而代之。在此要说明一点,在这个问题上直到现在仍有争论,也很混乱!但我们正慢慢地度过这个时期。我们已经看到,员工对新体系越来越适应,也更加赞赏这套体系。

  我在此本着测试发布的精神,与你分享上述内容,就好似我们即将发布到市场上的产品。这些产品已经接近成熟,比市场上现有的产品要有效得多,但是还没有达到100%的精确和完美。

  也就是说,考评的评级分类数量在这里是最不重要的一个问题,尽管谷歌人在这个问题上有着惊人的热情。不要设定多于15种评级选择,至于选择3个评级还是6个评级就随你了。我不给更具体的建议。

  校准评级,激发员工内在动机

  绩效评估的灵魂在于校准。可以说,如果没有校准,我们考评流程的公平性、可信度和高效性都会大幅下降。我认为,校准正是谷歌人对我们的考评体系满意度是其他公司员工对自己公司考评体系满意度两倍的原因。

  那么,何为校准?谷歌的考评体系过去和现在的与众不同之处在于不仅由直属管理者做决定。管理者给员工做初评——假设是“大幅超过期望值”,做出的初评结果一方面依据这位员工出色的OKR,另一方面也受到其他活动的影响,比如完成的面试量或外部客观环境的影响,经济波动造成广告收入变化等。(这一点很重要。OKR影响考评,但不能决定考评。)在这个初评级别最终确定之前,分成小组的管理者会坐在一起开始我们所谓的校准环节,审阅所有员工的初评评级。

  校准增加了绩效评估的一个环节,但对于保证公平性至关重要。某位管理者的评估会与类似团队经理的评估做比较,他们会共同考评手下的员工:5~10位一组的管理者会面,在墙上投影出手下50~1000名员工的考评情况,讨论每一名员工,达成一个公平的评级。此举避免了管理者因来自员工的压力而提高评级的情况。同时此举还确保考评结果能够反映所有人对绩效表现的共同期望,因为管理者对手下员工的期望值有所不同,对绩效标准的理解也有各自特别的方式。这就和在学校时一样,有些老师给分很松,而有些老师则很严。校准过程迫使管理者向彼此证明各自决定的合理性,以此消除偏见。同时此举还可以提升员工的公平感。

  在考评员工时进行校准,其效力与面试应聘者后比较面试笔记的效力并没有太大不同。二者的目标是相同的:消除个体偏见的源头。即使你们是一家小公司,如果能依据小组讨论而不是单一管理者决定考评事宜,结果也可以更好,员工也会更开心。

  然而,即使在校准时,成组的管理者也可能做出糟糕的决定。当我们评估他人时,我们在如何做决定方面犯了许多错误。比如会出现近因效应,即你会更加重视近期的经历,因为这段经历在你的记忆中更清晰。如果本周我与某人进行了一次成果卓著的会议,而后参加了一次考评校准会,对与我开会的那个人进行考评,那么我就很可能提高对他的评价,因为我的潜意识会倾向于近期积极的交流。为了解决这个问题,我们在大多数校准会开始时会发放一份材料(见图7-3),描述一些考评人员常犯的错误,以及修正的方法。后续页面中会展示一种错误版本。

  每次校准会议,我们都会先回顾一下这些常见错误。我在参加过的校准会议中观察到,只需要提醒管理者注意这些现象,哪怕是简短的提示,也可以避免很多此类的错误。同样重要的是,这种做法创造出一种语言和文化习惯,可以防止此类错误发生。如今在校准会上时常会听到某人这样引导对话方向:“稍等,这是近因效应。我们需要回顾整个阶段的绩效表现,而不仅仅是上周的。”

  图7-3 供校准会议开始前参考的部分资料

  版权归谷歌所有

  你能够感觉到,虽然减少了考评的频率,简化了考评量表,但是我们仍然在考评上投入了大量时间。在我们的绩效管理工具中勾选选项为团队成员做初步评级可能只需要10~30分钟,但是一次校准会则要用三个小时,甚至更长时间。并不是每个人都需要讨论,有些时间会用在确保校准人本身已经得到校准,把多位管理者都了解的一些个体拿出来做对比,这样就可以以这个人作为标尺或基准。校准人还会比较不同团队的评级分布,不是单独观察每一个团队的评级分布,而是为了理解为什么某些团队的分布会有所不同。比如,其中一个团队可能确实比另外一个团队要强。随后大部分时间都会用于探讨一些突出的问题,比如不正常的短期绩效提速或减速,绩效表现的大幅波动或评级分类的边界问题。

  很多公司彻底抛弃了考评制度,为什么我们还要坚持这个体系?

  我想这关乎公平。

  考评是工具,是一种简化手段,可以在管理者做有关薪酬和升职决定的时候提供帮助。作为一名员工,我希望受到公平的对待。如果某个比我贡献更多的人拿到比我高的薪水,我没有任何意见。但是如果某人与我做着同样的工作却拿到比我更高的薪水,那我将非常不开心。一个公正的考评体系意味着我不需要担心这些,同时还意味着如果某人做出了非凡的工作,不仅他的管理者能够看到,校准会议上的很多管理者都能看到,这些管理者共同打造出公司范围内一致的标准并进行推广。考评同时还有利于员工在公司内部转岗。作为一名管理者,我可以信任某位“大幅超过期望值”的员工可以做出了不起的工作,不管她上一份工作是在Chrome团队、谷歌眼镜,还是销售团队。作为一名员工,我可以相信员工升职是靠表现而不是靠耍政治手腕。对于一个小团队来说,并不需要这样的基础架构——你认识每一个人。但是一旦公司规模扩张到数百人,员工就更愿意相信一个可靠的体系而不是管理者个人。并不是因为管理者一定就是坏人或心存偏见,而是因为一个包含校准的考评流程能够有效地消除不良行为和偏见。

  公平的考评流程只能带你走这么远。作为一名管理者,你不仅要告诉员工他们的表现,还应告诉他们未来如何做得更好。问题在于:如何最有效地传递这两种信息?

  答案是,通过两次独立的谈话完成。

  内在动机是成长的关键,但是传统的绩效管理体系毁掉了这种动机。几乎所有人都渴望进步。传统的学徒制就是基于这种认识。一名没有经验的工人希望学习,而与一位经验丰富且愿意教他的人做搭档是最好的学习方法。还记得你第一次骑自行车、学习游泳或是学开车吗?掌握一项技能的刺激感和成就感是强有力的学习动力。

  引入升职或加薪等外在动机之后,学徒学习的意愿和能力就会关闭。1971年,罗彻斯特大学的爱德华·德西和理查德·瑞恩陪同一些人进入一间实验室。每一位实验对象都会拿到7个三维的塑料块,这些塑料块可以组装成数百万种形状。在3个一小时的时间段中的每一段,实验对象都被要求根据所给图片拼出4种图形。如果他们无法在13分钟内拼出一种,实验者就会进来帮助他们,证明所有拼图都是可以完成的。在他们右手边是其他各种可能图形的图片,他们左手边是最新出版的《纽约客》、《时代周刊》和(当时是20世纪70年代)《花花公子》。实验者与实验对象一起坐在实验室中,除了每一小时的时间段中有一个8分钟的间隔,实验者会找个借口离开,假装去测算实验结果。他对实验对象说:“我只离开几分钟,这段时间里你可以随意做些什么。”事实上,这段时间正是实验的关键时刻。没有任何监督,实验对象会继续拼图工作吗?

  对照组的实验对象在最初两个无人监督的休息期分别有213秒和205秒用在继续拼图上,最后一个休息期拼了241秒。实验组的实验对象在第一个休息期用在拼图上的时间平均为248秒。第二个小时开始之前,实验对象被告知,每完成一个拼图将得到一美元的奖励。有了额外的刺激,他们在拼图上用了313秒,比第一个小时多用了26%。第三个小时开始之前,他们被告知,钱只够做一轮奖励,因此不会再得到金钱奖励。这一次用在拼图上的时间下降至198秒,比第一轮低20%,比有金钱奖励的一轮低了37%。

  这是一个早期小实验,但证明了激励因素的力量,以及移除激励因素的负面影响。德西和瑞恩总结认为,外在动机的引入会使人们看待工作的方式发生改变,同时会降低内在动机。他们继续论证称,内在动机不仅能激发更好的表现,而且使人精神焕发,增强自尊感与幸福感。工作环境给予员工能够激发自然内在动机的更多自由,从而帮助员工感觉更有自主性、更有能力。

  类似的动态状况在管理者与员工促膝探讨年度评估和加薪的时候也存在。员工关注外在奖励时也停止了学习,如加薪或更高的考评等级。以前我的团队里有一名成员——就叫他萨姆吧,每个季度都会苦苦纠结于他的考评分数。如果得分高,他也不在乎为什么会得到好的考评结果,或是应该继续发扬哪些做法;如果考评结果一般或比较差,他就会争辩说我们没有了解所有实情,指责评估做得有问题。萨姆会一直这样争辩下去,直到最后我实在不堪其扰,给他一个更高的考评分数。我羞于承认实情,但心底知道这么做的并非只有我一个人。

  事实上,员工有理由为获得更高的考评分数努力争辩。作为一名管理者,激励我的因素在于公正、诚实地考评员工,以确保公司正常运转。作为一名员工,我的动机当然是表现得更好,但与管理者争辩,争辩,再争辩,以获得更高的考评分数也是合情合理的事情(只要不是太过分,逼得管理者发怒)。这样管理者没有任何损失,只是正直的品格稍微损失了一点点(唉),而作为一名员工,好的考评结果意味着更高的收入和更多的机会。而且我可以一周用数小时的时间准备说辞,而我的管理者不仅没有这么多时间如此应对每一名员工,也不可能像我一样了解到那么多信息,因为他不可能整天与我待在一起。只要考评与薪酬和职业机会直接挂钩,每一名员工都会受到激励去利用考评体系。

  即便我不和管理者争辩,他也会担心我可能会与他争辩。长岛大学的莫拉·百丽威做过一项调查,她请184位管理者在一组员工中进行加薪分配。薪水增加的情况与绩效考评很好地契合。然后这些管理者被告知,公司的财务状况不佳,加薪有限额,但实际可分配的资金与之前相同。尽管男女的考评分数分布基本相同,但这一次,男性获得了所有加薪的71%,而女性只获得了其中的29%。男性管理者和女性管理者都给男性员工分配了更多的加薪,因为他们认为女性能够平和地接受公司业务状况的解释,但是男性不会接受。他们给男性分配了更多的加薪,避免自己担忧的艰难谈话出现。

  我们有一个非常简单的解决方法。

  不要同时进行两项谈话。年度评估在11月进行,薪酬分配在一个月之后进行。谷歌公司的每个人都有股权分配,但是这件事要沿着时间脉络再过6个月才进行探讨。

  正如普拉萨德·塞迪解释的:“传统的绩效管理体系犯了一个大错。他们将两件应该彻底分开的事情合到了一起:绩效评估和人员发展。评估有其必要性,可确定加薪或奖金等有限资源的分配。发展也同样很有必要性,可以促进员工的成长与提高。”如果你希望员工成长,不要同时进行这两项谈话。确保你与团队成员之间形成一个不断来回的状态,而不是年底的一次惊喜。

  谷歌的群体考评智慧

  我们在第五章中介绍了谷歌依靠群体智慧做出聘用决定,同样的原则在培训和评估现有员工时也适用。回过头继续说我的团队成员萨姆,我只看到了他的部分工作,因此他争辩说我对他的表现并没有全面了解也是有理有据的。但是萨姆同时还有强烈的动机来取悦我,他会夸耀自己的工作,贬低周围人的工作,相比之下他的表现就会显得很好。他把这些都做了。我作为一名管理者,几乎不可能全面地了解萨姆的贡献。

  然而,他的同事了解真实的萨姆。他们发现萨姆善耍手段,好胜心强且恃强凌弱。我了解他们的想法,因为每年谷歌人不仅会得到上级管理者的年度反馈意见,还会得到同事的反馈意见。在进行年度评估的时候,谷歌人和他们的管理者会选出一些评审人,不仅包括他们的同事,还包括他们的下级。

  这种反馈意见非常有效。有一位领导者,在介入非其专业领域的问题时总是很谨慎,有人对他说:“每次你开口,都是在贡献价值。”多年之后,他告诉我,一位同事的些许洞见鼓励他成为团队中更活跃的成员。是他的领导指导他毫无保留地表达见解,但是真正起到关键作用的还是同伴的鼓励。

  2013年,我们还尝试将同事反馈意见模板做得更具体。在此之前的很多年,我们都使用同一种格式:列出3~5项这个人擅长的事情,列出3~5项他们可以做得更好的事情。现在我们会问需要这个人把哪一件事做得更好,以及一件可以采用不同做法却能产生更大影响的事情。我们认为如果员工只需要关注一件事情,相比分散精力的情况,更可能实现切实的改变。

  过去我们要求员工在一张空白纸上列出过去一年所有的成就,现在我们请员工列出具体的项目、他们的角色以及他们取得的成就(见图7-4)。我们要求谷歌人用512个字符描述他们在每个项目上的工作,因为我们认识到如果同事考评人需要阅读更多关于项目的解释,那么他们很可能并不知道那个项目到底是什么。如果他们并不了解项目,那么同事评阅的仅仅是这个人的总结,而不是被评人的实际工作。同事考评人之后会被要求评定(利用屏幕上的一个滑动条)他们对这个具体项目的了解程度以及被评人个人对项目的影响有多大。一段时间之后,我们了解到哪些提供反馈意见的人所做的评估可靠,这与我们评定面试官的做法如出一辙。谷歌人也可以在一年的任何时候针对某个特定的话题征求反馈意见,不需要等到某个特定日子。

  图7-4 谷歌同事反馈意见模板截图

  版权归谷歌所有

  为了确保员工与管理者的交谈更有效,我们整理出一份一页指南(见图7-5)分发给他们,在交谈绩效的时候使用。做这份指南的目的还是为了使对话更具体、更切合实际。我们给员工分发这些指南只是为了稳妥,我们希望管理者能够覆盖恰当的话题,而且引导员工准备好讨论也没有什么坏处。

  我很惊奇,甚至有些尴尬(我理应知道这些事情),小小的改变竟然会给全公司带来如此巨大的影响。更具体的模板,使撰写评审报告的时间减少了27%,且第一次出现75%的员工认为撰写评审报告有用处的情况,比前一年高出26%。利用讨论指南与管理者进行讨论的员工对绩效谈话的评分满意度要比没有用指南的员工高14%。有一位谷歌人非常激动地写道:“我的天啊,这个版本真是简单多了,用的时间少了太多。感谢你们把9月还给了我!”

  实验给了我们信心,让我们赢得了谷歌人的信任,也让我们得以于2014年在全公司进行了这些改变,谷歌人因此变得更开心了。80%的谷歌人认为用这种方式提供反馈意见的时间得到了很好利用,比前两年高出50%。虽然还不完美,但是已经取得了巨大的进步。

  图7-5 为管理者准备的谷歌讨论指南(节选)

  版权归谷歌所有

  综合考虑,再做升职决定

  在大多数公司里,如果你的考评成绩足够高,就能得到升职。通常你的上司会做出决定,或者你会调任到一个新岗位,得到一个别致的新头衔。在谷歌,升职的过程则不尽相同。现在你或许能够猜到,升职决定也和考评决定一样,是由委员会做出的。他们审核准备提拔的员工,根据前几年得到升职的员工的情况以及明确定义的标准对他们进行校准,以确保公平。

  如果不依靠群体智慧,我们就不是谷歌了。同事的反馈意见是委员会审核技术人员升职信息包中的一个核心部分。

  这里还有一点小的调整。在技术或产品管理领域工作的谷歌人可以自荐升职。有趣的是,我们发现女性相对较少自荐升职,但是一旦她们自荐,她们得到升职的概率要稍微高于男性。这一点与学校里发生的情况有些类似:通常,男生更愿意举手尝试回答问题,女生则倾向于等待确定了答案才去回答,尽管她们答对的概率与男生相当,甚至更高。

  我们还发现,稍加外力推动(艾伦·尤斯塔斯给全体谷歌技术人员的一封电子邮件中描述了这个发现),女性自荐升职的比例就与男性相当了。他在最近的一份报告中与所有人分享了按性别和级别分类的升职数据,其中我最喜欢的一段话如下:

  我希望将我们近期在鼓励女性自荐升职方面的努力告诉所有人。这是一件重要的事情,也是我的热情所在。任何准备好升职的人都应有信心自荐,而管理者要使员工感觉有权如此行事,这一点很重要……为了监控这个流程,我们还会回顾此前三轮的升职数据,识别持续出现的遗漏……我将继续分享相关数据,确保在这个问题上能够公开和透明,以便保持当前积极的势头。

  当然,不管性别如何,不可能每个人都能得到升职。如果你没有得到升职,升职委员会将为你提供反馈意见,指导你如何改进,提高下一次成功的机会。在你阅读反馈意见的时候可能会觉得理所当然,但这种做法已经越来越罕见了。你可以想象,像我们一样规模的公司组成升职委员会需要动用数百名工程师,升职流程的每个周期很容易就会用上两三天的时间。我们发现,或许是因为委员会多由普通员工组成,他们投入了大量的时间,而且委员会成员除了做出良好决定之外并无其他所图(与我们的招聘委员会类似),工程师相比非工程师员工对升职流程的公平性认可度更高。

  在绩效管理和升职方面用的时间与我们差不多的组织中,我所见过的只有大学和合伙企业。这两种组织里,升职到最后可以在整个团体中得到一份终身职位,或是终身教授,或是合伙人。组织投入大量的精力,关注你的长远追求。

  我们也根据实际情况,在评估中投入了大量精力。过去5年中,谷歌的营业额和总人数每年大约以20%~30%的比例在增长。我们竭尽全力招聘已经证明了学习天赋的人才,然后竭尽所能帮助他们迅速成长。保证员工的发展并非奢望,这是我们生存发展的根本所在。但是我们在发展过程中的一些核心概念汇总成一种语言,经过转化可以适用于任何公司。

  第一,正确地设定目标。要让目标众所周知。目标要有野心。

  第二,收集同事反馈意见。有一系列线上工具(至少有谷歌表格)可以进行调查、整理结果(在浏览器中输入“谷歌电子表格调查表”)。每个人都不喜欢被贴上标签,除非这个标签是非凡的赞誉,但是每个人都喜欢有助于工作的有用信息。多数公司缺少的正是后者。每一家公司都有某种评估体系,然后以此为依据分配奖励。极少公司有完善的员工发展机制。

  第三,说到评估,应引入某种校准流程。我们倾向于管理者可以坐在一起,作为一个团队共同审评员工。这样需要更多的时间,但评估和决策的过程更可靠、更公正。采用这样的方式,人们可以坐在一起加强交流,巩固公司珍视的价值,这有利于公司文化的发展。面对面的会议对于员工数量不到1万人的公司是最高效的方法。员工数量超过1万之后,就需要大量的会议室才能安排下所有人。我们的员工数量已经超过5万,但仍然坚持着面对面的会议,因为这样是对员工最有益的做法。

  第四,把奖励分配谈话与员工发展谈话分开。两项谈话混为一谈会扼杀学习的动力。不管公司规模多大,这一点都适用。

  绩效管理的其他方面,比如绩效分类的数量,分类是用数字表示还是用词语表示;考评频率,采用线上考评还是纸质考评……这些都不重要。苦苦摸索了很久之后,我们探索出一套适用于谷歌的考评体系和考评节奏,但是并没有任何外部案例证明这些做法在谷歌之外的公司也行之有效。除非你们也想要如我们一般做探寻不同结果的实验,否则这些方面就用不着担心了。

  将关注点放在真正重要的事情上:依据目标对绩效进行公正的校准,开诚布公地指导员工学会如何提高。我们每个人身体中的丽莎·辛普森都渴望得到别人的评价,因为她想要成为最好的,她希望成长。你需要做的就是告诉她如何成长。

  谷歌工作法则

  ● 正确地设定目标。

  ● 收集同事的反馈意见。

  ● 通过校准流程确定考评结果。

  ● 把奖励分配谈话与员工发展谈话分开。 互联网名企工作方法论(套装共14册)

目录
设置
手机
书架
书页
评论