<論文>人事考課における客観的評価の陥穽利用統計を見る

(1)

著者

寺畑正英

著者別名

Terahata Masahide

雑誌名

経営論集

巻

54 ページ

95-110

発行年

2001-11-30

URL

http://id.nii.ac.jp/1060/00005545/

Creative Commons : 表示 - 非営利 - 改変禁止 http://creativecommons.org/licenses/by-nc-nd/3.0/deed.ja

(2)

人事考課における客観的評価の陥穽

寺畑正英１人的資源管理における人事考課の位置づけ２人事考課システムの客観性３人事考課の有効性に関する基準４職務分析の方法と問題点５評価フォーマットと評価情報の源泉６「客観的」人事考課の非合理性１人的資源管理における人事考課の位置づけ本論文は、従業員の人事考課(performance appraisal)における既存の方法の特徴を明らかにし、その問題点を指摘する１_{。一般的に人事考課とは、「従業員一人一人の日常の職務行動を通して、各} 人の職務遂行度や業績、能力を細かに分析、評価し、これを人事管理の全般または一部に反映させるしくみ」と定義される(楠田, 1981)２_{。企業は職務と従業員の能力を正確に把握し、実際に遂行} された職務行動を分析し、その結果を人事管理に反映させることが望ましいと考えられてきたのである。これまでの人事考課の議論は行動科学の影響を受けて、いかに科学的で「客観的」な理論たるかという方向を追求してきたように思われる (Bratton, 1994; Feild, 1988; Monday and Noe, 1990; Singer, 1990; Veres Ⅲ, 1996; Werther, 1993)。「客観的」な人事考課は大きく分けて以下の二つの観点から、望ましいと考えられている。ひとつは企業内の職務と従業員の能力を正確に把握し、人材配置を行うことによって、従業員が最も能力が発揮できるような環境をつくりだすことが可能であるということである。もう一つの理由は、従業員の人事考課は賃金の決定のために必要なタスクであり、企業は組織内の全ての利害関係者に受け入れられる正当化された評価基準をもたなければならないからである。この二つの理由から人的資源管理の議論は「客観的」評価基準の追求に進んでいった。このように人的資源管理の議論において、当然のことのように主張されてきた客観的評価に基づく人事管理にはいくつかの問題があるように思われる。すでに客観的評価と企業の人事管理のあいだに介在する問題点は指摘されている。たとえば、人事考課の結果を従業員の昇進に適用する時の問題点について、寺畑(1999)は次のように指摘している。従業員の業績は通常、短期的な評価が重

(3)

視される。しかし、長期的な人材選抜である昇進に、短期の人事考課の結果を適用すると、企業にとって望ましくない影響を与える可能性があるというものである。彼は、客観的評価と人事管理の関係に内在する問題点を指摘している。しかし、更に検討する余地のある問題点は、客観的人事考課そのものの妥当性である。既存の議論が主張しているような方法で、従業員の人事考課が客観的たりうるのだろうか。このような問題を考察するためには、まず、既存の議論がのっとっている客観的評価の方法を詳しく検討する必要がある。その上で、それらの方法の問題点を指摘しよう。まず、既存の議論が想定している人事考課の有効性に関する基準を検討する。客観的な人事考課をするための基準としてこれまでの支配的だった基準が評価のエラーを減少させることであったが、近年、評価の精度に関する基準が開発されてきたことを示す。しかし、これらの基準も結局は、評価方法の妥当性を高める基準ではなかった。それにも関わらず、これらの有効性を高めるための評価技法が開発された。特に、評価者のエラーを減少させる目的で様々な人事考課の方法が開発されてきた。評価者のエラーを減少させる技法の開発には、大きく分けて二つのカテゴリーが存在する。一つは評価フォーマットの開発であり、もう一つは評価情報の源泉に関する多様化である。これらの評価技法を検討した上で、その問題点として、そもそも評価の妥当性の基準が適切でないことと、理論的な限界のために支配的な評価方法は確立されなかったことを指摘する。支配的な評価方法を確立するために、さまざまな分析が試みられたが、結局、支配的な評価方法確立への努力は今も続いている。しかし、果たして支配的な評価方法は確立されるのだろうか。客観的な評価方法は確立できるのだろうか。この問いに対して答えるために、既存の研究をレビューすることにする。２人事考課システムの客観性人事考課は伝統的に産業心理学者によって研究されてきた。彼らは人事考課を計測の問題とみなしてきた。人事考課の研究者はスケールの開発とフォーマットの開発、テストと評価者のバイアスの減少といった問題に焦点を当ててきた (Landy and Farr, 1980) 。人事考課の歴史は、図１のように要約される。人事考課の歴史で、最も最初に問題となったのは主観的な計測と「客観的」な計測の問題である (Murphy and Cleveland, 1995) 。1900年頃の人事考課の手法は個人の特性による職務への適合性を主観的に判断するといった主観的アプローチが支配的であった。しかし、1940年代から産業心理学による成果を取り入れて、「客観的」なアプローチが支配的となってきた。「客観的」なアプローチが導入されていくにつれて、それまでの人間の特性を観察するアプローチから後述するＢＡＲＳといった職務の行動や結果を観察することによって人事考課を行うアプローチへと変化していったのである。そのような変化の背景には人事考課における目的の変化が影響を及ぼしている。1900年代初頭には、人事考課はもっぱら昇進や給与の基準として使われていたが、1960年

(4)

代以降は従業員の訓練と開発のためにも使われるようになった。職務に直結したアドバイスを行うためには、従業員の職務行動を一つ一つ分解して改善するべき行動を細かく把握する必要がある。このために、職務行動を分解して評価の対象とし、それぞれの行動の明確な基準の設定をする必要があったのである。職務行動の分解と明確な基準設定は、昇進と給与の決定にも大きな影響を及ぼした。昇進と給与の決定基準として、誰の目にも公平で正当なものであることが明らかになるからである。図１人事考課の歴史

出所：DeVries, Morrison, Shullman, and Gerlach (1986), p.12

このように、人事考課を主観的評価から「客観的」評価へと移行させることが、評価者のバイアスを介入することなく、被評価者の職務の現実を把握する最善の方法であるという認識を理論家も実践家も受け入れてきたのである。しかも、「客観的」評価の方法がどんなに進化しても、実際に使われている企業の既存の人事考課システムは客観性の側面ではまだまだ不十分であると理論家は認識している (Bernardin and Klatt, 1985) 。企業で実際に使われている人事考課システムには欠陥があり、その欠陥の大部分は心理学的な測定方法の稚拙さにあるという主張が全般に見られることを Bernardin and Klatt は指摘している。それでは、「客観的」評価の方法とはいかなる意味で「客観的」であり、どのようにすれば完全に「客観的」な人事考課が可能なのであろうか。現在、一般的な人的資源管理、あるいは、人事考課の教科書で使われている人事考課の手法をレビューすること

(5)

によって、その内容を把握していきたい。３人事考課の有効性に関する基準人事考課の方法が客観的であるかどうかを測定するために、人事考課の有効性という尺度が一般的に使われている。従業員の人事考課における有効性とは、ある人事考課の手法によって従業員の評価がいかに適切に行われているかということをあらわす。有効性という概念はそれ自体は抽象度の高い概念であるため、有効性の単一尺度を開発することは難しい。そこで、評価の有効性を構成する三つの概念が開発されている(Cardy and Dobbins, 1994) 。一つは人間が評価を行うときに起こすエラーの尺度である。二つ目は、評価の精度である。三つ目は定性的な尺度である。評価エラーの尺度は、人事考課の歴史上最も古くから注目されてきた尺度である。評価の手続き上、最も重視されるべき基準として近年注目を集めていた尺度は評価の精度である。評価の精度は、被評価者の真実の業績と評価者の評価がどの程度合致しているかを示す尺度である。これはいわゆる「正しい評価」を示す究極の基準であるが、初期の人事考課では、評価の精度を計測する方法が確立されておらず、専ら評価者のエラーを矯正することが、正確な評価への「近道」であると考えられていたのである。三つ目の定性的な尺度は、被評価者に知覚される評価の公平性と満足度に基づいたものであり、この尺度は、前者の二つの尺度とは基本的な位置づけが異なる。この尺度は評価の有効性として、認識されはじめたのは近年のことであり、具体的な評価基準が確立されていない。このような評価尺度を満たした評価が、適切に評価する方法であると捉えられてきた。しかし、これまでの人事考課の理論の歴史は、評価手法の限界から、間接的な精度の追求に終始してきた。間接的な精度とは評価者のエラー(rater error) をいかに減少させる評価手法を開発するかということである。以前は評価者のエラーは正確な評価の最も一般的な指標であった。しかし、以下で述べるように、評価者のエラーは必ずしも、評価の精度と関連づけられないという実証研究が蓄積され、評価の精度そのものを直接計測することを目指す方向に理論的な研究が発展した。このように歴史的には、人事考課の有効性を達成する概念は評価者のエラーを計測する立場から、評価の精度そのものを計測する立場に移り変わっている。しかし、実際の評価手法の開発は評価者のエラーを矯正する手法に偏っている。以下ではそれぞれの有効性の概念を詳細にレビューし、どのような評価の基準が想定されているかを指摘する。 (1)評価者のエラーすでにのべてきたように、評価者のエラーは間接的に評価の精度を示す尺度として利用されてきた。評価者のエラーとは、評価者が評価を行うときに心理的に発生するエラーを示している。主な

(6)

評価者のエラーはハロー効果 (halo effect) と、寛大効果 (lenicency effect) 、中心化傾向 (restriction of range) が存在するとされている (Cardy and Dobbins, 1994; 楠田, 1981) 。

ハロー効果とは、ある側面の評価に他の評価が影響を受けることを示す。例えば、営業成績の能力と職場内の人間関係を円滑に進める能力は、本来、直接的な関連はないはずである。しかし、なんの事実確認もなく、評価者が営業成績の高い従業員に職場内の人間関係を円滑進めているという評価を与えることがそれである３_。寛大効果とは評価が全体として、好意的なものになることである。実際の評価の場面では、評価の平均値が高くなるという現象が現れる。寛大効果と同じ原理で、逆の効果として、厳格効果 (severity effect) も存在する。中心化傾向とは評価者が評価スケールにおける自分の評価の範囲を限定することである。例えば、７点尺度の評価スケールにおいて、評価が４点から５点のあいだの狭い範囲でしか行われなかった場合にはこの効果によるエラーである。中心化傾向は被評価者間の差別化を評価者が好まないことから生じる。評価者の三つのエラーは、伝統的に、人事考課の文献では修正するべきものであると考えられてきた。これらのエラーが起こる原因は、大きく分けて三つ指摘されている(楠田, 1981)。一つは、評価者が普段の職場の人間関係を円滑に進めるために、評価を歪めるというものである。二つ目は、考課基準に対する理解不足である。三つ目は、考課の結果がどのように人事管理に反映されるか理解していないことである。つまり、人事考課の方法に関する理解を促進すると同時に、評価者が人事考課を行うときに、上に指摘した三つのエラーを起こしにくいような評価の方法を開発することが評価者のエラーを減少させることにつながると考えられてきたのである。以後に議論する人事考課の手法は、ほとんどが、この三つのエラーを減少させるために開発された手法である。しかし注意しなければならないのは、評価者のエラーには概念的な問題と計測の問題の二つの問題点が存在することである。評価者のエラーとは、ある評価者の評価が評価者の集団の中で乖離している程度を示しているだけである。評価者集団の平均値が、評価の「真実」の値を示しているとは限らない。したがって、評価者のエラーを矯正しても、異常値を示していた評価者が評価者集団に順応したことを示しているに過ぎない。さらに計測の問題は、それぞれのエラーの発生あるいはエラーの大きさに関して実証的に検証する適切な方法が提供されてきていない (Cardy and Dobbins, 1994)。たとえば、ハロー効果のコンストラクトの主な操作的メジャーは評価次元間の平均標準偏差と次元間の中位値の相関によって計測される (Becker and Cardy, 1986) 。このやり方は人事考課の文献においてもっとも一般的に使われている手法であるが、その方法ではエラーの発生を正確に把握できないことも指摘されている。まとめるとエラーとはある評価者の評価が評価者集団の中

(7)

で、どのくらい変わったパターンをしているかを示すに過ぎない。また、そのエラーの度合いを計測する段階でも正確にエラーを計測する方法が確立されていない。

しかしながら、長い間、評価者のエラーは多様な人事考課の特質を評価する従属変数として使われてきた。もっとも顕著に行われてきたのは、フォーマットの比較である (Landy and Farr, 1980) 。それらの研究はいくつかのフォーマットを使って人事考課を行い、どのフォーマットが寛大効果とハロー効果、中心化傾向を減少させられるかを比較してきた。評価者のエラーの低いフォーマットがよりよい評価のツールと結論づけられていた４_{。さらに、評価者のエラーは評価の} フォーマットの開発と評価者のトレーニング・プログラムに関する開発の方向性も決定していた。評価者のエラーを人事考課の有効性基準とすることに、最近では多くの批判がなされている。概念的にも実証的にもエラーが評価精度の代理変数として役に立たたないことを示す実証研究が多く見られるようになってきた。評価者のエラーと後述する評価精度のあいだの相関が低いことが示されてきているからである。実証的には評価者のエラーは精度の代理変数にならないという結果がいくつかの研究で散見される (Becker and Cardy, 1986; Bernardin and Pence, 1980; Borman, 1977; Murphy and Balzer, 1989）。評価者のエラーは複数の評価者の評価集合のエラーを示している。それらの評価の分布を変えることは必ずしも評価精度を改善することではない可能性があるのである。例えば、ハロー効果は評価の精度と負の関係であるとは限らない。Cronbach (1955) は、不確実性下において、人間は評価の分散を限定する傾向にあることを示している。なぜなら、分散を減少させることによって潜在的な精度を最大限にするためである。真実の評価が５であると仮定するなら、ハロー効果の影響を受けている分散の低い方が、ハロー効果の影響を受けていない分散の高い評価より真実に近い評価をしている可能性が高いと言える。このように、評価者のエラーに関しては、それが評価の精度あるいは信頼性になんら寄与しない可能性が否定できないにも関わらず、多くの人事考課の手法はこれらのエラーを減少させるために開発され、今でも使われている。 (2)精度の評価評価者のエラーを評価の精度の代理変数にする限界が指摘され、直接的な精度を計測する試みが近年の人的資源管理の理論で行われている。全ての精度に関する尺度の基礎的な共通点は評価者の判断が比較される基準を必要とするということである。この基準は被評価者の「真実」の業績、あるいは能力を示すものであると人事考課の議論では信じられている。それまで、明確で「客観的」な評価基準はほとんど存在せず、業績は評価者の主観的な基準に基づいて評価されていた。評価の

(8)

精度が有効性の基準となることによって、外的定量的基準が評価の基準として求められるべきであると考えられるようになったのである。評価の精度を保証する基準なしには業績の判断精度を評価することは不可能である。このような仮定の下に、人事考課の研究者は様々な外的基準を開発してきた。ところが、この精度という評価基準は、そもそも論理的な矛盾を抱えている。概念的には人事考課に関する精度の基準とは、評価者が被評価者の本当の職務遂行能力、あるいは本当の業績に近い評価を遂行した程度を示すものである５_{。従って、被評価者の「真実」の業績という基準がなけれ} ば、人事考課の結果を評価することはできない。本来、人事考課はその「真実」の業績を知るために行われているはずだが、その擬似的な「真実」の業績を仮定する方法を考えなければならない。人事考課の文献では二つのタイプの業績の基準が提示されている (Murphy and cleveland, 1995) 。一つは観念的な「真実」の業績であるが、これは現実の人事考課では役に立たない。そこで、二つ目の業績基準である人事考課の専門知識を持った評価者を最適な評価条件のもとで評価させ、それらの評価の期待値を真実の評価とするという方法が主流になったのである(Borman, 1977) 。二番目の方法の背景には「真実」の被評価者の業績に関する仮定が存在する。評価の方法をよく知った専門家を評価者にして、その評者間の合意が得られる数値は正確であろうというものである。もちろん、観念的な「真実」の業績を主張する研究者はこのような主張に反論しているが、実践的な含意を持つ後者の方法が支配的な方法となったのである。人事考課の論文では、精度は人事考課を評価する基準としては理想的であると考えられている (Cardy and Dobbins, 1984) 。しかし、精度に関する実証研究は少ないため、その有効性に関しては結論がでていない。加えて、精度に焦点を当てることは外的妥当性を欠如させるという問題点も指摘されている。精度が最も完全な形で検証されるのは実験室実験であるが、このような研究は実際の企業の人事考課になんらインプリケーションを与えない可能性があると考えられているからである。例えば、被評価者の集団から昇進する人を選抜するときには、精度は重要ではない。精度は評価自体の正確さを追求するが現実の評価を行う企業では被評価者間の順番さえ認識されれば問題がない場合も多い。こうした問題にも関わらず、精度の尺度は重要であると考えられている。人事考課の科学的な側面を考慮に入れると、精度に焦点を当てた厳密な実験室の研究は現実の組織における精度の科学性に強い根拠を与える可能性があるからである。このような実験を蓄積することによって、現実の組織の科学的側面を促進する推進力となりうると考えられている。要約すると、精度は人事考課の重要な構成概念であり、尺度であると信じられてきた。精度を追求しなければ、企業内の人事考課の「科学的」な側面は失われ、政治的なプロセスが介入する可能

(9)

性が存在することを、人事考課の研究者は恐れているのである。人事考課の目指した「客観的」評価の理想は、被評価者の「真実」の業績あるいは能力を把握することであった。しかし、このような理想は被評価者の「真実」の業績とはなんであるかを詳細に検討することを経ずに、複数の専門的な評価者が合意した評価の数値が評価者の真実の評価と近似するはずであると仮定した。単純に考えても、評価者間の合意に基づいた「真実」の評価を基準に、評価者の精度を計測することは循環的なプロセスであり、その意義に疑問が残る。最も問題なのは、被評価者の真実の業績と、仮に設定した「真実」の業績とは乖離があることを隠蔽していることである。人事考課の精度を主張する論者にしても、これらの基準設定に関する限界は認めているが、新たなアプローチによる基準の設定方法が開発されるはずであるという、極めて楽観的な理論的志向を共有している。その結果、「客観的」人事考課の評価に基づいた人事管理を行うことによって、意図せざる現象が生じる可能性が大きくなるのである。このような批判の可能性を残しながら、理論家はここで議論した有効性の尺度を改善するために、様々な評価技法を開発することに努力した。これらの人事考課の有効性を高めるために行われた研究は大きく分けて二つある。一つ目はフォーマットを改善することが人事考課の質を改善すると考える研究である。二つ目は、評価情報の源泉を多様化することによって、人事考課の質を高める方法である。次節では、この二つの評価技法の具体的な内容とその前提となる職務分析の仮定を詳述する。４職務分析の方法と問題点人事考課を客観的に行うためには、システマティックな職務のデザインと評価は重要な課題であった。人事考課の議論は基本的にはいかに正確に従業員の業績を把握し、評価しようとするかに焦点が当てられた。そのために、正確な職務を定義し、その定義に基づいて、従業員の業績を評価するというプロセスが確立された（図２）。評価の結果は職務の効率化のために職務の再分析にフィードバックされるのと同時に、従業員の報償と昇進の意思決定にも用いられる。このようなフィードバック・ループを繰り返すことによって、より洗練された職務分析 (job analysis) と人事考課が行われると想定されていたのである。それでは、実際に、どのような職務分析と人事考課を通じて、フィードバック・ループが形成されていくのだろうか。人的資源管理の議論における人事考課のシステムを概観するために、まず、簡単に職務分析の方法について触れる。前述のように、職務の評価を行うためには、厳密な職務の定義を行わなければならない。その職務の定義方法が職務分析である。しかし、職務分析によって、得られる職務情報は非常に限定的なものであることを示す。

(10)

図２職務分析と人事考課のプロセス

職務とは組織がその目的を達成するために遂行されなければならない課業の集合で構成されていると人的資源管理の教科書は一般的に定義している (Bratton, 1994; Feild, 1988; Monday and Noe, 1990; Singer, 1990; Veres Ⅲ, 1996; Werther, 1993) 。職務はそれぞれの地位や部門に応じて詳細に決められるものであり、その内容を確定するために職務分析が行われる。職務分析とは職務とその必要条件に関する知識を収集する作業である６_{。職務遂行に必要なスキ} ルと知識、能力、そして、職務固有の課業と責任、義務に関する情報をシステマティックに収集し、評価し、組織化する。これらの作業は専門家によって行われる。このような職務の要件は、ある従業員が特定の職務を遂行したのちに人事考課をするときに、基準を確定するために必要な情報である。それでは、実際に職務分析はいかなる方法で行われるのだろうか。教科書では四つの方法が示されていることが多い。その方法とは質問票調査と直接的な観察、インタビュー、そして、従業員の日記などによる記録方式である。多くの場合、これらの方法が組み合わされて使われる。

職務分析を通して得られた結果は職務記述書 (job description) と職務明細書 (job specification) に記述される。職務記述書とは職務の課業と義務、そして責任を記述した文書であり、その職務を遂行する上で必要な条件を正確でコンパクトに記述することを求められている。従業員が何を行い、それをいかに行い、そして、どのような条件の下で行うかを示すことを期待されている。職務明細書は、ある特定の職務を遂行するために従業員が必要な最低限の条件を記した文書である。学歴と経験、個人的な特性、肉体的な能力が記述されている。このほかにもいくつかの職務分析の手法が存在する７_{。これらの方法は職務分析の洗練化を目指} しているが、ひとつの傾向が存在する。それは、職務記述のパッケージ化である。本来、職務分析とは職務記述書と職務明細書を作成するプロセスにおける職務内容の観察に本来的な意義あったと思われる。しかし、職業辞典 (Dictionary of occupational titles) にはじまるマニュアルによって、職務の内容に関する一般化が進み、職務分析の手法も詳細になっていくに従って、得られる情報の多様性が狭まっている。まず、職務の再分析を繰り返すことによって再定義行うので、職務に関する

(11)

記述は詳細になるが、これまでの定義と異なった再定義は行われにくくなる。さらに、職務質問票のフォーマットは地位分析質問票や管理職務記述質問票によって標準化され、一見、多面的な情報を網羅した質問票が構成されているように見える。しかし、その質問票に表記された限定された情報しか得られない。このように、職務分析の方法が確立されて行くほど、組織内で職務分析をする上で、もっとも重要であると思われる詳細な観察という側面が失われ、職務分析がルーティン化されてしまうのである。５評価フォーマットと評価情報の源泉先に取り上げた人事考課の有効性を高めるために、人的資源管理の教科書で最も一般的に議論されている手法は二つある。一つ目は評価者の主観的な評価を排除する外的基準をもつ評価技法の開発である。二つ目は複数の評価者による客観（共同主観）性の確保である。まず評価技法の開発に関する議論を整理する。これまでの理論は、人事考課における寛大効果やハロー効果を減らし、正確な人事考課をするフォーマットをデザインすることに労力を費やしてきた。

業績フォーマットの研究と実践には三つの信念がある (Cardy and Dobbins, 1994) 。一番目は、評価フォーマットは評価者が意図的に自らの評価を歪めることを防ぐようにデザインされるべきであるという信念が存在する。二番目は既存の大部分のフォーマットの問題点は寛大効果とハロー効果によって引き起こされるという信念である。この信念に基づくと、評価のアンカーを特定化し、具体化することよってフォーマットの質を改善できると人事考課の研究は仮定してきた。三番目は、人事考課をする認知プロセスのよりよい理解を進めることによって、そこから得られた知見を利用した評価フォーマットをデザインすることが重要であるという信念である。これらの信念に基づいた多くの研究から、フォーマットの開発は進展した。一般的に人的資源管理の教科書では７つの人事考課のフォーマットが紹介されている８_{。この７つの評価フォーマット} は、比較的よく紹介されているフォーマットの例に過ぎず、このほかにもさまざまな評価フォーマットが存在している。このようにいくつもの評価フォーマットが開発され、しかも淘汰されることなく併存しているのはなぜだろうか。つまり、それぞれの開発者は支配的な人事考課のフォーマットを追求しているが、研究者の合意は得られていないということである。評価フォーマットの開発は、すでに述べてきたように、評価者のエラーを改善するために多様な方法が開発されてきた。しかし、一つの評価エラーを解決すると、他の問題点が生じるといった際限のない開発の競争が行われているだけで、人事考課の理論の目的である根本的なエラーの解消には至っていない。このような評価フォーマットの乱立状態を既存の教科書はまとめて、状況に応じて適切な評価フォーマッ

(12)

トを採用することを推奨している。人事考課の有効性を高める二番目の方法は、評価情報の源泉を決定することである。管理者は典型的な評価情報の源泉である。個々の評価者の「客観的」評価を評価技法の開発によって追求しているとするならば、評価情報の源泉の多様性を確保することは共同主観を確立して、客観性を保証しようとするものである。つまり、被評価者に対して多様な利害関係を持つ主体を評価者とすることによって、あらゆる立場の評価者による平均的な評価を得ようとする試みである。たとえば、 Cardy and Dobbins (1994) は評価の源泉を五つ取り上げている。その五つとは管理者と被評価者自身、同僚、部下、顧客である。この評価情報の源泉は人的資源管理の教科書で取り上げられる一般的な五つの源泉である。これらの評価情報にはそれぞれ、合理的な側面と非合理的な側面があり、ドミナントな評価情報の源泉は存在しない。たとえば、各評価情報の内容も、それぞれの特徴があり、状況に応じて、評価情報を選択することが推奨されている。管理者は被評価者の行動と業績を評価しうるが、行動よりも結果に重点を置くことが多い。自己評価の場合は、実際の行動を評価することに焦点を置くことが多い。同僚の評価は職務の結果と行動の両方の情報を考慮している。顧客の評価は職務遂行の結果変数である。部下の評価は行動に関する評価情報を考慮している。それぞれの評価者には欠点があり、どの評価者が最も良いと決めることは出来ない。評価フォーマットの問題と同じく、人的資源管理に関する研究の一般的な結論は多様な評価者の評価の性質を理解した上で、統合的に利用することが望ましいとしている。評価フォーマットの開発と評価情報の多様化は、多様な評価技法を提供し、実務家の選択の余地を広げているという側面がある一方で、支配的な評価方法を確立することが出来ないという、現在の人事考課の研究のジレンマを示している。評価フォーマットにしても、評価情報にしても、何らかの問題点を矯正する方法を開発すると他の問題点が露呈してしまう。しかし、そもそもドミナントな評価技法は確立するのだろうか。ドミナントな評価技法が成立するということは、その評価技法を使うことによって、被評価者の「真実」の業績が計測することが出来るということである。しかし、これまでに述べてきたように、被評価者の業績は、評価者の共同主観による認識しか提供されていないのである。共同主観による業績はつねに「真実」の業績と乖離する危険性を秘めている。人事考課は人間の認識による以上、評価する人間によって差異が生じる可能性を否定することは出来ないのである。６「客観的」人事考課の非合理性本論文では既存の人的資源管理の議論において、従業員の人事考課をどのように行うべきである

(13)

と考えてきたかを概観した。「客観的」評価は企業内の人的資源管理の目標体系から派生した個別の人事考課目標に合致するような従業員の行動を促すために、図２の図のようなシステムを想定している。まず、職務分析を行って職務内容を決定した後、実際に遂行された作業の検証を行い、人事考課を行う。人事考課情報を職務分析にフィードバックして、再び、同じプロセスを繰り返す。このような繰り返しのプロセスによって、最初の人事考課の目標に近づくようなシステムを構築することを目指しているのである。本論文では特に「客観的」人事考課に関わる理論的なレビューを行った。これまでの人的資源管理の議論では「客観的」人事考課を達成するために、様々な手法が開発された。人事考課の客観化は大きく分けて三つの方法で行われている。一つ目は評価者の主観的な評価を排除する外的基準をもつ評価技法の開発である。二つ目は複数の評価者による客観性（共同主観）の確保である。三つ目は評価者の認知的側面に注目し、評価の誤謬を発見することに分類される。これらの評価技法にドミナントな方法を認めることは出来なかった。これらの評価技法の開発は、人事考課の有効性という基準に基づいて検討されてきた。古くから使われてきた基準は、評価エラーの基準である。この基準は、評価者のエラーを減少させることによって、被評価者の「真実」の業績を把握することができるという仮定の下に、確立された基準である。しかし、近年の実証研究において、評価エラーはその評価の精度と相関がないことが示唆され、徐々に評価の精度そのものを計測する尺度が開発されてきたのである。評価の精度は、「真実」の業績と実際に評価者が判断した評価との差異を尺度としたものである。ところが、評価尺度の基準にも、唯一の大きな問題がある。それは被評価者の真実の業績をどのように仮定するのかという問題である。既存の研究では、人事考課の専門知識を持った評価者を最適な評価条件の下で評価させたものを基準としている。つまり、結局は人事考課の議論で扱われている「真実」の業績とは、被評価者自体を基準としているわけではなく、最適な評価を下すことができる評価者の評価なのである。そこで設定している基準は、なお、現実の評価者自身とは乖離が生じており、評価の精度を計測する基準としては不十分なのである。現実の被評価者の業績を認識する方法に関する議論が極めて不十分であるにも関わらず、人事考課における評価方法の有効性を計測する基準を設定することは、結局は有効性の基準の意味付けを曖昧にすることなのである。曖昧な有効性の基準に基づいて、評価方法の開発と検証が行われているので、支配的な評価基準を確立することも難しいと思われる。人事考課の問題は、心理学が発展し、評価技法がより洗練されれば解決できるという楽観的な展望をもつことは出来ない。企業における人事考課の実践的な要求から、さまざまな試みはなされた

(14)

が、現実の被評価者の業績と能力、そして、職務自体を記述的にとらえることは多くの困難を伴っている。これまでの人的資源管理の議論における人事考課の研究は、評価技法開発を意識した極めて実践的な方向性に傾いていたが、人間が人間を評価するときに直面する問題、現存する人間を客観的にとらえることが可能であるのかという抽象的な問題を考察する必要があるだろう。

注

１ここでは、具体的に、以下の教科書を想定している。これは、いわゆる Human Resource Management という題名で、市販されている典型的な教科書であると考えられる。もちろん、このほかにもいくつかのそれに類する本があり、そちらの方が支配的であるという批判もあり得るかもしれないが、これらの教科書はほぼ同様の視点で、人的資源管理の問題を扱っているので、実務家の世界で、これらが標準的な教科書であるととらえられているとしてもおかしくはない(Bratton, 1994; Feild, 1988; Monday and Noe, 1990; Singer, 1990; Veres Ⅲ, 1996; Werther, 1993)。なお、日本における教科書としては、例えば、楠田 (1981)を参照せよ。２人事考課は、一般に三つの側面が指摘されており、その名称は多様である。名称のみを楠田(1981)に従えば、成績考課と情意考課と能力考課に分けられる。成績考課とは仕事の成果を短期間で評価することであり、情意考課は仕事に対する姿勢や勤務態度を測るものであり、能力考課は従業員の職務遂行能力を対象としている。本稿では、人事考課の三つの側面全てを含めて考える。なお、performance appraisal は、他にも訳語は考えられるが日本における人事考課とほぼ扱いは同じであるので、人事考課の語をあてた。３また、ある被評価者に対する全体的な評価とその下位の評価次元との間にもハロー効果は存在する。全体的な評価の高い被評価者に対しては、個々の次元の評価基準にも高い値を与えてしまうということ、あるいは、突出した評価の次元をもつ被評価者は他の次元で悪い評価があるにも関わらず、過度に全体の評価が高くなるといった現象を指している (Cooper, 1981) 。

４たとえば、forced choice scale や mixed standard scale のようなフォーマットは評価者のエラーが発生することを減少させるために開発されたスケールである (Blum and Naylor, 1968; Blanz and Ghiselli, 1972) 。５評価の精度には四つの評価手法が存在する。 (1) Elevation Measure: 評価者の平均的な評価水準と被評価者の本当のパフォーマンスレベルの平均のあいだの差異に基づいた精度の尺度である。 (2) Differential elevation: 評価者毎の被評価者のパフォーマンスレベルの平均による精度を反映する。この方法は評価者の全体の評価傾向をコントロールして被評価者毎の差異の精度を示す。 (3) Stereotype accuracy: 被評価者の評価平均ではなく、次元の評価平均に焦点を当てていることを除けば、 Differential elevation とおなじである。 (4) Differential accuracy: 評価者の被評価者と次元平均評価レベルだけでなく、評価者の全体の評価の傾向を数学的に除去する。６職務分析で収集される情報のタイプは大きく分けて７つある (McCormick, 1976) 。一つ目は作業活動である。作業の活動内容とプロセス、使われる手順、そして、必要とされる責任がこの部類に入る。二つ目

(15)

は労働者に焦点を当てた活動である。職務に関する行為とコミュニケーションのような人間の行動に関する情報がこの情報に入る。三つ目は、使われる機械や道具に関する情報である。四つ目は職務に関連する知識とインプット、アウトプットに関する情報である。そして、五つ目は作業の業績に関する情報である。この中には、エラーの分析と作業標準、タスクに要する時間等が含まれている。六つ目は職務のコンテクストに関する情報で、労働条件や組織的、社会的コンテクストに関する情報である。最後に、職務に必要な要件である。この情報には、パーソナリティと教育・訓練、作業経験に関する情報が含まれている。７例えば、アメリカの労働省が確立した方法として、職務分析表 (job analysis schedule) や、職務分析表を

拡張した機能的職務分析、そして、質問票調査の手法として、地位分析質問票 (position analysis questionnaire) と管理職務記述質問票 (management position description questionnaire) 等の手法が散在している。

８７つの評価フォーマットは次の通りである。

① 記述法 (Narrative Essay) 被評価者の業績を短い文章で描写する方法で、構造化されていないので、どのような状況にも提供可能であるが、被評価者間の評価が出来ない。

② 相対比較法、人物比較法 (Personnel Comparison Method) 被評価者同士を直接比較し、順位づけをする方法である。寛大効果の防止に役立つが、小さな集団内の比較しか出来ず、評価者の違う集団間の比較は不可能である。

③ 図式評定尺度法 (Graphic Rating Scale) 各評価要素の記述に関して、５段階から９段階の尺度で、その程度をチェックする方法である。スケールの記述によって様々な情報が得られるため、この評価方法から、様々な技法が発展した。

④ 段階択一法(Behavirally Anchored Rating Scales) 図式評定尺度法は、スケールの記述が曖昧であったため、評価スケールの各所に、その評価に該当する行動の記述を追加したものが段階択一法である。

⑤ プロブスト法(Mixed Standard Scale) 一つの評価要素を表す複数の単文を用意し、他の評価要素を表す単文とランダムに並べ替えて、評価者に評価させる方法である。

⑥ 強制択一法 (forced-Choice Rating Scales) 評価者は一つの評価要素にかんする複数の行動の記述のなかでどれが最も典型的な被評価者の行動であるかを選択する。

⑦ 分布制限法 (Performance Dstribution Assessment) 考課集団ごとに、評価の分布を限定する方法である。集団内の被評価者を相対的に評価する典型的な方法である。

なお、それぞれの訳語に関しては、楠田 (1981) を参考にした。

参考文献

Blanz, F. and E. E. Ghiselli (1972), "The mixed Scale: A new Rating System," Personnel Psychology, 25 : pp. 185-199. Becker, Brian E. and Robert L. Cardy (1986), "Influence of Halo Error on Appraisal Effectiveness: A Conceptual and

Empirical Reconsideration," Journal of Applied Psychology, 71 (４) : pp. 662-671.

Bernardin, H. J. and R.W. Beatty (1984), Performance appraisal: Assessing Human Behavior at work, Boston: Kent Publishing.

Bernardin, H. J. and M. R. Buckley (1981), "Strategies in Rater Training," Academy of Management Review, ６ : pp. 205-212.

(16)

the art?," Personnel Administrator, 30 (November) : pp. 79-86.

Bernardin, H. John and Earl C. Pence (1980), "Effects of Rater Training: Creating New Response Sets and Decreasing Accuracy," Journal of Applied Psychology, 65 (１) : pp. 60-66.

Bernardin, H. J. and C. S. Walter (1977), "Effects of Rater Training and Diary Keeping on Psychometric error in Ratings," Journal of Applied Psychology, 62 : pp. 64-69.

Blum, M.L. and J. C. Naylor (1968), Industrial Psychology, New York: Harper & Row.

Borman, W. C. (1977), "Consistency of Rating Accuracy and Rating Error in the Judgment of Human Performance," Organizaitonal Behavior and Human Performance, 20 : pp. 238-252.

Bratton, John and Jeffrey Gold (1994), Human Resource Management: Theory and Practice, London: Macmillan. Cardy, Robert L. and Gregory H. Dobbins (1994), Performance Appraisal: Alternative Perspectives, Cincinnati, Ohio:

South-Western Publishing.

Cooper, William H. (1981), "Ubiquitous Halo," Psychological Bulletin, 90 (２) : pp. 218-244.

Cronbach, L. J. (1955), "Processes Affecting Scores on Understanding of Others and Assumed Similarity," Psychological Bulletin, 52 : pp. 177-193.

DeNisi, A. S., T. P. Cafferty and B. M. Meglino (1984), "A Cognitive View of the Performance Appraisal Process: A Model and Research Propositons," Organizational Behavior and Human Performance, 33 : pp. 360-396.

DeVries, D. L., A. M. Morrison, S. L. Shullman and M. L. Gerlach (1986), Performance Appraisal on the Line, Greensboro, NC: Center for Creative Leadership.

Feild, Hubert S. and Robert D. Gatewood (1988), "Matching Talent with the Task" in Ferris, Gerald R. and Kendrith Rowland ed., Human Resource Management, Boston: Allyn and Bacon, Inc., pp. 69-76.

Feldman, J. M. (1981), "Beyond Attribution Theory: Cognitive Processes in Performance Appraisal," Journal of Applied Psychology, 66 : pp. 127-148.

Feldman, J. M. (1986), "Instrumentation and training for performance appraisal: A perceptual cognitive viewpoint" in Ferris, G. R. and K. M. Rowland ed., Research in Personnel and Human Resources Management, vol.４, Greenwich: JAI Press.

Greenberg, J. (1987), "Reactions to Procedural Injustice in Payment Allocations: Do the Ends Justify the Means?," Journal of Applied Psychology, 72 : pp. 55-61.

Landy, Frank J. and James L. Farr (1980), "Performance Rating," Psychological Bulletin, 87 (１) : pp. 72-107.

Murphy, Kevin R. and William K. Balzer (1989), "Rater Errors and Rating Accuracy," Journal of Applied Psychology, 74 (４) : pp. 619-624.

Monday, R. Wayne and Robert M. Noe (1990), Human Resource Management (fourth ed.), Boston: Allyn nad Bacon. Murphy, Kevin R. and Jeanette N. Cleaveland (1995), Understanding Performance Appraisal, Thousand Oaks: Sage

Publications.

Singer, Marc G. (1990), Human Resource Management, Boston: PWS-KENT Publishing Company.

Veres Ⅲ, John G., Toni S. Locklear, Ronald R. Sims and Amelia J. Prewett (1996), "Job Analysis in Human Resource Management Practice" in Ferris, Gerald R. and M. Ronald Buckley ed., Human Resources Management, Englewood Cliffs, N. J.: Prentice-Hall Inc., pp. 122-154.

(17)

McGrw-Hill.

楠田丘 (1981), 『人事考課の手引』日本経済新聞社。

寺畑正英 (1999), 「人的資源管理論の客観的評価と昇進システム」『一橋論叢』第121巻第５号, 702-719頁。

<論文>人事考課における客観的評価の陥穽 利用統計を見る

著者

寺畑 正英