第5回 エクセルでできる!ピープルアナリティクス超基本編④

2019.07.08 
1,094
第5回 エクセルでできる!ピープルアナリティクス超基本編④

みなさんこんにちは。このコラムでは「健康経営」というキーワードを中心に、人事関連の様々なトピックについて考えていきます。

この第5回シリーズでは、人事ご担当者さまからのご要望が多かった「ピープルアナリティクス」の超基本編をお届けしています。

第5回 エクセルでできる! ピープルアナリティクス超基本編①
第5回 エクセルでできる! ピープルアナリティクス超基本編②
5回 エクセルでできる! ピープルアナリティクス超基本編③

今回のテーマは「重回帰分析」です。

突然ですが、皆さんの日々のお仕事へのモチベーションに影響を与える要因は何でしょうか。

これは個人によって千差万別だと思います。
僕の場合、パッと思いつく限りだと「給料の額」「通勤時間」「仕事の難易度」「天気」「職場の人間関係」「PCの処理速度」など、程度の差はあれども大きなものから小さなものまでかなりの数を挙げることができます。

今、「程度の差はあれども」と書きましたが、この「程度」がどの程度か分かると面白くないですか?
例えば、「『通勤時間』よりも『給料の額』の方がモチベーションに影響する」ことが分かったり、「『給料の額』が1円増えると、モチベーションが0.5ポイント上がる」といったことが分かったりします。
重回帰分析は、まさにこの「程度」を明らかにしてくれる統計的分析手法です。

前回お話しした相関分析と似ていますよね。
確かに相関分析と重回帰分析は、いわば親戚のような関係性だと言えると思います。
そして、どこが違うかというと、大きく次の2点です。

第一に、相関分析は基本的に1対1の関連性を分析するものですが、重回帰分析は1対複数の関連性を同時に分析することができます。
先ほどのモチベーションに限らず、ビジネスの世界で起こっているほとんどのことには様々な要素が関連していますので、これらを同時に分析することは理にかなっていると言えると思います。

第二に、それぞれの分析で算出される係数の意味合いが異なります。
相関分析においては、算出される相関係数は、2つの項目の「連動の程度」を表す数値です。
相関係数が大きいほど2つの項目の連動が大きく、-1~+1の範囲で表現されるものでした。
一方、重回帰分析において算出される偏回帰係数は、「影響の程度」を表す数値です。
例えば、項目xと項目yがあるとして、xが1円増加するとyが0.5円増加する、といった関係性を明らかにすることができます。従いまして、係数の値の範囲が決まっている相関係数とは違い、様々な数値と単位を取ることになります。

相関分析と重回帰分析の違いを「モチベーション」と「給料の額」の例で表すと、モチベーションと「給料の額」がどのくらい連動して変化するかの「程度」を分析するのが相関分析で、「『給料の額』が1円上がるとモチベーションが0.4上昇するが、『通勤時間』が1分増加するとモチベーションが0.2下降する」といった複数項目の「影響度」を同時に分析するのが重回帰分析です。

この重回帰分析、基本的なものであれば実はエクセルでも可能です。
さらに突っ込んだ内容は別途勉強していただくとして、今回はとにかく、エクセルでできる範囲でまず考えてみましょう。

データはこれまでと同様、5段階の業績評価と12項目の社会人基礎力を使っていきます。
12項目の社会人基礎力が1ポイント増えると、業績がどのように増減するかを見る分析です。
サンプルデータのダウンロードはこちら

平均の差の分析や相関分析と同様、エクセルで「データ」→「データ分析」と辿っていくと、下の方に「回帰分析」というツールがありますので、これを選択してください。ダブルクリックでも、選択して「OK」ボタンをクリックでも、どちらでも大丈夫です。

そうすると、次のようなボックスが出てきます。

ここで、「入力Y範囲」には影響を受ける項目、すなわち「業績評価」のセルを範囲指定します。
そして、「入力X範囲」には影響を与える項目、すなわち社会人基礎力の12項目を全て指定します。

「ラベル」にチェックを入れると、行1の項目名(「業績評価」や「主体性」など)を含めて結果表示してくれます。そのほかの設定はノータッチで大丈夫です。

ちなみに、項目に文字列やブランクが混ざっているとエラーが出ます。
統計分析ソフトウェアだとこれらを判別して自動的に除外してくれるのですが、僕が確認した限りだとエクセルはその機能を持ちません。
従いまして、分析前のデータ整備の段階でこれらの項目は事前に除外しておく必要があります。

このような文字列や空白があると、当該項目、あるいは当該サンプルを丸ごと削除する必要があるため、あまり数が多いようだと分析に少なからず影響を与える可能性があります。そのため、可能な限りデータはきっちり収集した方が良いと思います。

さて、範囲選択をして「OK」ボタンをクリックすると、結果が新しいシートに表示されます。

初期表示だとこうなります。このままでは見にくいので、少し手を加えます。具体的にはセルの幅を広げつつ、各数値の小数点以下を2ケタに変更した上で、「下限95%」「上限95%」の欄を全削除します。

さて分析の開始です。今回のデータも、RAND関数を用いてランダムに数値を割り当ててあります。従いまして、意味のある結果は出ないようになっておりますし、仮に意味のある結果が出ても、それは偶然であることをあらかじめお断りしておきます。

ここで見るべき数値は「補正R2」「有意F」「係数」「P-値」の4つです。順に説明していきます。

◇「補正R2」
今回分析に採用した「影響を与える項目(社会人基礎力12項目)」が、業績評価の動きをどの程度説明しているかを表します。「1.00(=100%)」が最高値です。
例えばこの数値が「0.55」であった場合、「今回分析に使用した影響を与える項目群は、業績評価の動きに影響を与える全項目の55%を占めている」と判断されます。今回の数値は「-0.09」ですので、残念ながら説明できているレベルとは言えないでしょう。

◇「有意F」
分析に活用したモデルが、モデルとしてきちんと成立しているかを確認する数値です。「0.05」未満であればモデル成立とみなすことができます。
今回の分析で表現すると、「業績評価に対して社会人基礎力の各項目がどの程度影響を与えるか」のモデルが成立しているかですが、数値が「0.77」ということで、こちらも残念ながらモデルとしては不成立と言えます。

業績に影響を与える項目は人事的な要素以外にも無数にあるため、補正R2はどうしても小さくなりがちです。どの程度の数値を是とするかはアナログ的な判断に委ねられます。一方で分析モデルが成立しているかどうかを判断する「有意F」が0.05未満の場合は少々深刻で、最初から分析をする項目を見直す必要があると言えます。

◇「係数」
各項目が業績評価に与える影響度です。
例えば「働きかけ力」は係数が「0.10」ですが、これは「働きかけ力」が1点上昇すると、業績評価が0.1上がることを表しています。これはマイナスに影響する場合もあり得ます。
例えば、「課題発見力」の係数は「-0.13」です。この場合、課題発見力が1点上昇すると、業績評価は0.13下がるということになります。

◇「P-値」
影響を与える各項目を、本当に影響を与える項目として採用して良いか否かを判断する指標です。0.05未満であれば採用してOKとなります。今回の分析では残念ながら採用できる項目はありませんでした。

分析におけるハードルは「有意F」と「P-値」の2つです。
まず、有意Fが0.05以上だとそもそもモデルとして採用できません。
そして、有意Fが0.05未満だったとしても「P-値」が0.05以上の項目は除外になります。この2つのハードルを乗り越えた項目だけが、今回でいえば「業績評価に影響を与える項目」として採用されることになります。

今回は超基本編ということで、このあたりで終わりにしたいと思いますが、本来であればまだ留意すべき論点がたくさんあります。例えば、同じような項目を同時に分析すると、正確な分析ができない可能性があります(「多重共線性」といいます)が、これはエクセルでは別の関数で算出する必要があります。

また、影響を見たい項目(今回だと「業績評価」)が5段階や2段階などのように上限と下限がある場合は、エクセルの回帰分析では本来は正確な分析ができません。僕の感覚で言うと、「有意F」や「P-値」の判断はエクセルでもそんなに違わないのですが、「係数」は大きく違って算出されます。従いまして、「どの項目が影響を与えるか」ならびに「その影響はプラスかマイナスか」については判別できますが、影響度についての正確な予測には限界があると考えています。

一方で、データ整備のやり方によっては、より応用的な分析もエクセルで可能です。例えば「性別」や「ハイパフォーマーとそれ以外」のように、「AとBのどちらか」で表現できる項目は、片方を「1」、もう片方を「0」と置くことで、分析の項目として扱うができます(「ダミー変数」といいます)。

また、影響を与える項目を掛け合わせて作った新たな項目データを使い、それらの項目が相互にどのような影響を与えているかを分析することも可能です(「交互作用項」といいます)。

これらについての説明はまた別の機会に譲りたいと思います。
とにかく、どんなデータでも良いのでまずは実際に手を動かしていただくことをお勧めします。触っているうちに、実はそれほど難しくないことが分かってくると思います。そのあとで、いろいろなウェブサイトや書籍を参考に、知識を深めていっていただければと思います。

さて、次回はピープルアナリティクス超入門編の最終回です。データを取り扱う際に気をつけるべきことをいくつか述べたいと思います。

それではまた次回!※本コラムは執筆者個人の考えに基づく論考であり、特定の企業や団体の意向を代表するものではありません。また、本文中に提示されている講演内容の紹介は、すべて執筆者の解釈に基づいています。

新改敬英 (Takahide SHINKAI)
慶應義塾大学大学院経営管理研究科 大学研究員

大手国際会計事務所等にて会計監査・M&Aアドバイザリーに従事したのち、
外資系メーカーおよび国内系医療・介護グループを経て研究者に転身。
民間企業在籍中は一貫して経営企画業務に従事し、
経営戦略立案、組織マネジメントから財務分析、人材採用までオールラウンドに手掛ける。
現在は九州大学大学院の博士課程に在籍し、会計学・組織マネジメントについて研究する傍ら、
慶應義塾大学大学院経営管理研究科(慶應ビジネススクール)の研究員として、
企業との共同研究・アドバイザリーに従事。(2019年3月現在)

参考リンク

関連記事

close
資料ダウンロード 健康経営に関する意識調査レポート 2018-2019 「働きがい」の源泉とは何か? 無料 資料ダウンロードする