こんにちは!今日は相関分析についてまとめます。

実はもともと仕事の関係で心理統計を作りたくて、そのための統計の勉強だったのですが分散と標準偏差あたりの概念がわかってきたので、そっちにドライブをきっていきます。少しずつ、わかる楽しみが統計には有りますね。

ちょっとスピード重視で書くため、おそらく後日付け足す感じになりますので、ご容赦ください。

例えばよくありそうな例でいくと、「身長が高い人は体重も重い」「大学以前に出会ったカップルは離婚しにくい」「田舎出身の人は離職しにくい」など2つの変数の関連を統計的に調べる方法として「相関分析」というものがあります。

例えば以下のケース

これは1ヶ月の化粧品にかける費用とその人の年収をグラフ化してみた。

これをみると、まさに「年収が高い人は、化粧品にもお金をかけている」という傾向が見て取れます。つまりこの2つは、統計的に言うと「正の相関がある」という状態だと言える

p4_3_2_5_pic2.jpg

※引用:総務省統計局

これを手計算でするのは流石に大変なのでエクセル使います。先程のケースで言うと

=CORREL(変量1,変量2)を入れます。すると相関係数は約0.93と出てきます。ちなみにこれが負の相関であれば約−1、無相関であれば0、正ならば約1ですが、「○○以上ならば、2変数は関連している」といえるような統計学的な基準はないとのことです。目安で

1.0〜0.9 → 非常に強く関連している

0.9〜0.7 →やや強く関連している

0.7〜0.5 →やや弱く関連している

0.5未満  →関連していない

といえます。

1つだけ注意で、相関係数はあくまでも「直線的な関連が見受けられるかどうか」を明らかにする指標です。なのでもし、以下のようなグラフになった場合、明らかに2変数には相関があるように見て取れますが、係数上は0となってしまうのでグラフ目視のほうが良いです。

p4_3_2_5_pic4.jpg

 

それでは今日はここで。だいぶ統計っぽくなりましたがまだまだ学ぶこと多し。

どろん。

 

 

 

統計ことはじめ ④ 相関分析” への2件のフィードバック

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中