20131031Fuji1

Rによる気象データ解析 6


散布図と相関係数

 前回は、Rに読み込んだデータフレームの各変数のデータをグラフにプロットする方法について学んだ。

 今回は、二つの変数の散布図を描き、それらの変数の相関係数を計算する。データーは、やはり東京の2013年8月の日々の平均気温、最高気温、最低気温を用いる。

前回同様、Rのコンソールに

Tokyo.Temp<-read.table("t:\\R\\Book1.prn", header=T)

と打ち込み、続いて、

attach(Tokyo.Temp)

と打ち込む。

 ここでX軸に最低気温を、Y軸に最高気温を取ることで、最高気温と最低気温の関係を示す散布図を描いてみよう。

plot(Min.,Max.)

と指定するだけで、以下のような散布図が描かれる。

Plot09.jpg"

 最高気温が最大の日に最低気温も最大となっていることが見て取れる。その日は2013年8月12日だった。 平均気温と最高気温との相関を示す散布図を描くには、

plot(Ave.,Max.)

と指定すればよく、以下の散布図が描かれる。

Plot10.jpg"

 平均気温と最低気温との相関を示す散布図を描くには、

plot(Ave.,Min.)

と指定すればよく、以下の散布図が描かれる。

Plot11.jpg"

 3枚の散布図を見れば、いずれも相関関係が高いことがわかる。ただ、相関関係の大きさを客観的に示すには相関係数を計算しなければならない。Rでは、きわめて容易に相関係数が計算できる。そのコマンドはcorである。平均気温と最高気温との相関係数を計算するには、

cor(Ave.,Max.)

と指示すればよく、結果は以下の通りである。

[1] 0.9427207

cor(Ave.,Min.)

によって、平均気温と最低気温との間の相関係数が計算され、その結果は、

[1] 0.9361319

最高気温と最低気温の間の相関係数は、

cor(Max.,Min.)

で計算され、その結果は、

[1] 0.8106936

である。したがって、平均気温と最高気温との間の相関関係が一番高く、平均気温と最低気温との間の相関関係は、これより若干低いだけだが、最高気温と最低気温との間の相関関係は、これらより一段低いことがわかる。

 相関係数は、このように2系列のデータを指定することによって計算できるが、データフレームを指定することで、データフレーム内の各変数の間の相関行列が計算できる。すなわちRコンソールで、

cor(Tokyo.Temp)

と打ち込むと、

    Ave.    Max.   Min.
Ave. 1.0000000 0.9427207 0.9361319
Max. 0.9427207 1.0000000 0.8106936
Min. 0.9361319 0.8106936 1.0000000


のように相関行列が計算される。

 今回は、散布図を描き、二つの変数の間の相関係数の計算、複数の変数行列から相関行列の計算法を学んだ。 (2013.11.1)
 



ホームに戻る << 1 2 3 4 5 6 7 8 9 10 11 12 13 14 >>