散布図と相関係数
前回は、Rに読み込んだデータフレームの各変数のデータをグラフにプロットする方法について学んだ。 Tokyo.Temp<-read.table("t:\\R\\Book1.prn", header=T) と打ち込み、続いて、 attach(Tokyo.Temp) と打ち込む。
ここでX軸に最低気温を、Y軸に最高気温を取ることで、最高気温と最低気温の関係を示す散布図を描いてみよう。 最高気温が最大の日に最低気温も最大となっていることが見て取れる。その日は2013年8月12日だった。 平均気温と最高気温との相関を示す散布図を描くには、 plot(Ave.,Max.) と指定すればよく、以下の散布図が描かれる。 平均気温と最低気温との相関を示す散布図を描くには、 plot(Ave.,Min.) と指定すればよく、以下の散布図が描かれる。
3枚の散布図を見れば、いずれも相関関係が高いことがわかる。ただ、相関関係の大きさを客観的に示すには相関係数を計算しなければならない。Rでは、きわめて容易に相関係数が計算できる。そのコマンドはcorである。平均気温と最高気温との相関係数を計算するには、 Ave. 1.0000000 0.9427207 0.9361319 Max. 0.9427207 1.0000000 0.8106936 Min. 0.9361319 0.8106936 1.0000000 のように相関行列が計算される。
今回は、散布図を描き、二つの変数の間の相関係数の計算、複数の変数行列から相関行列の計算法を学んだ。
(2013.11.1) |