スプレッドシートで単回帰分析をする方法

対象データ

とある駅の1K,1Rで賃貸物件を検索して出てきた50件の賃貸のデータ

  • 築年数
  • 徒歩
  • 広さ
  • 家賃
築年数(年)徒歩(分)広さ(㎡)家賃(円)
22524.6366000
5531.2680000
2102070000
01021.6365000
14819.5169000
31221.1166000
4817.3265000
10825.875000
9422.6869500
121028.1379500
31326.9969000
10921.965000
10919.8767000
91125.3466000
9720.8161000
9622.6869500
5521.7374000
12922.3570000
121323.7274000
41320.3862000
111526.6769000
121225.7880500
3525.0186000
3627.7586000
221018.364000
111719.8768000
101829.8474500
111820.8168500
92026.0868500
22142663000
101930.4359500
22227.8474000
151824.7955000
62527.971500
271123.7752000
172525.6360000
301418.8540000
30181541000
332115.8437000
3924.4671000
31928.9866000
01019.1865000
13518.1364000
111028.1379500
2916.3860000
151028.572000
111030.576000
12818.3760000
51420.1465000
19630.2575000

やること

  1. 築年数を説明変数、家賃を目的変数として単回帰分析
  2. 駅徒歩分を説明変数、家賃を目的変数として単回帰分析
  3. 部屋の広さを説明変数、家賃を目的変数として単回帰分析
  4. 築年数、駅徒歩分、部屋の広さを説明変数、家賃を目的変数として重回帰分析(次回)

やり方

築年数を説明変数、家賃を目的変数として単回帰分析をやってみます。スプレッドシートだととても簡単に出来てしまいます。

ステップ1〜 散布図の作成

まず、表から説明変数の列と目的変数の列を選択します。それから、挿入をクリックしグラフをクリックします。

すると以下のようなグラフが作成されます。

散布図になっていない場合は右のグラフエディタから散布図を選択します。

ステップ2〜 単回帰分析のグラフの表示

グラフエディタのカスタマイズタブから系列をクリックし、トレンドラインのチェックボックスにチェックを入れるとグラフが表示されます。

ステップ3〜 グラフの決定係数を表示

引き続き、グラフエディタのカスタマイズ、系列からラベルのプルダウンメニューを方程式を使用にして、決定係数を表示するにチェックを入れます。

左側の方程式が単回帰分析の式で右側が決定係数の値です。決定係数とはこの単回帰分析がどの位の精度かを測る指標になり、1に近いほど精度が高く、0に近いほど精度が低いという意味になります。

今回の単回帰分析では0.372なのであまり精度が良くないということがわかります。ざっくり0.5は超えたいところですね。

考察

同様に駅徒歩分、部屋の広さを説明変数として単回帰分析をしてみました。

築年数が一番精度が高い(相関関係が強い)という結果になりました。

コメント

タイトルとURLをコピーしました