anovakunを使ってみる(1元配置の分散分析)

続いてanovakunを実際に使ってみようと思います。

とりあえずは一元配置の分散分析ということで前回の続きデータを使ってみます。

っと思ったら前回のデータは1要因2水準だからt検定とおなじじゃん。。。
だけどまあいっか。。


まずは、井関先生のページに行ってanovakunをゲットする。
http://www11.atpages.jp/~riseki/pukiwikiplus/index.php?ANOVA%B7%AF

ダウンロードしたテキストファイルをRのディレクトリに入れておきます。

こんな感じになっていれば大丈夫。



続いて、edit→sourceといくとダイアルログが出てくるので、さきほどのテキストファイルを選択します。

すると。。

??なんじゃそら??
以下にエラー make.names(col.names, unique = TRUE) :
1 は不正なマルチバイト文字です

よく井関先生のページを見てみると、どうやらMacの場合には文字コードを変更しておく必要があるみたい。確かに、Rstudioで開いても明らかに変だもんね。。


その後もいろいろと四苦八苦したんだけど、RstudioのEdit →source からはなんかうまくできない(たぶんやり方が間違っているだと思うのでだれか知ってたら教えて)。

仕方がないので明示しました。
source("/Users/☆/Dropbox/R/anovakun_420.txt")
※ ☆はユーザー名、別に隠さなくてもいいけど。。

見てみるとWorkspaceのところになんかそれっぽいものが入ってるのが分かります。
イイネ! ここの警告は無視して大丈夫。

ふう。


さていよいよ分散分析を開始。

anovakunの使い方は井関先生のページを見るとほとんどの人は分かるとは思うんですが、僕は結構苦労したのでメモしておきます。


anovakunの使い方は
anovakun(データ, "要因計画の型", 各要因の水準数,...)
という形です。

僕が苦労したのは要因計画の型という部分。
ページの説明では、
「要因計画「分析したい計画の型を入力します。「A」〜「Z」を各要因を表すラベル,「s」を被験者のラベルとします。被験者間要因は「s」の左側,被験者内要因は 「s」の右側に配置します。この表記法にしたがえば,例えば,2要因の被験者間計画は「ABs」,3要因の被験者内計画は「sABC」,2つの被験者間要 因と1つの被験者内要因を持つ混合要因計画は「ABsC」と表せます。なお,要因計画の型は「""」で囲む形で入力する必要があります。

となっています。

ここで書いてあるABsCというのは、A要因、B要因、C要因まで使えてそれぞれ被験者内計画、被験者間計画で使い分けるという意味だそうです。

今までのRの使い方だと、ここのABの部分に自分でつけた変数を入れていたのだけどanovakunの場合はこのまま使います。

今回のケースだと、職種の1要因なのでA、そして被験者間要因なのでsの左側に配置。

anovakun(anova1,"As",2)

こんな感じです。
僕は最初は、anovakun(anova1,"sexs"みたいな感じで実際の変数名を入れようとしてドツボにはまりました。

ではとりあえず入れてみます。


こんな感じで結果が算出されました。
赤線の所を見るとa1、a2 と出てきているのが分かります。僕の場合はここのnの数を調べて確認しました。
a1は、Dr、a2は、Nsということです。

ふう今回はnsだったので職種の主効果はなし。

!!
というか、一元配置の分散分析で2水準って普通にt検定じゃん。。。
ダミーデータの作り方がおかしかった。。

せっかくなので、t検定してp値の確認してみました。

t.test(anova1$mscore~anova1$job,var.equal=TRUE)


うん(たぶん)合ってると思う。基本的にまだ分かってないんだけどt値とF値は違ってもいいだよね。。。このブログを信用してはだめですよ〜。

気を取り直して、次回は被験者間、2要因3水準の分散分析にチャレンジしてみます。