引き続き前々回から用いているサンプルデータと資料を使い、Model 3とModel 4を行いました。
ここまでで、これまで使ってきた学生(Level 1)と学校(Level 2)という二つのレベルのある、hsb12のデータを用いる解析はおしまいです。
次回からは、縦断データを用いて成長曲線モデル(growth model)に取りかかりたいと思います。
次回は縦断データの構造を知り、どんな風に解析するかを(一人一台ずつで解析するのではなく)土屋さんと米倉さんに画面を見せてもらいながら進めます。
エビ研でMultilevel model (Mixed model) に取り組み始めたときは、私自身はこれを使った解析をしたこともなく、正直なところ、???がいっぱいでしたが、すてきな参加者の皆様のおかげで、どういうものかは(ちょっと)わかってきた気がします。少なくとも論文に書いてあることはわかるようになった気がします(たぶん。)。
というわけで、なんだか難しそう!と一瞬思った方も、臆することなくいらしてください。
次回の日程のご連絡です。
Mixed Modelを知りたい人、縦断データを解析する予定の人、
どのような方もどうぞいらしてください。
日 時:2010年1月21日(木)17:00~18:30
テーマ:縦断データ-成長曲線モデル初級編(1)
場 所:医学部3号館 3階S308
さらに!次回エビ研終了後に新年会を兼ねた懇親会を予定しています。
懇親会だけの出席も歓迎です!ぜひぜひいらしてくださいませ。
2009/12/17に行ったこと:
サンプルデータと資料は前々回と同じです。
1. Model 3: Conditional Model - Centered Level 1 Predictor (Student)(資料p7)
シンタックスは下記。
MIXED mathach WITH cses
/METHOD = REML
/PRINT = SOLUTION TESTCOV
/FIXED = cses | SSTYPE(3)
/RANDOM = INTERCEPT cses | SUBJECT(school) COVTYPE(UN).
ここでは、学生のsocioeconomic statusから学校ごとの平均値(meanses)を引いた値(cses = ses - meanses)が固定効果とランダム効果として投入されています。
この分析を行って固定効果の推定を見ると、csesが0の時の数学の成績(mathach)が12.65であることがわかり、さらに、学生個人のsesが1高くなると、数学の成績が2.19上昇することがわかります。
さらに共変量のパラメータ推定値を見ると、Intercept + CSES [subject = SCHOOL] = UN(1,1)、UN(2,1)、UN(2,2)とあり、それぞれ推定値が8.68, 0.05, 0.69と出力されています。
これはInterceptとcsesの分散共分散行列と考えれば良いとのことで、イメージとしては↓こんな感じでしょうか。
Intercept (1) | cses (2) | |
Intercept (1) | 8.68 | 0.05 |
cses (2) | 0.05 | 0.69 |
つまり、UN(1,1)は切片、UN(2,2)は傾き、UN(2,1)は切片と傾きの共分散ってことだと思います(かなりあやしい。違ってたらご指摘ください。)
で、ここからは、学校間でどれくらい切片と傾きが異なるかということを読み取ります。ここで読み取れることは、学校の平均の数学の成績は、学生のSocioeconomic statusで統制した後も学校間で有意に異なっている。学生のsocioeconomic status(cses)と成績の関係(傾き)は学校により異なっている。平均の数学の成績の高いところほど傾きが大きくなる(小さくなる)というような関係は見られない。ということです。
2. Model 4: Conditional Model - Centered Level 1 and Level 2 Predictorsを実施。(資料p.8)
シンタックスは下記。
MIXED mathach BY sector WITH meanses cses
/METHOD = REML
/PRINT = SOLUTION TESTCOV
/FIXED = meanses sector cses meanses*cses sector:cses | SSTYPE(3)
/RANDOM = INTERCEPT cses | SUBJECT(school) COVTYPE(UN).
ここで、カテゴリカルデータであるsector(公立かカソリックか)と、交互作用項が登場してきます。
meansesとcsesの交互作用が有意であったことから、その学校に通っている学生の社会経済的地位(ses)の平均(meanses=学校の平均ses)により、個々人のsesと数学の成績の高さの関係の度合いは異なり、この結果からは、通っている学生のsesの平均(meanses)が高い学校ほど、個々人のsesの高さが数学の成績の高さを説明する度合いが高い、ということです。
とは言え、共変量の推定値を見ると、傾きのばらつきは0.10ととても小さく、この傾きが学校間で異なるものとして考慮することは「役に立たない。」、切片だけは学校間で異なるとすることが適切であろう、と資料にはありました。
こういったことをSPSS等の出力結果から一人でちゃちゃっと読み取れるようになりたいものです。。。
そうそう、それから、シンタックス2行目でMETHODとして指定するREMLですが、これは、推定の方法とのことで、REMLとMLの2種類があり、REMLがMLに比べて良い点については、Multilevel analysis for applied researchに書いてある模様。
次回は縦断データです。
ご関心のある方は次回も是非いらしてください! (文責:宮本有紀)