エビ研: 12月 2009

2009/12/18

次（2010/1/21）は成長曲線モデル

先日（2009/12/17）のエビ研は、Mixed Model初級編(5)ということで、SPSSを用いたデータ解析を続けています。

引き続き前々回から用いているサンプルデータと資料を使い、Model 3とModel 4を行いました。
ここまでで、これまで使ってきた学生(Level 1)と学校(Level 2)という二つのレベルのある、hsb12のデータを用いる解析はおしまいです。

次回からは、縦断データを用いて成長曲線モデル(growth model)に取りかかりたいと思います。
次回は縦断データの構造を知り、どんな風に解析するかを（一人一台ずつで解析するのではなく）土屋さんと米倉さんに画面を見せてもらいながら進めます。

エビ研でMultilevel model (Mixed model) に取り組み始めたときは、私自身はこれを使った解析をしたこともなく、正直なところ、？？？がいっぱいでしたが、すてきな参加者の皆様のおかげで、どういうものかは（ちょっと）わかってきた気がします。少なくとも論文に書いてあることはわかるようになった気がします（たぶん。）。
というわけで、なんだか難しそう！と一瞬思った方も、臆することなくいらしてください。

次回の日程のご連絡です。
Mixed Modelを知りたい人、縦断データを解析する予定の人、
どのような方もどうぞいらしてください。
日　時：2010年1月21日（木）17:00～18:30
テーマ：縦断データ－成長曲線モデル初級編（1）
場　所：医学部３号館　3階S308
さらに!次回エビ研終了後に新年会を兼ねた懇親会を予定しています。

懇親会だけの出席も歓迎です！ぜひぜひいらしてくださいませ。

2009/12/17に行ったこと：
サンプルデータと資料は前々回と同じです。

1. Model 3: Conditional Model - Centered Level 1 Predictor (Student)(資料p7）
シンタックスは下記。
MIXED mathach WITH cses
/METHOD = REML
/PRINT = SOLUTION TESTCOV
/FIXED = cses | SSTYPE(3)
/RANDOM = INTERCEPT cses | SUBJECT(school) COVTYPE(UN).

ここでは、学生のsocioeconomic statusから学校ごとの平均値(meanses)を引いた値（cses = ses - meanses)が固定効果とランダム効果として投入されています。

この分析を行って固定効果の推定を見ると、csesが0の時の数学の成績（mathach）が12.65であることがわかり、さらに、学生個人のsesが1高くなると、数学の成績が2.19上昇することがわかります。

さらに共変量のパラメータ推定値を見ると、Intercept + CSES [subject = SCHOOL] = UN(1,1)、UN(2,1)、UN(2,2)とあり、それぞれ推定値が8.68, 0.05, 0.69と出力されています。

これはInterceptとcsesの分散共分散行列と考えれば良いとのことで、イメージとしては↓こんな感じでしょうか。

	Intercept (1)	cses (2)
Intercept (1)	8.68	0.05
cses (2)	0.05	0.69

つまり、UN(1,1)は切片、UN(2,2)は傾き、UN(2,1)は切片と傾きの共分散ってことだと思います（かなりあやしい。違ってたらご指摘ください。）

で、ここからは、学校間でどれくらい切片と傾きが異なるかということを読み取ります。ここで読み取れることは、学校の平均の数学の成績は、学生のSocioeconomic statusで統制した後も学校間で有意に異なっている。学生のsocioeconomic status(cses)と成績の関係（傾き）は学校により異なっている。平均の数学の成績の高いところほど傾きが大きくなる（小さくなる）というような関係は見られない。ということです。

2. Model 4: Conditional Model - Centered Level 1 and Level 2 Predictorsを実施。(資料p.8)
シンタックスは下記。
MIXED mathach BY sector WITH meanses cses
/METHOD = REML
/PRINT = SOLUTION TESTCOV
/FIXED = meanses sector cses meanses*cses sector:cses | SSTYPE(3)
/RANDOM = INTERCEPT cses | SUBJECT(school) COVTYPE(UN).

ここで、カテゴリカルデータであるsector（公立かカソリックか）と、交互作用項が登場してきます。

meansesとcsesの交互作用が有意であったことから、その学校に通っている学生の社会経済的地位(ses)の平均(meanses=学校の平均ses)により、個々人のsesと数学の成績の高さの関係の度合いは異なり、この結果からは、通っている学生のsesの平均(meanses)が高い学校ほど、個々人のsesの高さが数学の成績の高さを説明する度合いが高い、ということです。
とは言え、共変量の推定値を見ると、傾きのばらつきは0.10ととても小さく、この傾きが学校間で異なるものとして考慮することは「役に立たない。」、切片だけは学校間で異なるとすることが適切であろう、と資料にはありました。

こういったことをSPSS等の出力結果から一人でちゃちゃっと読み取れるようになりたいものです。。。

そうそう、それから、シンタックス2行目でMETHODとして指定するREMLですが、これは、推定の方法とのことで、REMLとMLの2種類があり、REMLがMLに比べて良い点については、Multilevel analysis for applied researchに書いてある模様。

次回は縦断データです。

ご関心のある方は次回も是非いらしてください！　（文責：宮本有紀）

2009/12/11

次回（12/17）もデータを用いてMixed Model

先日（2009/12/3）のエビ研は、Mixed Model初級編(4)ということで、引き続きSPSSを用いてデータ解析を行いました。

この回では前回から用いているサンプルデータと、資料を使って続きを行っています。
まず、復習を兼ねて「まずする分析（= Example 1: The Unconditional Model）」を、前々回はシンタックスで実行させたところをGUI画面（でいいのかな？画面を出してクリックして方法などを選択していく、あれです。）で同じ分析を行うということをやってみました。

その後、Example 2に進んでいます。
~~これに関する詳しい内容は、また後日加筆いたします。~~（12/14に加筆しました。）

とりいそぎ、次回の日程のご連絡です。
次回もまた同じデータと資料を用いて続きを行います。
Mixed Modelを知りたい人、使用予定の人、どのような方もどうぞいらしてください。
日　時：2009年12月17日（木）11:00～
テーマ：Mixed Model 初級編（5）
場　所：医学部３号館　2階S210（計算機室）
また、Mixed Modelを用いた研究で解析方法について丁寧に記述してある論文をお持ちの方は、是非ご紹介ください。

この日（2009/12/3）行ったこと：
サンプルデータと資料は前回と同じです。

1. Example 1をGUI画面で行う。（資料p15のAppendixにあります。）
ここでは被験者にschoolを入れ、独立変数にmathach（数学の成績）を入れます。
ランダム効果の画面で共分散の構造で「Unstructured」を選択。
統計量を開き、「パラメータ推定値」と「共分散パラメータの検定」をチェック。

シンタックスを直接書くときは下記となります。（これは前回と同じ。）
MIXED mathach
/METHOD = REML
/PRINT = SOLUTION TESTCOV
/FIXED = | SSTYPE(3)
/RANDOM = INTERCEPT | SUBJECT(school ) COVTYPE(UN).

2. Example 2: Conditional- Level 2 Predictorを実施。
シンタックスは下記。
MIXED mathach WITH meanses
/METHOD = REML
/PRINT = SOLUTION TESTCOV
/FIXED = meanses | SSTYPE(3)
/RANDOM = INTERCEPT | SUBJECT(school ) COVTYPE(UN).

この分析で、Level 1は個人、Level 2は学校ということになります。

ここでは、socioeconomic statusの学校ごとの平均値(meanses)が固定効果として投入されています。（meansesは、平均値が0となるように中心化されています。）

この分析を行った出力結果の切片を見ると、meansesが0の時の数学の成績（mathach）が12.6494であることがわかり、さらに、sesが1高くなると、数学の成績が5.86上昇することがわかります。

ところで、共分散構造をUnstructured（UN)にすることについてですが、これは、ばらつきがそれぞれ違うと言う仮定で行うものとのことで、サンプル数が少ないと収束しないことがあるとのことです。

サンプル数が多くない場合等、UNでは収束しないようなデータの場合には、こちらで共分散構造をある程度規定する必要が出てくるとのことでした。（どんなときにどれを選ぶか、っていうのは、私にはまだよくわかりません。。。。）

次回はModel 3.（資料p.7）からです。

ご関心のある方は次回も是非いらしてください！　（文責：宮本有紀）