statistics/심리통계학의 기초

변량분석의 사후 검증의 논리

반찬이 2008. 7. 15. 08:26

사후검증은 평균 차이들에 대한 사전 가설없이, 전반적 검증결과 집단간 차이가 유의미했을 때 어떤 평균들이 서로 차이가 나는지 규명하기 위해 평균들을 쌍으로 혹은 묶어서 비교하는 것이다. 사후비교는 그 차이에 대한 판단에서 제1종 오류를 범할 확률이 높기 때문. 사후비교를 위한 여러 가지 방법들은 experiment-wise α가 .05를 넘지 않도록 통제하면서 평균차이를 검증하기 위한 것들이다. 가장 널리 쓰이는 방법으로는 Scheffe 검증과 Tukey 검증이 있다.

Scheffe 검증은 두 개의 실험집단 평균들 사이의 차이에 대한 비교뿐만 아니라 모든 가능한 유형의 대비에 의한 비교들에도 적용되는 사후비교방법이다. Scheffe검증은 대비분석을 수행하고 각 대비의 F값을 산출하는 절차를 거치는데, 이때, 분자 자유도는 g-1, 분모 자유도는 N-g로 임계치를 찾아 찾아진 임계치에 g-1을 곱해준다. 일단, 임계치가 정해지면, 어떤 비교를 위해서도 그 동일한 임계치를 적용할 수 있다. 또한 비교를 위한 대비들이 서로 직교적일 필요가 없다는 장점이 있다. 또한 정상분포와 독립성의 가정이 만족되지 않아도 큰 영향을 받지 않고, 집단의 사례수가 달라도 검증가능하며, 단순쌍 비교와 복합쌍 비교 모두 가능하다. 검증력이 가장 엄격하며 1종 오류에는 내강하지만 2종 오류가 일어날 확률이 높다.

Tukey 검증은 실험조건들에 대한 쌍비교가 서로 독립적이 아니라는 사실을 고려하여, experiment-α를 현실적으로 설정하여 적정수준을 초과하지 않도록 하여 단순쌍별 비교를 한다. 즉 Tukey 검증은 특정 몇 개의 값에만 관심을 갖을 경우, 두개씩 비교하는 쌍비교에 적용되는 방법이다. Tukey 검증은 정상분포와 독립성의 가정을 요구하고, 검증력도 Scheffe보다 높으며, 집단의 사례수가 같아야 한다. (적용범위 제한점)

 

->투키는 세집단이 있다면 이를 각각 비교하는 검사(1,2/2,3/1,3)방식이며, 셰폐는 짝비교뿐만 아니라 결합비교까지 하는 검사이다. 이 두 검증의 차이는 세폐는 사전과 사후를 막론해 모든 다중비교 방법들 중 가장 보수적인 방법으로, 그 이유는 g개의 실험집단에 대해 모든 가능한 비교와 대비분석을 다 수행하는 경우 experiment-wise a가 .05 혹은 .01을 초과하지 않도록 하려는데 목적이 있기 때문이다. 반면 집단평균들의 사후비교를 위한 투키는 세폐에 비해 적용범위가 제한적이지만 평균쌍들의 비교를 위해서는 세폐검증보다 검증력이 높다.

▶testwise α 수준 : 각 가설검증에서 선택하는 α 수준

experimentwise α 수준 : 실험내 모든 검증으로부터 누적된 1종 오차의 전체 확률. 즉, 비교를 많이 할수록 이 수준이 커지고 1종 오류의 위험도 커진다. 처치집단의 모든 가능한 짝들에 대해 t 검증을 하면 experimentwise α 수준이 커지는 문제가 생긴다.

 

Scheffe

Tuckey

전반적 검증을 한 후 처치효과가 있는 경우, 어떤 집단에서 나타났는지 알아보기 위해 평균을 쌍으로 또는 묶어서 비교하는 사후 검증이다. 1종 오류의 가능성이 높기 때문에 α수준을 짜게 잡는다.

정상성, 독립성 가정을 요구하지 않는다.

집단수가 달라도 가능하다.

단순쌍/복합쌍 비교 가능하다.

이종오류 발생 가능성이 높다.

정상성, 독립성 가정을 요구한다.

집단수가 같아야 가능하다.

단순쌍 비교만 가능하다.

scheffe보다 검증력 우수하다.