가설검정과 관련하여서 기각역 (Rejection Region), 다(多) 표본 검정, 소(小) 표본 검정 등의 의미와 기법에 대해서 차근차근 살펴보고자 한다. 이번 포스트는 『Mathematical Statistics with Applications, Sixth Edition, DUXBURY , Dennis D. Wackerly / William Mendenhall / Richard L. Scheaffer』 를 참고했다.
먼저, 통계적 가설검정의 기본 요소들을 살펴보자.
1. 통계적 검정의 요소
통계적 검정의 목적은 모 집단 파라미터 (population parameter) 들의 값에 관한 가설을 테스트하는데에 있다. 연구 가설(research hypothesis)로서, 우리가 주장하고자하는 파라미터에 대한 하나의 이론(a theory)이 있다고 하자.
예를 들어 John 이 50% 이상의 지지를 얻어 선거에서 승리할 것이라고 주장하면서 지지자들에게 유세를 한다고 할 때, 반대의 생각을 가진 우리가 John 은 50% 이상의 지지를 얻진 못할 것이다라고 연구 가설 (research hypothesis) 를 세웠다고 하자. 이 반대의 가설을 대립 가설 (alternative hypothesis) 라고 부르며, 대립가설의 반대를 귀무가설 (null hypothesis) 라고 한다. 즉 하나의 이론을 입증하면 반대되는 이론은 부정되기 때문에 양립할 수 없게 된다. 우리는 대립가설을 지지하므로 John 이 선택될 확률 (p) 가 0.5 보다 작은 경우이다.
귀무가설 (null hypothesis ) : p >= 0.5대립가설 (alternative hypothesis) : p < 0.5
p : John 이 선거에서 받은 득표율(혹은 지지율) |
귀무가설을 검정한다고 얘기하지만, 대개 연구의 목적은 대립가설이 성립하는지를 보이는 것에 있다. 어떻게 이 가설검정에 데이터들을 활용할 것인가? 도시에서 n = 15, 즉 15명의 투표자들을 랜덤하게 선택하고 이 중에서 John 을 지지한 (투표한) 수를 Y 라고 기록하자. 만약 Y =0 (John 을 지지한 사람이 0 명) 이라면 John 의 주장에 대해 어떻게 결론 내릴 수 있을까? 만약 귀무가설이 사실이라면 n = 15 일 때, Y =0 이 나온 것은 불가능한 것은 아니지만 일어나기 좀 처럼 어려운 일일 것이다. (not impossible, but improbable) 오히려 대립가설이 사실 일 때 더 자연스러운 일이 될 것이다. 따라서 우리는 귀무가설 (p >= 0.5) 를 기각 (reject) 하고, 대립가설 (p < 0.5) 를 받아들이게 된다. 만약 Y = 1 인 경우에도 마찬가지 결론에 도달하게 된다.
모든 통계적 검정은 이것과 같은 원리로 작동하며, 동일한 필수 요소들을 갖고 있다.
통계적 검정의 요소 (The Elements of a Statistical Test)
|
우리의 예제에서 검정되야 하는 가설은 귀무가설로 H0 : p = 0.5 이고, 대립 (연구) 가설은 Ha 는 H0 가 기각됨으로서 받아들여진다. 이 대립가설이 대개 표본 (데이터)로부터 얻은 정보들을 바탕으로 우리가 지지하는 가설이 된다. (즉, 우리는 가설검정을 통해 귀무가설이 틀린 것을 증명하는 것이다.) 따라서 Ha : p < 0.5 이다.
통계검정에서 기술적인 부분은 검정 통계량 (Test statistic) 과 기각역 (Rejection Region) 이다. 검정 통계량(추정량 같은) 은 표본 측정값의 함수이며 통계적 결정의 기초이다. 기각역은 RR 로 표시할 수 있는데, 대립가설을 지지하며 귀무가설을 기각할 수 있는 검정 통계량 값들이다. 만약 표본 (sample)을 통해 계산된 검정 통계량의 값이 기각역에 속한다면 (빠진다면) 우리는 귀무가설을 기각하고 대립가설을 받아들이게 된다. 반대로 기각역에 속하지 않게 된다면 귀무가설을 받아들인다.
앞의 예에서 작은 Y 값에 대해서 H0 를 기각하게 된다. 따라서 한 가지 고려해 볼 수 있는 기각역은 2보다 작거나 같은 Y 값들이다. 기각역을 RR = { y : y ≤ 2 } 와 같이 쓰거나 RR = { y ≤ 2 } 와 같이 표현할 수 있다.
좋은 기각역을 찾는 것이 통계적 검증에서 흥미로운 문제가 된다. 작은 Y 값, y ≤ k, 는 귀무 가설 H0 : p = 0.5 에 모순되고 대립가설 Ha : p < 0.5 에 부합된다. 따라서 직관적으로 기각역을 RR = { y ≤ k } 라고 선택할 수 있다. 그러나 어떤 k 값을 선택해야 할까? 좀 더 일반적으로는 좋은 기각역으로 { y ≤ k } 의 형태를 갖기 위해 k 값을 선택하는 목적식을 구해야 할 것이다.
특정한 값 k 에 의해 정해지는 어떤 기각역이라도 두 가지 종류의 오류를 범할 수 있다. (two types of errors can be made in reaching a decision) 하나는 H0 가 사실일 때 Ha 를 선택하는 것이고 (type Ⅰ error), 다른 하나는 Ha 가 사실일 때 H0 를 선택하는 것이다. (type Ⅱ error)
type Ⅰ error : H0 가 사실일 때, H0 가 기각되는 것. 이 때 type Ⅰ error 의 확률을 α 라고 지칭하고, α 를 검정 수준이라고 부른다.type Ⅱ error : Ha 가 사실일 때, Ha 가 기각되는 것. 이 때 type Ⅱ error 의 확률을 β 라고 지칭한다. |
예제1.John 의 지지도 조사에서 15명 (n=15) 의 표본을 얻었다. H0 : p = 0.5 와 Ha : p < 0.5 를 검정하고 싶다. 검정 통계량을 표본 중 John 을 지지하는 사람들의 숫자, Y 라고 하자. 기각역으로 RR = {y ≤ 2} 을 선택했다고하면 α (type Ⅰ error) 를 계산하라. |
풀이.
정의에 의해,
α = P(type Ⅰ error) = P(H0 가 사실일 때, H0 를 기각)
= P(H0 가 사실일 때, 검정 통계량이 기각역, RR 에 속함)
= P( Y ≤ 2 when p = 0.5 )
된다.
Y 는 n = 15 이고 p = 0.5 인 이항 분포를 보이므로,
\alpha = \sum^2_{y=0}\dbinom{15}{y}(0.5)^y(0.5)^{15-y} =\dbinom{15}{0}(0.5)^{15} +\dbinom{15}{1}(0.5)^{15} +\dbinom{15}{2}(0.5)^{15}계산하면, α = 0.004 를 얻는다. 따라서 기각역으로 RR = {y ≤ 2} 을 선택했다면 설사 실제로는 John 이 승리한다고 해도, John 이 진다고 잘못 판단할 오류의 확률 (α = 0.004) 은 매우 작은 값이 된다.