가설검정 (Hypothesis Testing) – 통계적 검정의 요소

This entry is part 1 of 8 in the series 가설검정

 

 

 

 

 

가설검정과 관련하여서 기각역 (Rejection Region), 다(多) 표본 검정, 소(小) 표본 검정 등의 의미와 기법에 대해서 차근차근 살펴보고자 한다. 이번 포스트는 『Mathematical Statistics with Applications, Sixth Edition, DUXBURY , Dennis D. Wackerly / William Mendenhall / Richard L. Scheaffer』 를 참고했다.

먼저, 통계적 가설검정의 기본 요소들을 살펴보자.

1. 통계적 검정의 요소

통계적 검정의 목적은 모 집단 파라미터 (population parameter) 들의 값에 관한 가설을 테스트하는데에 있다. 연구 가설(research hypothesis)로서, 우리가 주장하고자하는 파라미터에 대한 하나의 이론(a theory)이 있다고 하자.

예를 들어 John 이 50% 이상의 지지를 얻어 선거에서 승리할 것이라고 주장하면서 지지자들에게 유세를 한다고 할 때, 반대의 생각을 가진 우리가 John 은 50% 이상의 지지를 얻진 못할 것이다라고 연구 가설 (research hypothesis) 를 세웠다고 하자. 이 반대의 가설을 대립 가설 (alternative hypothesis) 라고 부르며, 대립가설의 반대를 귀무가설 (null hypothesis) 라고 한다. 즉 하나의 이론을 입증하면 반대되는 이론은 부정되기 때문에 양립할 수 없게 된다. 우리는 대립가설을 지지하므로 John 이 선택될 확률 (p) 가 0.5 보다 작은 경우이다.

귀무가설 (null hypothesis ) : p >= 0.5

대립가설 (alternative hypothesis) : p < 0.5

p : John 이 선거에서 받은 득표율(혹은 지지율)

귀무가설을 검정한다고 얘기하지만, 대개 연구의 목적은 대립가설이 성립하는지를 보이는 것에 있다. 어떻게 이 가설검정에 데이터들을 활용할 것인가? 도시에서 n = 15, 즉 15명의 투표자들을 랜덤하게 선택하고 이 중에서 John 을 지지한 (투표한) 수를 Y 라고 기록하자. 만약 Y =0 (John 을 지지한 사람이 0 명) 이라면 John 의 주장에 대해 어떻게 결론 내릴 수 있을까? 만약 귀무가설이 사실이라면 n = 15 일 때, Y =0 이 나온 것은 불가능한 것은 아니지만 일어나기 좀 처럼 어려운 일일 것이다. (not impossible, but improbable) 오히려 대립가설이 사실 일 때 더 자연스러운 일이 될 것이다. 따라서 우리는 귀무가설 (p >= 0.5) 를 기각 (reject) 하고, 대립가설 (p < 0.5) 를 받아들이게 된다. 만약 Y = 1 인 경우에도 마찬가지 결론에 도달하게 된다.

모든 통계적 검정은 이것과 같은 원리로 작동하며, 동일한 필수 요소들을 갖고 있다.

통계적 검정의 요소 (The Elements of a Statistical Test)

  1. 귀무가설 (Null hypothesis, H0)
  2. 대립가설 (Alternative hypothesis, Ha)
  3. 검정 통계량 (Test statistic)
  4. 기각역 (Rejection region)

우리의 예제에서 검정되야 하는 가설은 귀무가설로 H0 : p = 0.5 이고, 대립 (연구) 가설은 Ha 는 H0 가 기각됨으로서 받아들여진다. 이 대립가설이 대개 표본 (데이터)로부터 얻은 정보들을 바탕으로 우리가 지지하는 가설이 된다. (즉, 우리는 가설검정을 통해 귀무가설이 틀린 것을 증명하는 것이다.) 따라서 Ha : p < 0.5 이다.

통계검정에서 기술적인 부분은 검정 통계량 (Test statistic) 과 기각역 (Rejection Region) 이다. 검정 통계량(추정량 같은) 은 표본 측정값의 함수이며 통계적 결정의 기초이다. 기각역은 RR 로 표시할 수 있는데, 대립가설을 지지하며 귀무가설을 기각할 수 있는 검정 통계량 값들이다. 만약 표본 (sample)을 통해 계산된 검정 통계량의 값이 기각역에 속한다면 (빠진다면) 우리는 귀무가설을 기각하고 대립가설을 받아들이게 된다. 반대로 기각역에 속하지 않게 된다면 귀무가설을 받아들인다.

앞의 예에서 작은 Y 값에 대해서 H0 를 기각하게 된다. 따라서 한 가지 고려해 볼 수 있는 기각역은 2보다 작거나 같은 Y 값들이다.  기각역을 RR = { y : y ≤ 2 } 와 같이 쓰거나 RR = { y ≤ 2 } 와 같이 표현할 수 있다.

좋은 기각역을 찾는 것이 통계적 검증에서 흥미로운 문제가 된다. 작은 Y 값, y ≤ k, 는 귀무 가설 H0 : p = 0.5 에 모순되고 대립가설 Ha : p < 0.5 에 부합된다. 따라서 직관적으로 기각역을 RR = { y ≤ k } 라고 선택할 수 있다. 그러나 어떤 k 값을 선택해야 할까? 좀 더 일반적으로는 좋은 기각역으로 { y ≤ k } 의 형태를 갖기 위해 k 값을 선택하는 목적식을 구해야 할 것이다.

특정한 값 k 에 의해 정해지는 어떤 기각역이라도 두 가지 종류의 오류를 범할 수 있다. (two types of errors can be made in reaching a decision) 하나는 H0 가 사실일 때 Ha 를 선택하는 것이고 (type Ⅰ error), 다른 하나는 Ha 가 사실일 때 H0 를 선택하는 것이다. (type Ⅱ error)

type Ⅰ error : H0 가 사실일 때, H0 가 기각되는 것. 이 때 type  Ⅰ error 의 확률을 α 라고 지칭하고, α 를 검정 수준이라고 부른다.

type Ⅱ error : Ha 가 사실일 때, Ha 가 기각되는 것. 이 때 type Ⅱ error 의 확률을 β 라고 지칭한다.

 

예제1.

John 의 지지도 조사에서 15명 (n=15) 의 표본을 얻었다. H0 : p = 0.5 와 Ha : p < 0.5 를 검정하고 싶다. 검정 통계량을 표본 중 John 을 지지하는 사람들의 숫자, Y 라고 하자. 기각역으로 RR = {y ≤ 2} 을 선택했다고하면 α (type Ⅰ error) 를 계산하라.

풀이.

정의에 의해,

α = P(type Ⅰ error) = P(H0 가 사실일 때, H0 를 기각)
   = P(H0 가 사실일 때, 검정 통계량이 기각역, RR 에 속함)
   = P( Y ≤ 2 when p = 0.5 )

된다.

Y 는 n = 15 이고 p = 0.5 인 이항 분포를 보이므로,

\alpha = \sum^2_{y=0}\dbinom{15}{y}(0.5)^y(0.5)^{15-y} =\dbinom{15}{0}(0.5)^{15} +\dbinom{15}{1}(0.5)^{15} +\dbinom{15}{2}(0.5)^{15}

 

계산하면, α = 0.004 를 얻는다. 따라서 기각역으로 RR = {y ≤ 2} 을 선택했다면 설사 실제로는 John 이 승리한다고 해도, John 이 진다고 잘못 판단할 오류의 확률 (α = 0.004) 은 매우 작은 값이 된다.

Series Navigation가설검정 (Hypothesis Testing) – 다(多) 표본 검정 >>

2 thoughts on “가설검정 (Hypothesis Testing) – 통계적 검정의 요소”

    • 질문을 정확히 이해하지는 못하였으나, 머신러닝의 시대이기 때문에 가설검정이 가장 중요하다고 생각합니다. 결국 러닝의 과정은 가설이 참일 확률 혹은 기각될 확률을 높이는 과정이기 때문입니다. 가설이 없다면 러닝의 존재 자체도 의미가 없어지니 유효하다고 할 수 있을거 같습니다.

      응답

Leave a Comment