- 추정 (Estimation) – 개요 (Introduction)
- 추정 (Estimation) – 점 추정량의 편향과 MSE (Mean Square Error)
- 추정 (Estimation) – 일반적인 불편(unbiased) 점 추정량
- 추정 (Estimation) – 점 추정량의 적합성 산출
- 추정 (Estimation) – 신뢰구간 (Confidence Intervals)
- 추정 (Estimation) – 다 표본 신뢰구간
- 추정 (Estimation) – 표본 크기 선택
- 추정 (Estimation) – 소(小) 표본 신뢰구간 ; μ 와 μ1 – μ2
- 추정 (Estimation) – 모분산에 대한 신뢰구간
이번 포스트는 추정(Estimation) 의 여섯 번째 포스트로 다(多) 표본 신뢰구간 (Large-Sample Confidence Intervals) 을 다룬다. 내용은『Mathematical Statistics with Applications, Sixth Edition, DUXBURY , Dennis D. Wackerly / William Mendenhall / Richard L. Scheaffer』 를 참고했다.
6. 다(多) 표본 신뢰구간 (Large-Sample Confidence Intervals)
추정(Estimation) 시리즈 3번째 포스트에서 \mu, ~p,~ \mu_1-\mu_2,~ p_1-p_2 와 같은 파라미터들의 불편 점추정량(unbiased point estimators)을 확인했었다. 해당 섹션에서 살펴본 것처럼 이들 점 추정량은 근사적으로 정규 분포를 따르는 것을 알 수 있었다. (3번째 포스트의 테이블에 표준 오차가 정리되어 있다.) 즉, 3번째 포스트의 조건하에, 만약 타겟 파라미터 \theta 가 \mu, ~p,~ \mu_1-\mu_2,~ p_1-p_2 라면, 다 표본의 경우에
Z = \dfrac{\hat{\theta} - \theta}{\sigma_{\hat{\theta}}}
는 근사적으로 표준 정규 분포를 갖는다. 따라서, Z = (\hat{\theta} - \theta)/\sigma_{\hat{\theta}} 가 (근사적으로라도) pivotal 양을 형성하면, pivotal 방식으로 타겟 파라미터 \theta 에 대한 신뢰구간을 만들 수 있다.
예제1.
\hat{\theta} 를 평균 \theta 와 표준오차 \sigma_{\hat{\theta}} 를 갖는 정규 분포의 통계량이라고 하자. \theta 에 대해 신뢰계수 (1-\alpha) 를 갖는 신뢰구간을 찾아라. |
풀이.
Z = \dfrac{\hat{\theta} - \theta}{\sigma_{\hat{\theta}}}
양은 표준 정규분포를 갖는다. 이 분포의 양 끝 꼬리에
P(-z_{\alpha/2} \leq Z \leq z_{\alpha/2})=1-\alpha
를 만족하는 -z_{\alpha/2}, z_{\alpha/2} 를 선택하자. (아래 그림 참조) Z 를 위의 통계량으로 치환하면,
P(-z_{\alpha/2} \leq\dfrac{\hat{\theta} - \theta}{\sigma_{\hat{\theta}}} \leq z_{\alpha/2}) = 1-\alpha
를 얻는다. 양변에 \sigma_{\hat{\theta}} 를 곱하면,
P(-z_{\alpha/2}\sigma_{\hat{\theta}} \leq \hat{\theta} - \theta \leq z_{\alpha/2}\sigma_{\hat{\theta}})=1-\alpha
가 된다. \hat{\theta} 를 양 부등식에 빼주면,
P(-\hat{\theta}-z_{\alpha/2}\sigma_{\hat{\theta}} \leq -\theta \leq -\hat{\theta} +z_{\alpha/2}\sigma_{\hat{\theta}})=1-\alpha
가 되는데 -1 를 양변에 곱하고, 부등식의 방향을 바꾸면
P(\hat{\theta}-z_{\alpha/2}\sigma_{\hat{\theta}} \leq \theta \leq \hat{\theta} +z_{\alpha/2}\sigma_{\hat{\theta}})=1-\alpha
을 얻는다. 파라미터 \theta 의 100(1-\alpha) % 신뢰구간의 양 끝점은 다음과 같다.
\hat{\theta_L}=\hat{\theta}-z_{\alpha/2}\sigma_{\hat{\theta}} 와 \hat{\theta_U}=\hat{\theta}+z_{\alpha/2}\sigma_{\hat{\theta}}
마찬가지 방식으로 100(1-\alpha) % 종종 upper bounds, lower bounds 라고 지칭되는 단측 신뢰구간을 결정할 수 있다. 각각은 다음과 같이 주어진다.
100(1-\alpha) % lower bound for \theta = \hat{\theta} - z_{\alpha}\sigma_{\hat{\theta}}
100(1-\alpha) % upper bound for \theta = \hat{\theta} + z_{\alpha}\sigma_{\hat{\theta}}
만약 우리가 100(1-\alpha) % lower bound 과 100(1-\alpha) % upper bound 를 모두 계산해야 한다고 가정해 보자. 파라미터 \theta 의 신뢰구간을 형성하기 위해 이들 상한, 하한 값을 모두 사용해야 한다. 이 신뢰구간의 신뢰계수는 얼마인가? 상한과 하한 모두 1-\alpha 의 신뢰계수를 갖기 때문에, 양쪽 인터벌의 신뢰계수는 1-2\alpha 가 된다.
3번째 포스트의 조건하에 앞에서 유도한 결과는 \mu, ~p,~ \mu_1-\mu_2,~ p_1-p_2 들의 다 표본 신뢰구간을 찾는데 사용된다. (단측 또는 양측) 뒤의 예제들은 예제1. 에서 유도한 일반적인 경우의 응용을 다룬다.
예제2.
n=64인 어떤 지역 슈퍼마켓의 고객들의 쇼핑 시간이 기록되었다고 하자. 이들 64명의 쇼핑 시간에 대한 평균과 분산은 각각 33분과 256이다. 고객들의 평균 쇼핑시간 \mu 를 추정하라. 신뢰계수 1-\alpha = 0.9 이다. |
풀이.
이 예제에서 타겟 파라미터 \theta = \mu 이다. 따라서 n=64 일때 \hat{\theta}=\bar{y}=33 이고 s^2=256 이다. 모 분산 \sigma^2 는 알지 못하고 대신 s^2 으로 추정한다. 신뢰구간은
\hat{\theta}\pm z_{\alpha/2}\sigma_{\hat{\theta}}
는 아래와 같은 형태를 갖는다.
\bar{y} \pm z_{\alpha/2}(\dfrac{\sigma}{\sqrt{n}})\approx \bar{y} \pm z_{\alpha/2}(\dfrac{s}{\sqrt{n}})
z_{\alpha/2}=z_{0.05}=1.645 이고, 따라서 신뢰 한계점은
\bar{y}-z_{\alpha/2}(\dfrac{s}{\sqrt{n}})=33-1.645(\dfrac{16}{8})=29.71\bar{y}+z_{\alpha/2}(\dfrac{s}{\sqrt{n}})=33+1.645(\dfrac{16}{8})=36.29
가 된다. 따라서 \mu 에 대한 신뢰구간은 (29.71,~36.29) 가 된다. 표본 추출을 반복하면, 전체 \bar{Y} \pm 1.645(s/\sqrt{n}) 의 신뢰구간에 모 집단 평균인 \mu 가 속할 확률이 근사적으로 90%가 된다. 비록 위에서 구한 특정한 구간인 (29.71,~36.29) 에 \mu 가 속하는 지는 알 수 없지만, 신뢰구간을 생성하는 과정에 실제 평균이 해당 방법으로 생성된 모든 신뢰구간들에 90% 의 확률로 모 평균을 포함한다고 할 수 있다.
예제3.
두 종류의 냉장고 브랜드를 A, B 라고 하자. 각 냉장고는 1년의 품질보증기간을 갖는다. A 브랜드에서 추출한 50개의 랜덤 표본중에서 12개가 보증기간 이전에 고장이 났다고 한다. B 브랜드에서 추출한 60개 랜덤 표본중에서는 12개가 보증 기간이 넘기 전에 고장이 났다고 한다. (p_1-p_2) 에 모 비율 차이를 추정하라. (비율 = 보증기간 내의 고장의 비율) 신뢰 계수는 0.98 를 사용한다. |
풀이.
신뢰구간
\hat{\theta}\pm z_{\alpha/2}\sigma_{\hat{\theta}}
은 아래와 같은 형태를 갖는다.
(\hat{p_1} - \hat{p_2}) \pm z_{\alpha/2}\sqrt{\dfrac{p_1q_1}{n_1}+\dfrac{p_2q_2}{n_2}}
p_1,~q_1,~p_2,~q_2 를 모 집단의 비율이므로 알지 못하기 때문에, 정확한 \sigma_{\hat{\theta}} 는 산출 해 낼 수 없다. 하지만 3번째 포스트에서와 같이 \sigma_{\hat{\theta}} 에 대해 좋은 근사방법이 있다. p_1,~q_1,~p_2,~q_2 각각을 \hat{p_1}, \hat{q_1}=1-\hat{p_1}, \hat{p_2}, \hat{q_2}=1-\hat{p_2} 로 치환하는 것이다.
이 예제에서 \hat{p_1}=0.24, ~\hat{q_1}=0.76,~ \hat{p_2}=0.20,~ \hat{q_2}=0.80 가 된다. 98% 신뢰구간은
(0.24-0.20) \pm 2.33\sqrt{\dfrac{(0.24)(0.76)}{50}+\dfrac{(0.20)(0.80)}{60}}
0.04 \pm 0.1851 또는 [-0.1451, 0.2251]
이 된다.
이 신뢰구간이 0을 포함하는 것을 확인하기 바란다. 따라서 비율의 차이 (p_1-p_2) 는 관측된 결과로부터 믿을만하다라고 할 수 있다. (98% 신뢰 계수로) 그러나 구간이 또한 0.1을 포함하고 있다. 따라서 0.1 은 또 다른 (p_1-p_2) 에서는 나타날 수 있다고 믿을 수 있다.
이번장의 마지막 부분은 단일 모집단 평균 \mu 에 대한 다(多) 표본 Y_1,Y_2,...,Y_n 구간 추정의 실제적인 성능 탐구에 대해 다루며 끝내고자 한다. 이 경우 \theta=\mu 이고 \sigma^2_{\hat{\theta}}=\sigma^2_{\bar{Y}}=\sigma^2/n 이다. ( \sigma 는 모 분산이다.) 적합한 신뢰한계는 아래와 같다.
\hat{\theta_L}=\bar{Y}-z_{\alpha/2}(\dfrac{\sigma}{\sqrt{n}}) 와 \hat{\theta_U}=\bar{Y}+z_{\alpha/2}(\dfrac{\sigma}{\sqrt{n}})
다(多) 표본의 경우, \sigma 를 모를 때, (정확도의 많은 손해를 입지 않고서도) 표본 추정양 s=\sqrt{s^2} 로 대체할 수 있다.
100개의 독립 랜덤 표본들에 대해서 각각의 표본 크기도 100으로하고, 각 표본들은 모 평균 \mu 을 10으로 하는 지수분포로부터 생성한다. 100개의 각 표본들의 표본 평균 \bar{y} 과 표본 표준편차 s 는 표본으로 부터 계산되고 근사적으로 95% 신뢰구간을 형성하는데 사용된다. 사용되는 공식은 다음과 같다. \bar{y} \pm 1.96s/\sqrt{100} ( z_{0.025}=1.96 이다.) 100 개의 표본이 생성되었고, (아래 결과는 R 을 사용하여 시뮬레이션하였다. 사용된 소스코드는 깃허브에 공개하였다.) 아래 그림들에서 표본 평균, 표본 표준편차, 그리고 신뢰한계점들을 표시하였다. 어떤 구간은 모집단의 평균인 10을 포함하고 (정확히 93개의 구간), 나머지 7개 구간은 포함하지 않았다. 포함하지 않는 구간은 ‘check’ 컬럼에 “*” 로 표시하였다. 그러므로 100개 구간들 중에서 93%가 모 평균 10을 포함시켰다. 따라서 모집단의 평균을 포함하는 구간들의 비율이 명목상 신뢰계수 0.95에 근접한 것을 확인 할 수 있다.
한 가지 비유가 ‘95% 수준에서 신뢰할 수 있다’ 는 문장의 의미를 이해하는데 도움을 줄 수 있을거 같다. 만약 당신이 100개의 배터리를 포함하는 그룹에서 하나의 배터리를 랜덤하게 선택한다고 가정해 보자. (이 그룹의 배터리 100개 중에 95개는 완충되어 있다) 당신이 선택한 배터리가 완충되어 있을 수도 있고 그렇지 않을 수도 있다. 하지만 당신은 95%로 당신이 선택한 배터리가 완충되어 있다고 말할 수 있다. 왜냐하면 “당신의 선택으로 선택된 그룹의 배터리 구성”이 그렇기 때문이다. 관심있는 모집단으로부터 랜덤 표본으로 기초하여 계산한 하나의 구간은 타겟 파라미터를 포함 할 수도 있고 안 할 수도 있다. 해당 절차를 따라 생성한 구간개수의 근사적으로 95% 만큼이 파라미터를 포함하는 구간이 되게끔 만들어진 절차(procedure) 를 사용하였기 때문에, 당신은 해당 구간이 파라미터를 포함할 것이라고 ‘95% 신뢰하는’ 것이다.
이번 장에서는 pivotal 방식을 사용하여 3번째 포스트의 조건하에 \mu, ~p,~ \mu_1-\mu_2,~ p_1-p_2 에서 사용되는 다(多) 표본 신뢰구간을 유도하여 보았다. 주요 공식은 다음과 같다.
\hat{\theta}\pm z_{\alpha/2}\sigma_{\hat{\theta}}
\hat{\theta} 와 \sigma_{\hat{\theta}} 는 3번째 포스트에 표로 제공되어 있다. \theta=\mu 가 타겟 파라미터일 때, \hat{\theta} = \bar{Y} 이고 \sigma^2_{\hat{\theta}}=\sigma^2/n 이다. ( \sigma 는 모 분산이다.) 만약 \sigma^2 를 모를 때, s^2 를 신뢰구간 계산에 대치할 수 있다. (심각한 정확성을 잃지않고) 마찬가지로 \theta = \mu_1-\mu_2 의 신뢰구간 계산에서, \sigma_1^2 과 \sigma_2^2 를 모를 때, s_1^2 과 s_2^2 를 대치할 수 있다. \theta =p 가 타겟 파라미터일 때, \hat{\theta} = \hat{p} 이고 \sigma_{\hat{\theta}}=\sqrt{pq/n} 이다. p 를 알지 못할 때, \sigma_{\hat{p}} 를 산출할 수 없지만 p 대신에 \hat{p} 를 대입하면 ( \hat{q}=1-\hat{p} for q ) 가능하다. 결과 도출된 신뢰구간은 근사적으로 신뢰계수를 설명할 수 있다. 마찬가지로 \sigma^2_{\hat{p_1}-\hat{p_2}} 공식에는 \hat{p_1} 과 \hat{p_2} 로 p_1 과 p_2 각각을 추정하여 사용하게 된다. 이들 대입에 대한 이론적인 판단은 뒤에서 다루게 된다.