- 추정 (Estimation) – 개요 (Introduction)
- 추정 (Estimation) – 점 추정량의 편향과 MSE (Mean Square Error)
- 추정 (Estimation) – 일반적인 불편(unbiased) 점 추정량
- 추정 (Estimation) – 점 추정량의 적합성 산출
- 추정 (Estimation) – 신뢰구간 (Confidence Intervals)
- 추정 (Estimation) – 다 표본 신뢰구간
- 추정 (Estimation) – 표본 크기 선택
- 추정 (Estimation) – 소(小) 표본 신뢰구간 ; μ 와 μ1 – μ2
- 추정 (Estimation) – 모분산에 대한 신뢰구간
이번 포스트에서는 추정(Estimation) 의 첫 번째 포스트로 개요 (Introduction) 를 다룬다. 포스트의 내용은 『Mathematical Statistics with Applications, Sixth Edition, DUXBURY , Dennis D. Wackerly / William Mendenhall / Richard L. Scheaffer』 를 참고했다.
1. 개요
통계학의 목적은 표본으로부터 얻은 정보로 모집단에 대해 추론하는 것이다. 모집단은 기술적으로 수치화 된 관측치인 ‘파라미터’로 규정되므로 (characterized), 한 가지 이상의 모집단 파라미터를 추론하는 것이 통계적 조사의 목적이 된다. 대개 이것은 추정 (Estimation)과 가설 검정 (Hypothesis Testing) 으로 이뤄진다. 여기서는 추정에 대해 살펴볼 건데, 표분분포(sampling distribution) 가 중요한 역할을 하게 된다.
추정은 많은 실제적 활용예들을 갖고 있다. 세탁기를 만드는 제조업체는 세탁기가 1년 보증 기간 이전에 고장날 비율을 추정하고 싶을 것이다. 한편 모집단의 평균, 분산, 표준편차 같은 파라미터 값을 추정할 수도 있겠다. 수퍼마켓의 평균 대기시간이라든지 전자제품의 측정값 오차의 표준편차 같은 예를 들수 있겠다.
추정은 크게 타겟 파라미터하나를 추정하는 점추정(point estimation) 과 파라미터가 특정 구간에 들어가는지 추정하는 구간 추정 (interval estimation) 으로 나눌 수 있다. 이번 포스트에서는 점 추정까지를 다룬다.
정의.
추정량(estimator) 은 어떤 표본의 관측치에 기반하여 추정값을 계산하는 방법을 말한다. |
추정량은 수식으로 표현된다. 예를 들어 표본 평균
\bar{Y} = \dfrac{1}{n}{\sum^n_{i=1}Y_i}
은 모집단 평균의 점 추정량이 될 수 있다. 동일한 모 파라미터에 대해서 여러가지 다양한 추정량이 사용될 수 있는데, 어떤 것은 좋고 (good) 어떤 것은 나쁘다 (bad) 라고 말할 수 있다. 그렇다면 좋은 추정량은 어떻게 평가할 수 있을 것인가?