QQ Plot

Q-Q (quantile-quantile) Plot Q-Q Plot 을 살펴보기 이전에 먼저 Quantile 이라는 개념을 짚고 넘어가자. Quantile 은 분위수라는 개념인데, 데이터들을 정렬한 뒤에 몇 등분으로 나눌 수 결정하고, 나눠진 등분을 구분하는 구분자를 찾는 개념이다. 이는 ‘Quantile (분위수)‘ 포스트를 참고하길 바란다. Q-Q 가 의미하는 바가 quantile-quantile 인데, Theoretical-Quantile vs. Emprical-Quantile ( Sample-Quantile ) 로 생각하면 된다. 즉 가로축에는 …

Read moreQQ Plot

카이스퀘어 분포 (χ2-distribution)

Chi-Squared (χ2) distribution 카이 제곱분포 또는 영어로 Chi-Squared distribution 이라 불리는 확률분포는 표준 정규분포 (Standard Normal Distribution) 의 독립변수들을 제곱하여 얻어지는 분포이다. 여기서 카이(χ ; Chi) 는 그리스문자에서 따온 것이다. 독립변수  가 표준정규분포를 따를때, 처럼 표현하고 아래 그림과 같은 분포를 띈다. 만약 가  처럼 표준정규분포를 따르는 의 제곱인 경우, 독립변수 한 개를 사용하므로 이 되며, …

Read more카이스퀘어 분포 (χ2-distribution)

사건의 독립과 조건부 확률

이번 포스트에서는 사건의 독립의 정의와 함께 복원추출 및 비복원추출의 예제를 살펴보겠다. 그리고 조건부 확률의 정의와 함께 예제도 같이 확인해 보겠다. 1. 독립사건 두 사건이 서로 독립이기 위한 필요 충분조건은, P(A ∩ B) = P(A) * P(B) ⇔ P(B ∩ A) = P(B) * P(A)   예제1) 6개 눈이 있는 주사위를 두 번 던지는 경우를 생각해 보자. …

Read more사건의 독립과 조건부 확률

상자에서 공 뽑기 예제가 독립사건을 설명하는데 적절하지 않은 이유

이번 포스트에서 일부 오표기 및 비복원추출 확률 계산이 잘못된 부분이 있어 정정하였습니다. 미리 발견하지 못한점 양해 부탁드리며, 향후에도 잘못된 부분이 발견되면 제게 알려주시면 감사하겠습니다. 이전 포스트에서 조건부확률과 독립시행을 상자에서 빨간공을 뽑은 예제로 설명 하였다. 아래 그림과 같이 상자에 7개의 검은공과 3개의 빨간 공이 있다고 가정할 때, 두 번의 시행으로 공을 뽑는 경우를 생각해 보면, 뽑은 공을 …

Read more상자에서 공 뽑기 예제가 독립사건을 설명하는데 적절하지 않은 이유

확률관련 용어 정리

확률에 관련된 용어들을 보다보니, 혼란스러운 마음이 들어 관련 용어들부터 정리해 볼 필요가 있겠다는 생각이 들었다. 모든 정의는 Wikipedia 를 따른다. (좀 더 엄격히 학술적으로 정의하면 좋겠지만…) 1. 확률(Probability) : 어떤 사건(Event)가 일어날 가능도이다. 0~1 사이로 정의된다. Probability is the measure of the likelihood that an event will occur.[1] See glossary of probability and statistics. Probability quantifies as a number between 0 and 1, where, …

Read more확률관련 용어 정리

출루율로 배우는 확률과 우도, 최대우도추정법

앞서 가능도(likelihood) 대한 글에 이어서 “메이저리그 야구 통계학” 에서 소개하는 재미난 예제를 살펴볼까 한다. 이 글의 일부는 “메이저리그 야구 통계학” 책의 4장 ‘상관관계는 인과관계가 아니다’ 절을 직접 인용하고 있음을 미리 밝혀둔다. 이 포스트에 사용된 예제 소스는 Github 에서 확인 할 수 있다. 1. 출루율이 정해진 상황에서의 다섯번 타석에 들어섰을 때 두 번 출루할 확률 조이 …

Read more출루율로 배우는 확률과 우도, 최대우도추정법

Likelihood (가능도)

likelihood ? 우도라고 말하면 당최 무슨 말인지 감이 잡히지 않는, 잡힐 듯 잡히지 않는 개념이었다. 나는 오히려 가능도라고 부르는 것이 더 나아 보인다. 가능도의 개념을 잡기 위해서 참고한 부분을 먼저 소개한다. 우선, sw4r 님의 블로그에 방대한 내용의 수리통계학 관련 포스트를 참고했다. 또, 위키피디아의 ‘Likelihood function‘에 관한 정의를 참고했다. 여기 나온 정의 부분과 내용 전개 부분에서 많은 도움을 얻었다. …

Read moreLikelihood (가능도)

조건부 독립 ( Conditional Independence )

조건부 독립에 대해 생각해 보자. 많은 머신러닝 책들에 보면 베이즈 정리와 함께 조건부 독립에 대해서 장황하게 설명한 내용들이 많은데, 아래 그림 만큼 쉽게 와 닿는 예제도 없는 듯하다. 온라인에 공개된 KAIST 문일철 교수님의 머신러닝 강좌(3-2) 의 강의노트에서 발췌한 그림을 보기로 하자. 명령을 내리는 상사와 부하직원 2명이 있다고 가정해 보자. 만약 OfficerA 가 OfficerB 가 앞으로 가는 것을관찰했다고 치면 OfficerA …

Read more조건부 독립 ( Conditional Independence )

결합확률과 체인룰

1. 결합 확률 함수(Joint Probability Function) 결합확률을 통계적으로 이산랜덤변수와 연속랜덤변수로 나누어 구분할 수 있다. 이 포스트에서는 이산랜덤변수에 의한 결합 확률 분포를 살펴보겠다. (연속형의 경우 본격적으로 다룰 기회가 있을 거라고 믿는다.^^;) 가 이산 랜덤 변수(Discrete Random Variables) 이면, 의 결합확률 분포는 다음과 같다.   함수 를 결합 확률 함수 (joint probability function) 이라고 칭한다.   이 때, …

Read more결합확률과 체인룰

베이즈 정리 ( Bayes Theorem )

1. 베이즈 정리 (Bayes Theorem) 우리는 2 개의 조건부 확률을 사용하여 베이즈 정리를 쉽게 유도할 수 있다.     는 조건부 확률이다.  B가 사실(true) 로 주어졌을 때, A가 발생할 가능도(likelihood) 로 정의할 수 있다. 역시 조건부 확률이다. A가 사실(true) 로 주어졌을 때, B가 발생할 가능도(likelihood) 로 정의할 수 있다. 와  는 서로 독립적으로 관측되는 marginal …

Read more베이즈 정리 ( Bayes Theorem )