이번 포스트에서 일부 오표기 및 비복원추출 확률 계산이 잘못된 부분이 있어 정정하였습니다. 미리 발견하지 못한점 양해 부탁드리며, 향후에도 잘못된 부분이 발견되면 제게 알려주시면 감사하겠습니다.
이전 포스트에서 조건부확률과 독립시행을 상자에서 빨간공을 뽑은 예제로 설명 하였다.
아래 그림과 같이 상자에 7개의 검은공과 3개의 빨간 공이 있다고 가정할 때, 두 번의 시행으로 공을 뽑는 경우를 생각해 보면, 뽑은 공을 다시 상자에 넣는 경우는 복원추출, 다시 넣지 않는 경우는 비복원 추출이 된다. 그 때의 확률은 아래 그림에서 계산된 것과 같다.
1. 복원추출 : 뽑은 공을 다시 상자에 넣지 않는 경우
2. 비복원추출 : 뽑은 공을 다시 상자에 넣는 경우
다음과 같이 상자에 검은공 7개와 빨간공 3개가 들어있다.
연속하여 두 개의 빨간공을 뽑을 확률을 구하면,
1. 복원추출 : \dfrac{3}{10}\times \dfrac{3}{10}=\dfrac{9}{100}
2. 비 복원 추출 : \dfrac{3}{10}\times \dfrac{2}{9}=\dfrac{1}{15}
여기서 사건의 독립을 얘기하기 위해서는 먼저 사건(Event) 를 정의해야 한다.
어떤 걸 사건 A, B 로 볼 것인가?
만약 빨간공이 나오는 사건 = A, 검은공이 나오는 사건= B 라고 한다면, 첫번째 시행에서 빨간공, 두번재 시행에서 빨간공이 나오는 것은 어떻게 표현할 것인가? 빨간공이 나오는 사건이 B 이므로 두 번다 빨간공이 나오는 확률은
P(B) \times P(B|B) 와 같이 표현될 것이다. 어라 좀 이상한데?
또 한 가지 생각해 볼 수 있는 것은 첫번째로 빨간공이 나오는 것을 A, 두번째에 빨간공이 나오는 사건을 B 라고 하면,
P(A) \times P(B|A) 같기 때문에 이제 뭔가 제대로 된 느낌이 든다.
하지만 여기서 매우 혼동 스러운 부분이 있다. 바로, P(B) 값은 뭐지? 하는 부분이다. 복원추출일 경우 3/10 * 3/10 으로 표현되는 두 번째 P(B|A) 이 3/10 이다. 반면에 비복원추출의 경우는 3/10 * 2/9 으로 표현되는 두 번째 P(B|A) 이 2/9 이다. “두번째에 빨간공이 나오는” 사건이란 A의 결과에 영향을 받는 것일까 아닐까? P(B) 는 무엇일까?
혼란을 피하기 위해서는 표본공간을 다시 정의할 필요가 있다. 즉, 두번의 시행을 모두 표현하는 것이다. {(검, 빨), (검, 검), (빨, 검), (빨, 빨)} 처럼 말이다.
따라서 복원추출의 경우는
첫번째 시행에 빨간공이 나오는 사건 A 는 {(빨, 검), (빨, 빨)} 이 되고,
P(A) = 3/10*7/10 + 3/10*3/10 = 3/10 이다.
두번째 시행에 빨간공이 나오는 사건 B 는 {(검, 빨), (빨, 빨)} 이 되고,
P(B) = 7/10*3/10 + 3/10*3/10 = 3/10 이다.
반면 비복원추출의 경우는
첫번째 시행에 빨간공이 나오는 사건 A 는 {(빨, 검), (빨, 빨)} 이 되고,
P(A) = 3/10*7/9 + 3/10*2/9 = 3/10 이다.
두번째 시행에 빨간공이 나오는 사건 B 는 {(검, 빨), (빨, 빨)} 이 되고,
P(B) = 7/10*3/9 + 3/10*2/9 = 3/10 이다.
사건의 독립을 증명하려면 P(B|A) = P(B) 임을 증명하면 되는데,
이는 P(B|A) = \dfrac {P(B \cap A)}{P(A)} 인데,
P(B \cap A) 는 첫 번째 시행에서 빨간공이 나오고 두번째 시행에서도 빨간공이 나오는 사건이므로
- 복원추출 : {(빨, 빨)} = 3/10*3/10
- 비복원추출 : {(빨, 빨)} = 3/10*2/9
따라서
1. 복원추출 : P(B|A) = \dfrac{P(B \cap A)}{P(A)}= \dfrac{\dfrac{9}{100}}{\dfrac{3}{10}} = \dfrac{3}{10} = P(B)
2. 비복원추출 : P(B|A) = \dfrac{P(B \cap A)}{P(A)}= \dfrac{\dfrac{6}{90}}{\dfrac{3}{10}} =\dfrac{2}{9} ≠ P(B)
즉, 복원추출에서는 사건의 독립이 성립하지만, 비복원추출에서는 성립하지 않는 것을 확인할 수 있다. 이 부분을 설명하지 않고 P(A) = P(B) = 3/10 이고, 복원 추출의 경우 P(B|A) = P(B) 로 등호를 놓게되면 상당히 혼란스럽게 된다. 따라서 이 상자에서 공을 뽑은 예제를 독립사건을 설명하는데는 적합하지 않아 보인다.
한 가지 이미 눈치 챈 분들도 있겠지만 위에 놀라운 사실을 방금 발견했을텐데, 복원추출과 비 복원 추출모두 “두번째에 빨간공이 나오는 사건 B”의 확률이 3/10 으로 같다는데 있다. (첫번째에 빨간공이 나오는 사건 A의 확률도 동일하다)
이 문제는 나도 구글링하다가 다른 강의노트에서 발견했는데 풀이하자면 다음과 같다.
비복원추출 문제
공이 총 N개 있는 상자에서 m 개 빨간공이 있다고 했을 때 비복원추출한다고 하자. 사건A 를 “첫번째 공이 빨간공일 사건”, 사건B를 “두번째 공이 빨간공일 사건” 이라고 가정한다. 어떤 사람들은 P(B) 가 P(A) 와 당연히 같을 거라고 생각한다. 하지만 다른 이들은 과연 이게 같을까 하는 의구심을 갖게 마련이다. Total Probability 정리(*) 에 의해서
P(A) = \dfrac {m}{N} \,\,\,\,\, P(A^C) = \dfrac {N-m}{N}P(B|A) = \dfrac {m-1}{N-1} \,\,\,\,\, P(B|A^C) = \dfrac {m}{N-1}
따라서,
P(B)= P(A) \times P(B|A) + P(A^C) \times P(B|A^C)=\dfrac {m}{N} \times \dfrac {m-1}{N-1}+ \dfrac {N-m}{N} \times \dfrac {m}{N-1}
= \dfrac {m}{N(N-1)} [m-1+N-m]
= \dfrac {m(N-1)}{N(N-1)}= \dfrac {m}{N}
(*) P(A)=P(A \cap B)+P(A \cap B^C)
비복원 추출의 경우에도 P(B) = m/N 임을 보일 수 있다니 놀랍지 않은가?
에? 비복원 추출에서 처음 빨간공을 뽑으면 당연히 두번째에도 빨간공 뽑을 확률에 영향을 주는거 아닌가요? 독립사건이 아닌건 당연한데 이게 왜 적절하지 않다는건지 모르겠네요 비복원추출이랑 헷갈릴수도 있으니까 예시로 들지 말라는건가
네, 문제는 그러한 직관이 실제로는 그렇지 않기 때문입니다. 일단 사건 A 를 첫번째 뽑은 공이 빨간공일 경우, 사건 B를 두번째 뽑은 공이 빨간공일 경우라고 한다면, 직관으로는 비복원추출의 경우 P(A) 와 P(B) 가 다를거 같지만 실제로는 같습니다. (블로그 내용에 나와 있습니다.) 독립사건이라고 확률적으로 정의하기 위해서는 사건(Event)를 정의해야 하는데, 일단 사건을 제대로 정의하는것 조차 쉽지가 않습니다. (역시, 블로그에 적었습니다.)
사건을 잘 정의한 뒤에 사건의 독립을 보이려면 결국 P(B|A) (‘A가 일어난 뒤 B가 일어날 확률’) 가 P(B) 와 같다는 것을 증명해야 하는데, 실제로 이를 상자에서 비복원 추출 공뽑기 예제로 증명하려면 본문과 같이 복잡한 과정을 거쳐야 합니다.
하지만 제가 처음에 학교에서 배울 때에도 이러한 접근을 하는 경우는 보지 못했고, 대부분의 학생들이 이렇게까지 엄밀하게 증명하지는 않을 것이기 때문에 독립사건을 설명하기 위해서 비복원 추출 공뽑기를 인용하는 것이 적절하지 않다고 제목을 적었습니다. 오히려 주사위를 던져서 3의 배수가 나오는 사건을 A, 짝수가 나오는 사건을 B 라고 했을 때 사건 A 와 B를 독립인가? 이런식의 예제가 훨씬 도움이 된다고 생각합니다.
답변이 좀 이상한데? 비복원 추출일 때 첫번째 빨간공뽑는거랑 두번째 빨간공뽑는건 독립이 아닌게 맞잖아요? 본글도 그렇게 나와 있구요
사건 A : 첫번째 빨간공, 사건 B : 두번째 빨간공이라 할 때 두사건이 독립이려면
P(A)=P(A|B) 여야 하는데 다르다고 나와있는데요? 여기서 왜 P(A)와 P(B)를 비교하시는지?
제 의도는 이렇습니다. 비복원추출이 종속사건임을 가정하고 P(B|A) (첫번째 빨간공일 때, 두번째도 빨간공인 확률) 를 계산하는 것은 쉽습니다.
하지만 P(B|A) ≠ P(B) 또는 P(A∩B) = P(A)*P(B) 를 증명하는 것은 쉽지 않기 때문에 적절하지 않다고 말씀드린 것입니다.
P(A) 와 P(B) 를 직접 계산해야지만, 사건이 독립이 아님을 증명하게 되는데 그럼 표본공간의 정의부터 정확히해야 가능한데 이를 중학교에서 처음 확률을
배우는 학생들에게 다 알려주지 않으면서 무리하게 독립의 개념까지 끌어 들이는 것은 적절치 않다고 보기 때문입니다.
사건의 독립은 기계적으로 P(A∩B) = P(A)*P(B) 이기만 하면 되기에, 이를 보여줄 수 있는 예제가 적절한데, 공뽑기 예제는 P(A), P(B) 를 계산하기 위한
표본공간을 정확히 제시해야 하고 또 그 계산도 선행되어야 하기 때문에 어렵다고 생각됩니다. 따라서 주사위 예제가 사건의 독립을 증명하기도 더 쉽기에 적절한 예로
부연한 것입니다.
안녕하세요! 확률 문제를 고민하다가 선생님 글을 읽게 되었어요~. 괜찮으시면 해결에 도움을 주실 수 있을까요??
문제는 “내 친구 지민이가 서로 다른 4개의 음료 중 하나를 마셨다. 지민이가 마신 음료를 맞추면 게임은 끝난다. 이때 4번만에 정답을 맞출 확률은?” 입니다.
비복원추출로 3/4*2/3*2/1 = 1/4 인거 같긴한데.. 이런 확률 계산의 원리가 정확히 이해되지 않네요.
경우의 수의 비율로 계산해서 3!/4! = 1/4 인가 싶다가도 첫번째 시행에서 게임이 끝난 경우와 두번째 시행에서 게임이 끝난 경우의 가능성이 동등하다고 봐야되나?? 라는 생각이 들어서 아리송해요 ㅜㅜ
늦게 확인을 해서 이제서야 봤네요.
일단 문제가 좀 애매한 부분이 있네요. 지민이가 마신 음료가 무엇인지 서로 다른 4개 중에서 골라야 하는 문제인데요.
단순히 첫 번째에 맞출 확률은 1/4 이겠죠?
근데 4번 만에 맞출 확률에서 하나를 고르면 고른건 배제 된다면, 4번만에 맞출 확률은 100% 이겠네요. (사실 3번만 골라도 100% 이지요)
아마도 고른게 무엇인지 모르고 다시 Black-Box 에 집어 넣게 되었을 때를 말하는거 같은데요.
A, B, C, D 4개의 음료수가 있다고 하고 D 가 지민이가 마신 거라고 가정을 하겠습니다.
사건 (Event) 를 4회 동안에 고른 음료수 집합이라고 한다면,
(A, A, A, A)
(A, A, A, B)
…
(B, A, A, A)
(B, A, A, B)
…
(D, D, D, D)
1. 사건의 경우의 수를 생각해 보자.
이런식으로 4*4*4*4 = 256 개의 사건의 집합이 생긴다. 여기서 한번이라도 D 가 나오면 4회 이내에 맞춘 셈이 되니까
D 가 들어있는 조합을 찾으면
첫번째 D가 들어가 있는 경우의 수 1*4*4*4
첫번째 D가 없고, 두번째 D가 들어가 있는 경우의 수 3*1*4*4
첫번째와 두번째 D가 없고, 세번째 D가 들어가 있는 경우의 수 3*3*1*4
첫번재와 두번째, 세번째 모두 D가 없고 마지막만 D가 있는 경우의 수 3*3*3*1
이를 모두 더하면 64+48+36+27 = 175
즉, 4번만에 지민이가 들어간 음료수를 찾을 확률은 175/256 이 된다.
2. 위와 같은 사건 집합에서 다른 방식으로 경우의 수를 따져보자.
D 가 하나인 사건의 경우의 수
(D, X, X, X)
(X, D, X, X)
(X, X, D, X)
(X, X, X, D)
총 4가지 이며 각각 X 는 임의의 (A,B,C) 이므로 4*3*3*3
D 가 두개인 사건의 경우의 수
(D, D, X, X)
(D, X, D, X)
(D, X, X, D)
(X, D, D, X)
(X, D, X, D)
(X, X, D, D)
총 6가지 이므로, 6*3*3
D 가 세개인 사건의 경우의 수
(D, D, D, X)
(D, D, X, D)
(D, X, D, D)
(X, D, D, D)
총 4가지 이므로, 4*3
D 가 네개인 사건의 경우의 수
(D, D, D, D)
총 1가지 이므로 1
모두 더하면 108+54+12+1 = 175, 위와 같은 경우의 수 인걸 알 수 있다.
3. 첫번째, 두번째, 세번째, 마지막 네번째에서 D 가 결정될 확률을 모두 합해보자.
1) 첫번째에서 D 가 나올 확률, 1/4
2) 두번째에서 D 가 나올 확률, 3/4*1/4
3) 세번째에서 D 가 나올 확률, 3/4*3/4*1/4
4) 네번째에서 D 가 나올 확률, 3/4*3/4*3/4*1/4
1/4 로 묶으면 1/4 * (1 + 3/4 + 3/4*3/4 + 3/4*3/4*3/4) = 1/4 * 1/(4*4*4) * (4*4*4 + 3*4*4 3*3*4 + 3*3*3) = 1/(4*4*4*4) * (175) = 175/256
결국 3가지 방법 모두 같은 확률이 나오는 것을 알 수 있습니다.