조건부확률의 개념 (고등학교 과정)

조건부확률, 확률의 독립과 종속의 개념은 한 번 이해하고 나면 어렵지 않은 개념이다. 하지만 한 번 이해가 되지 않으면 정의를 아무리 여러 번 읽어도 이해하기가 어려운 개념이기도 하다. 여기서는 표를 이용하여 이들 개념을 살펴보자.

사건 \(X\)가 일어났다는 가정 아래에서 사건 \(A\)가 일어날 확률을 ‘사건 \(X\)가 일어났을 때의 사건 \(A\)의 조건부확률’이라고 부르고, 기호로 \(\mathrm{P}(A \,\vert\, X)\)로 나타낸다. (물론 \(\mathrm{P}(A \,\vert\, X)\)는 \(\mathrm{P}(X) > 0\)일 때에만 정의된다.) 조건부확률 \(\mathrm{P}(A \,\vert\, X)\)는 다음과 같은 식으로 계산한다. \[\mathrm{P}(A \,\vert\, X) = \frac{\mathrm{P}(A \cap X)}{\mathrm{P}(X)}.\] 지금부터 위와 같은 공식이 어떻게 나왔는지 예를 통해 살펴보자.

이슬비는 고등학교 2학년 학생이다. 이슬비네 학교 2학년 3개 학급(\(X\), \(Y\), \(Z\)) 100명의 학생을 대상으로 음식의 호불호에 대한 조사를 하였다. 조사한 음식은 오이와 달걀이다.

먼저 오이의 호불호를 조사한 결과는 다음 표와 같다. (단위 : 명)

 1반 (\(X\))2반 (\(Y\))3반 (\(Z\))합계
오이를 좋아함 (\(A\))3092160
오이를 좋아하지 않음 (\(A^C\))1021940
합계403030100

물론, 어떤 음식을 ‘좋아한다’ 또는 ‘좋아하지 않는다’라고 이분법적으로만 구분할 수는 없지만, 여기서는 조건부 확률의 개념을 이해하기 위한 가상의 상황이므로 그렇다고 해두자. (실제로는 리커트 척도 같은 조사 도구를 이용해야 한다.)

전체 학생 100명 중 임의로 한 명을 택했을 때 그 학생이 1반일 확률은 \[\mathrm{P}(X) = \frac{40}{100} = \frac{2}{5}\] 이다. 다음으로 전체 학생 100명 중 임의로 한 명을 택했을 때 그 학생이 오이를 좋아할 확률은 \[\mathrm{P}(A) = \frac{60}{100} = \frac{3}{5}\] 이다. 또한 전체 학생 100명 중 임의로 한 명을 택했을 때 그 학생이 오이를 좋아하는 1반일 확률은 \[\mathrm{P}(A \cap X) = \frac{30}{100} = \frac{3}{10}\] 이다.

그렇다면 ‘1반 학생 중 한 명을 택했을 때 그 학생이 오이를 좋아할 확률’은 얼마일까? 1반 학생은 40명(\(X\))이고, 그 40명 중에서 오이를 좋아하는 학생은 30명(\(A \cap X\))이므로 구하는 확률은 \[\mathrm{P}(A \,\vert\, X) = \frac{30}{40} = \frac{3}{4} \] 이다. 그런데 \[\frac{30}{40} = \frac{\left( \frac{30}{100} \right)}{\left( \frac{40}{100} \right)} = \frac{\mathrm{P}(A \cap X)}{\mathrm{P}(X)}\] 이므로, 결국 \[\mathrm{P}(A \,\vert\, X) = \frac{\mathrm{P}(A \cap X)}{\mathrm{P}(X)}\] 가 성립함을 알 수 있다.

표의 자료를 바탕으로, 각 반별로 오이를 좋아하는 학생의 비율을 구하면 다음과 같다. \[\text{1반 : }\mathrm{P}(A\,\vert\,X) = \frac{\mathrm{P}(A \cap X)}{\mathrm{P}(X)} = \frac{3}{4},\] \[\text{2반 : }\mathrm{P}(A\,\vert\,Y) = \frac{\mathrm{P}(A \cap Y)}{\mathrm{P}(Y)} = \frac{3}{10},\] \[\text{3반 : }\mathrm{P}(A\,\vert\,Z) = \frac{\mathrm{P}(A \cap Z)}{\mathrm{P}(Z)} = \frac{7}{10}\] 각 학급별로 오이를 좋아하는 학생의 비율이 다르다. 즉 학생을 한 명 택했을 때 그 학생이 오이를 좋아할 확률은 반별로 다르다. 이것은 ‘어느 학급을 조사 대상으로 삼느냐에 따라 오이를 좋아하는 비율은 다르게 나온다’를 뜻한다. 이와 같이 \[\mathrm{P}(A) \neq \mathrm{P}(A \,\vert\,X)\] 일 때 ‘두 사건 \(A\)와 \(X\)는 서로 종속이다’라고 말한다.

이번에는 달걀의 호불호를 조사한 다음 표를 살펴보자. (단위 : 명)

 1반 (\(X\))2반 (\(Y\))3반 (\(Z\))합계
달걀을 좋아함 (\(B\))24181860
달걀을 좋아하지 않음 (\(B^C\))16121240
합계403030100

전체 학생 100명 중 달걀을 좋아하는 학생은 60명이므로 \[\mathrm{P}(B) = \frac{60}{100} = \frac{3}{5}\] 이다. 그런데 표를 잘 살펴보면 달걀을 좋아하는 학생의 비율은 어느 학급이나 똑같다. 즉 \[\text{1반 : }\mathrm{P}(B\,\vert\,X) = \frac{24}{40} = \frac{3}{5},\] \[\text{2반 : }\mathrm{P}(B\,\vert\,Y) = \frac{18}{30} = \frac{3}{5},\] \[\text{3반 : }\mathrm{P}(B\,\vert\,Z) = \frac{18}{30} = \frac{3}{5}\] 이다. 이것은 ‘어느 학급을 조사 대상으로 삼든 상관 없이 달걀을 좋아하는 학생의 비율은 같게 나온다’를 뜻한다. 이와 같이 \[\mathrm{P}(B) = \mathrm{P}(B\,\vert\,X)\] 일 때 ‘두 사건 \(B\)와 \(X\)는 서로 독립이다’라고 말한다.

사건의 독립과 관련된 성질을 증명할 때에도 표를 이용하면 편리하다. 예컨대 다음 문제를 풀어보자.

표본공간 \(S\)의 두 사건 \(A ,\) \(B\)에 대하여 \(\mathrm{P}(B\,\vert\,A ) = \mathrm{P}(B\,\vert\, A^C )\)일 때, 두 사건 \(A\)와 \(B\)가 서로 독립임을 보여라. (단, \(\mathrm{P}(A) > 0 ,\) \(\mathrm{P}(A^C ) > 0,\) \(\mathrm{P}(B) > 0 \))

사건 \(A,\) \(A^C ,\) \(B,\) \(B^C\)의 확률을 다음과 같은 표로 나타내자.

 \(A\)\(A^C\)
\(B\)\(w\)\(x\)
\(B^C\)\(y\)\(z\)

여기서 \[\begin{eqnarray} \mathrm{P} (A) &=& w+y, \\[6pt] \mathrm{P}(A\,\vert\,B) &=& \frac{w}{x+w} \end{eqnarray}\] 이다. 이제 등식\[x+z = 1-(w+y)\]를 이용하여 문제의 조건을 변형하면 다음을 얻는다. \[\begin{eqnarray} \mathrm{P}(B\,\vert\,A) &=& \mathrm{P}(B\,\vert\,A^C ) \\[6pt] \frac{w}{w+y} &=& \frac{x}{x+z} \\[8pt] w(x+z) &=& x(w+y) \\[8pt] w\left\{ 1-(w+y) \right\} &=& x(w+y) \\[8pt] w-w(w+y) &=& x(w+y) \\[8pt] w &=& (x+w)(w+y) \\[6pt] (w+y) &=& \frac{w}{x+w} \\[6pt] \mathrm{P}(A) &=& \mathrm{P}(A\,\vert\, B) \end{eqnarray}\] 따라서 두 사건 \(A\)와 \(B\)는 독립이다.