Statistics and Probability2012. 6. 26. 14:17
반응형

확률분포에서 평균의 개념에 해당되는 것이 기대값입니다. 즉, 확률변수가 취할 수 있는 모든 값들의 평균으로 확률변수가 취할 확률이 가장 높은 값을 의미하죠.

 

기대값은 E(X)로 표현하며 이산확률분포에서 기대값은 다음과 같이 정의할 수 있습니다.

 

 

기대값의 특성으로는

 

1. E(a) = a

2. E(aX) = aE(X)

3. E(X+Y) = E(X) + E(Y)

4. E(X-Y) = E(X) - E(Y)

(X,Y는 확률변수, a는 상수)

 

분포의 흩어짐의 정도를 측정하는 분산은 다음과 같이 정의합니다.

 

분산의 특성으로는

1. Var(a) = 0

2. Var(aX) = a^2 Var(X)

3. Var(X+a) = Var(X)

4. If X and Y are idd, Var(X+Y) = Var(X) + Var(Y) and Var(X-Y) = Var(X) - Var(Y)

 

 

728x90
반응형
Posted by Gun들지마
Statistics and Probability2012. 6. 26. 14:04
반응형

확률 변수 (Random variable)은 임의 적인 실험에서 일정한 확률을 가지고 발생하는 결과에 실수값을 부여하는 변수를 말합니다. 주로 X,Y,Z 같은 영문 대문자로 표현합니다.

 

이 확률 변수는 확률변수가 취할 수 있는 실수값의 수를 셀 수 있는 이산(discrete)확률변수와 셀 수 없는 연속(continuous)확률 변수로 구분됩니다.

예를 들어 핸드폰 100개중 불량품의 갯수는 이산 확률 변수 겠지요. 반대로 평균적으로 버스를 기다리는 시간 은 연속 확률 변수라고 할 수 있습니다. 취할 수 있는 실수값의 수가 셀 수 없이 무한하니깐요. 이때는 주로 실수값이 정확한 수치 보다는 특정 구간 전체로 나타냅니다.

 

이어서, 어떤 확률변수가 취할 수 있는 모든 가능한 값들에 대응하는 확률을 모두 표시하는 것을 확률분포(probability distribution)이라 하고, 이것을 함수로 나타낸 것을 확률함수(probability function)이라고 합니다.

 

 

728x90
반응형
Posted by Gun들지마
Statistics and Probability2012. 6. 26. 12:22
반응형

베이즈 정리 (Bayes theorem)은 사전적 확률(prior probability) 정보를 이용해서 사후적확률 (posterior probability) 정보를 예측하는 이론입니다. 그 반대인 사후적 확률을 이용해 사전적 확률을 구할 수도 있겠죠.

 

간단히 정리하면,

 

로 나타낼 수 있습니다.

 

예를 들어서 한 회사의 핸드폰이 불량일 확률 (A)이 0.1%라고 가정하고, 불량 중에 배터리 오작동(B)일 경우에는 40%라고 가정해봅시다.

 

수식으로 나타낸다면

핸드폰이 불량일 확률 P(A) = 0.001

불량인 가정 하에 배터리 오작동일 경우 P(B|A) = 0.4 가 됩니다.

 

그런데 한 대리점의 핸드폰을 조사해 본 결과 그중 배터리 오작동이 10%가 된다고 한다면,

 

핸드폰이 배터리 오작동을 한 것 중 불량인 경우는 P(A|B) = P(B|A)P(A) / P(B) = 0.4 * 0.001 / 0.1 = 0.4% 가 되는 것이지요.

 

다른 예를 들어볼까요?

한 카지노에서 보통의 주사위를 100개중 95개, 조작된 주사위(숫자6이 계속 나옴)가 100개중 5개라고 합시다. 한 테이블에서 같은 주사위를 5번 던졌는데 6이 5번 다 나왔다면, 어라? 이거 주사위가 조작된거 아니야? 라고 생각하시겠죠? 그럼 실제로, 이 주사위가 조작된 주사위일 확률은 얼마일까요?

 

복잡해 보이지만 차근차근 풀어나가 봅시다.

보통의 주사위를 사용할 확률 P(A) = 0.95

조작된 주사위를 사용할 확률 P(B) = 0.05

보통의 주사위로 6이 5번 나올 확률 P(S|A) = 1/6 * 1/6 * 1/6 * 1/6 * 1/6 = 1/7776

조작된 주사위로 6이 5번 나올 확률 P(S|B) = 1 (무조건 나오겠죠?)

 

그러므로, 6이 5번 나왔을때 조작된 주사위일 확률은

P(B|S) = P(S|B) P(B) / P(A) = 1 * 0.05 / 0.95 = 0.0526316 으로

약 5.3% 정도 되는군요.

흠....... 그러므로 다음에 라스베가스에 갈 때는 계속 진다고 조작된거라고 무작정 의심하면 안되겠군요...^^

 

 

728x90
반응형
Posted by Gun들지마
Statistics and Probability2012. 6. 25. 18:32
반응형

조건부 확률이란 사건 A와 B가 있을때 사건 B가 발생하였다는 가정하에 사건 A가 일어날 확률입니다.

 

예를 들어,

A: 내일 소풍을 갈 확률

B: 내일 날씨가 맑을 확률

이라고 할때 내일 날씨가 맑다는 전제하에 내일 소풍을 갈 확률을 얘기하는것 입니다.

 

이것을 수식으로 쓰면,

 

이고 여기서 P(B) 는 공집합이 될수 없습니다.

 

위의 예를 들어보아, 내일 소풍을 갈 확률이 50% 이고, 내일 날씨가 맑을 확률이 70%이며, 날씨가 맑고 소풍을 갈 확률이 40%라고 할때

 

P(A|B)는 0.4 / 0.7 이 되어 약 57.14%가 되는것이지요.

흠...날씨가 맑아도 소풍을 갈 확률이 반보다 조금 넘는군요.

 

위의 공식에서  교집합을 구할 수 가 있는데, 분모를 반대쪽으로 넘기면

 

 

이렇게 되지요.

 

이 공식이 실제로 쓰이는 예제를 들어보면,

한 반에서 아이폰을 가지고 있는 학생의 확률은 60%가 된다고 칩시다. (미국에서 실제로 더 가지고 있는 듯 해요 ㅋ)

그리고 아이폰을 가지고 있으면 노트북을 가지고 있을 확률은 80%가 된다고 하면, 아이폰과 노트북을 두개다 가지고 있는 학생은 얼마가 될까요?

 

간단히 0.6 곱하기 0.8을 하면 48%는 노트북과 아이폰을 둘다 가지고 있는것이지요.

728x90
반응형
Posted by Gun들지마
Statistics and Probability2012. 6. 25. 18:21
반응형

리서치 프로젝트를 진행하다보니 제 리서치가 확률과 통계를 아주 많이 쓰고 있었습니다.

아...이럴줄 알았으면 학부때 통계학 수업좀 제대로 들어놓을껄...ㅡㅜ

그냥 A 받는데 급급해서 숙제만하고 시험예상문제만 풀었더니 여기서 발목을 잡네요.

 

이카테고리는 제가 확률과 통계를 공부하면서 개인적으로 정리하거나 설명이 필요한 부분을 써놓은 카테고리 입니다.

 

728x90
반응형
Posted by Gun들지마