통계

확률변수, 확률분포, 확률밀도함수, 확률분포종류, 확률분포별 분산, 표준편차

경희대생 2023. 2. 4. 01:05

 

확률분포 (Probability Distribution) ? 

확률분포란 어떤 시행 (experiment)에서 확률변수 X가 특정한 값을 가질 확률을 나타내는 함수

 

확률변수의 값 (X) -> 확률 (Y)

 

 

확률변수 (X)의 종류 

 

1. 이산확률변수 : 셀수있는 변수 (주사위던지기, 동전던지기, 점수 등 실제로 나타낼 수 있는 변수들)

2. 연속확률변수 : 셀수없는 변수 (시간)

3. 이산균등분포 : 확률변수가 갖는 확률이 모두 동일한 확률분포 

 

 

 

 

확률질량함수 (Probability Mass Function ; PMF) 

 

이산확률변수의 확률분포를 나타내는 함수

 

 

 

 

 

확률밀도함수 (Probability Density Function ; PDF)

 

연속활률변수의 확률분포를 나타내는 함수 

 

연속확률변수 X의 확률밀도함수 

는 다음과 같은 성질을 같는다.

 

 

 

 

 

[동전던지기 ; 이산형 변수]

 

확률변수 (X = xi)  (앞, 앞) (앞, 뒤) (뒤, 앞) (뒤, 뒤)
표본개수 5 4 3 2
확률 P (X = xi) 5/10 (p1) 4/10 (p2) 3/10 (p3) 2/10 (p4)
확률질량함수                                                           P(X = xi) = Pi = 6 - i / 10  

 

[포트폴리오 return ; 연속형 변수] 

확률변수 (X = xi)  -10% ~ -5% -5% ~ 0% 0% ~ 5% 5% ~ 10%
표본개수 5 4 3 2
확률 P (X = xi) 5/10 (p1) 4/10 (p2) 3/10 (p3) 2/10 (p4)
확률밀도함수                                                           P(X = xi) = Pi = 6 - i / 10  

 

 

[이산균등분포] 

확률변수 (X = xi)  case1 cas2 case3 case4
표본개수 5 5 5 5
확률 P (X = xi) 5/20 (p1) 5/20  (p2) 5/20  (p3) 5/20  (p4)
확률질량함수                                                           P(X = xi) = Pi = 1 / n (4)

 


베르누이분포

어떤 시행을 1번 행했을 때 결과가 2개 (베르누이 시행)으로 나뉘어짐 ; 결과 O / X

ex) 동전 한 개 던 짐 -> 앞 (p) / 뒤 (1-p)

ex) 공장 생산 제품 -> 합격품 (p) / 불량품 (1-p)

 


이항분포

사건 A의 확률이 p인 베르누이시행을 n번 반복 (독립시행)

사건 A가 나타나는 횟수 : 확률변수 X

 

예시) 

 

한 개의 주사위를 던졌을 때 소수 (2, 3, 5)의 눈이 나올 확률 -> p = 1/2, 1-p = 1/2

 

한 개의 주사위를 4회 던져서 소수의 눈이 2번 나올 확률 

 

확률질량함수 : P (X = x) = f(x) = nCx P^(x) (1-P)^(n-x)

 

P ( X =2 ) f(2) = 4C2 (1/2)^2 (1/2)^2 = 3/8 

 

 


포와송 분포 

 

이항분포에서 독립시행 n을 무한대로 시행했을 때, 포와송 분포가 됨 

 

불규칙하고 비교적 드물게 발생하는 사건을 모델할때 대표적인 함수 

ex) 하루에 고장난 제품의 수

ex) 하루 동안 일어나는 출생사 또는 사망자 수 

 

-> 일정한 '시간' 또는 '공간'에서 일어나는 발생횟수 

 


이산확률변수와 연속확률변수의 기댓값 및 분산 

 


이항분포/ 베르누이분포의 기댓값 및 분산 

 


포와송분포의 기댓값 및 분산

 

 


정규분포 

:연속확률분포의 한 종류 

 

정규분포 곡선의 성질 

1. 임의의 실수 x에 대해 f(x) > 0

2. 곡선은 직선 x=m에 대해 선대칭 

3. 곡선과 x축 사이의 넓이는 1

 

 

 

정규분포 누적분포함수 (cumulative distribution function; CDF)

    -> 주어진 확률 변수가 특정 값보다 작거나 같은 확률을 나타내는 함수

 

 

정규분포와 확률

 

 

확률변수 x가 위의 범위안에 들어올 확률이 각각 0.6826, 0.9544, 0.9974 임을 나타냄 

 


표준정규분포

 

 

표준정규분포 확률분포 특성