Codeπ

Continuous Probability Distributions 본문

Coding/확률통계

Continuous Probability Distributions

수코일지 2024. 3. 28. 11:55

3.3 Continuous Probability Distributions

Discrete - 이산, 샘플 공간이 유한하거나 셀 수 있는 무한의 가능성, 결과값이 유한
Continuous - 연속, 샘플공간이 셀 수 없이 무한한 가능성, 결과값이 사람에 따라 다르게 나오거나 무한

Probability mass function (p.m.f)) - 확률 질량 함수, discrete한 랜덤 변수에 대한 확률을 정의, 특정 값과 정확히 일치하는 이산 랜덤 변수의 확률 제공
Probability density function (p.d.f) - 확률 밀도 함수, continuous 한 랜덤 변수에 대한 확률을 정의, 쥬주어진 범위 내 에서 랜덤 변수가 특정한 값을 취할 상대적 가능성 지정
- f(x)로표기, 실수 집합 R에 정의된다.
- PDF 를 구하는 공식 
1) 적분을 이용 : continuous random variable X의 pdf = f(x)로 가정, 구간 [a,b]에서 X가 특정 구간에 속할 확률 


2) 미분을 이용 : pdf f(x)를 미분하여 얻을 수 있는 cdf (cumulative distribution Function)F(x)를 사용하여 특정구간에서의 확률 계산 

이때, F(x)는 X의 CDF이며, F(x) = ∫[−∞, x] f(t) dt 입니다.

 

Continuous random variable일 때는 정확히 그 값들 중 하나를 취할 확률 0.
-> 해당 구간에 속하는 값 하나를 정확히 취할 확률도 0. But, discrete 할때는 예외이니 주의 해야함!

 


3.4 Joint Probability Distributions (결합확률분포)

Joint Probability Distribution (결합확률분포) - 두 개의 확률 변수 X와 Y가 동시에 발생할 확률 분포. 모든 값의 쌍 (x,y) 에 대해 f(x,y)로 표현된다. 이것이 X와 Y의 결합확률분포! 즉, 동시에 특정값 x, y 를 가질 확률을 나타냄

Joint Density Function (결합확률밀도함수) - X와 Y가 연속확률변수 일때,  joint density function은 xy 평면 위에 놓인 표면을 나타냄. x와 y에 대해서 적분을 두번 해준다.

Marginal Probability Distribution (주변확률분포, 한계확률분포) - 두 개의 결합 분포된 확률변수 X와 Y의 경우, X의 주변분포는 Y에 관한 정보를 무시하고 X에 대한 확률분포를 나타냄. X의 주변 분포는 Y의 모든 값에 대해 f(x,y)를 합산한 것.

discrete한 경우와 continuous 한 경우로 나뉜다

Conditional Distribution (조건부 분포) - 한 확률 변수가 특정 조건 아래에서 다른 확률 변수에 대한 확률분포를 나타냄.
1) discrete : P(Y = y | X = x) = P(X=x, yY=y) / P(X=x)
P(a < X <b | Y = y) = a<x<b인 부분에서 시그마를 이용해 다 더해준다 f(x|y)를
2) continuous : f(y|x) = f(x,y) / fx(x)
f(x|y)를 a와 b사이에서 적분을 해준다

Statistical Independent (통계적 독립) - f(x,y) = g(x)h(y) 를 만족할때, 하나의 변수값이 다른 변수의 값과 아무런 관련이 없다