배움

[통계학] 5시간 만에 끝나는 통계학 기초강의_메타코드M_이산확률분포

개굴리 2024. 1. 31. 14:37

통계 기초 이론 4강 이산확률분포다.

5시간만에 끝난다니 얼마나 매력적인가..

 

4강 이산확률분포는  약 20분여 길이로 되어 있다.

4.1 이산확률분포 : 이항분포

데이터 분석 실무에 적합한 효율적인 분포 위주로 배우기 때문에, 본 강의에서는
이항, 베르누이, 포아송 분포 중심으로 배우게 된다.

이외의 분포도 알 수 있다.

이항분포

베르누이 분포는 이항 분포의 어머니라고 볼 수 있다.

1. 베르누이 시행 (trial) : 사상이 두 개뿐인 시행(성공 or 실패)
   - 각 시행에서 성공확률과 실패확률의 합은 1
   - 각 시행은 서로 독립
   - 베르누이 시행을 n 번 독립 시행했을 때의 확률 변수 x의 분포는 이항분포이다.
     -> 이항분포 : 베르누이 시행을 반복했을 때의 분포!

이항분포 표 예시

-  이 때, 확률변수 X의 평균(기대값) : p

-  확률변수 X의 분산 : p(1-p)

   * 확률변수값*대응하는 확률값 의 총합
 


2. 이항확률분포  : 베르누이 시행을 반복하여 특정한 횟수의 성공/실패가 나타날 확률

3. 이항확률분포의 확률질량함수(pmf)

이항확률분포의 확률질량함수

 

- n ; 시행횟수, x : 성공 횟수(확률변수 실제 값), p : 성공 확률

- 기댓값 : np

- 분산 : np(1-p)

 

베르누이 시행을 n 번 반복했기 때문에 n을 곱해주면 된다!

 X~B(n, p)

 

 

1. 포아송분포
   - 단위시간, 단위공간 내 발생하는 사건의 횟수를 확률변수 X라고 할 때, X 는 λ 를 모수로 갖는 포아송 분포를 따름
   - 발생빈도가 낮은 사건의 단위 당 발생 수

 

예시) 1분당, 1㎥당 발생하는 사건의 횟수

λ  하나의 모수만 추정

2. 포아송분포의 확률함수

 

  - X : 데이터
   - 기댓값 : λ
   - 분산 : λ

 

여기에 있는 기댓값과 분산을 구하는 공식 또한 유사한데, 결국 풀어서 계산하면 λ 만 나오게 된다.

   

4.2 이산확률분포 : 예제

 

1. 확률변수 X가 베르누이분포를 따를 때, X의 분산이 p(1-p)임을 보여라

X 0 1
P 1-P P

μ

=0*(1-P) + (1*P)

= P

 

 분산 공식 : E(X- μ)^2

= E(X^2) - μ^2 

= P - P^2

=P(1-P)

 

2. 주사위를 5번 던질 때, 4 이상의 눈이 두 번 나올 확률은?

 n = 5

x = 2

p = 1/2

1 2 3 4 5 6
1/6 1/6 1/6 1/6 1/6 1/6

 

위 식에 대입해보면 결과가 나온다.

 

 

3. 동전을 5번 던질 때, 앞면이 나온 횟수를 X라고 하자. 이 때, X의 기댓값과 분산은?

n = 5

X~B(5, 1/2)

p = 1/2

 

기댓값 = np

분산 = np(1-p)

 

4. 1000명의 보험가입자가 있을 때, 한 해에 보험금을 청구할 확률이 1/2000이다.
어떤 해에 보험금이 3회 청구될 확률은?

 

-> 포아송 분포 (단위시간 : 한 해)

X~P(λ)

x = 3

λ = 1000*1/2000 = 0.5

한 해에 0.5명이 보험금을 청구함

 

 

위 공식에 대입하면 결과가 나온다.


이외에 매 통계 강의 뒤에 예제가 있어서 풀어볼 수 있고, 풀이도 알려주셔서 바로 적용해볼 수 있다.

통계 기초 강의 맛보기는 유튜브에서, 강의는 메타코드M 사이트에서 들을 수 있다.

데이터 분야에서는 어떻게 쓰이는지에 대해서도 알려주셔서 이해가 쉬웠다.


https://youtu.be/r7jTwciTdXo?feature=shared

 

https://mcode.co.kr/video/list2?viewMode=view&idx=45

 

메타코드M

빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다.

mcode.co.kr