1. 확률분포란?
:세상에서 일어나는 모든 일은 수학적인 관점에서 모두 확률로 표현될 수 있는데, 이러한 사건들이 일어날 가능성을 분포형태로 표현한 것을 확률분포라 함
:확률변수가 취할 수 있는 값들과 그러한 값들을 취할 가능성을 표나 그래프, 함수 등의 형태로 나타낸 것
-확률변수란, 표본공간을 구성하는 각각의 사건에 수치를 부여한 것이다.
예를들어, 주사위를 던져 나타나는 주사위의 눈의 수를 변수 X로 표시하면 X는 확률변수가 되고, 이 확률변수는 1,2,3,4,5,6의 값을 취한다.
-확률분포의 목적으로는 표본으로부터 모집단 구조 파악 및 관심사건의 확률 계산이다.
1) 이산확률분포 : 셀 수 있는 값을 가지는 확률변수로 이루어진 분포 ex) 1시간 동안 매장을 방문한 고객의 수
-이항분포 : 불량률 P인 무한 모집단에서 표본 n개를 랜덤하게 추출 할 때 불량품 개수
a) B(n,p)
b) 이항 분포는 연속된 n번의 독립적 시행에서 각 시행의 확률 p를 가질 때의 이산 확률 분포임.
이러한 시행은 *베르누이 시행이라고 불리기도 함. 사실 n=1일 때 이항 분포는 베르누이 분포임
특정 모 불량률(p)를 갖는 무한모집단으로부터 추출된 단위 표본(n) 중 불량품 수
c) 평균 : np , 분산 : np(1-p)
d) 확률 p가 작고 시행 횟수(n)가 많아지면, 이항확률분포는 대칭에 가까워 진다.
np>=5, n(1-p)>=5일 때 정규분포에 근사하게 됨
*베르누이 시행 : 1번 실험에서 2가지 사건(성공,실패)만 일어나는 실험
-포아송분포 : 단위시간이나 공간에서 어느 사건의 출현 횟수를 알고 싶을 때 사용
a) 포아송분포는 일정한 단위(시간,면적,길이) 안에 어떤 사건이 몇번 발생할 것인지를 표현하는 이산 확률 분포임
일정한 단위 내에 발생하는 특정 결점의 빈도 수
b) 이항분포의 포아송 분포 근사 : n이 크고, p가 매우 작은 경우, 포아송 분포는 이항분포의 근사 확률을 제공한다.
(이때 np=λ를 가정)
c) 평균 = λ, 분산 =λ
2)연속확률분포 : 연속적인 특성의 값을 가지는 확률변수로 이루어진 분포 ex) 가구당 연평균 소득,체중, 키 등
어떤 구간에 속한 모든 점에서 연속적으로 확률값을 취할 수 있는 분포임
-정규분포 : 평균을 중앙으로 하여 좌우 대칭인 종 모양의 분포
a) N(u,σ2)
b) 좌우대칭과 종형의 형태를 갖는 연속형 측정 값
c) 표준정규분포란 정규분포의 모수인 평균이 0, 그리고 분산이 1로 표준화된 분포를 말한다.
d) 표준정규분포는 평균과 분산이 서로 다르거나, 측정 단위가 다른 분포에서 수집된 데이터를 상대적으로 비교할때 유용
-표준정규분포(Z분포) : 평균 0 , 분산 1로 표준화된 분포 그 외 t분포, F분포 등이 있음
표준정규분포를 활용하면 Z값을 통해 확률 값을, 혹은 확률값을 통해 Z값을 구할 수 있다
'통계' 카테고리의 다른 글
[식스시그마] 데이터 분석 기초 - 표본분포&표본추출2 (0) | 2023.07.08 |
---|---|
[식스시그마] 데이터 분석 기초 - 표본분포&표본추출 (0) | 2023.07.08 |
[식스시그마] 데이터 분석 기초 - 기술 통계학 (0) | 2023.07.05 |
[식스시그마] 데이터 분석 기초 - 통계학 개요 (0) | 2023.07.04 |
[식스시그마] 식스시그마 의의 - 식스시그마 목표 (0) | 2023.07.03 |