1. 표본분포
: 표본으로부터 계산되는 통계량을 확률변수로 하는 분포, 가능한 많은 횟수만큼 뽑은(이론적으로는 무한대) 표본집단들로부터 계산되는 경우
1) 표본평균들의 평균은 모집단 평균과 동일하다.
2) 표본평균들의 산포(분산)은 표본 크기(n)가 커지면 좁아진다.
2. 확률분포와 표본분포의 관계
-확률 분포: 어떤 확률 변수(X)가 취할 수 있는 모든 값들과 이에 대응하는 각각의 확률
-표본 분포: 모집단에서 매 번 추출되는 표본의 통계량이 확률 변수로 되는 확률 분포
1) 표본평균(X-bar)이 확률 변수인 확률 분포 → Z분포, t분포 활용
2) 표본분산(S2)이 확률 변수인 확률 분포 → X2분포, F분포 활용
3, 중심극한의 정리
: 평균이 u이고 표준편차가 σ인 임의의 집단으로부터 크기 n인 표본1, 표본2, 표본3, 표본 ... 무한대로 부터 얻어지는 표본평균의 모집단의 분포 모양과 상관없이 표본 크기 n이 충분히 크면 (n>30) 대략 N(u,σ2/n)과 같은 정규분포를 한다.
→ 이러한 이유로 표본의 평균 혹은 분산을 확률변수로 하는 추리 통계학에서는 분포의 모양과 상관없이 정규 분포의 성질을 이용하여 추정 및 검정을 할 수 있다
4. 표본분포의 표준화
1) 모집단의 분산이 알려진 경우 Z분포를 활용
2) 모집단의 분산을 모르는 경우 t분포를 활용
- Z분포 : 평균이 u이고 분산은 σ2인 정규모집단으로 부터 크기가 n인 확률 분포에 의해 정의되는 표본 평균의 분포는 평균이 u이고 σ2/n인 정규 분포를 따름 → 표준화 한 Z의 분포는 표준 정규분포 N(0,1)을 따름
- t분포 : 집단의 규모가 작을 때 유용한 확률 변수임 모집단이 1개이며, 모집단의 분산(σ2)이 알려져 있지 않은 경우 모평균의 검추정은 표본표준편차(s)로 대체한 t분포 사용 (분포의 모수 : 자유도) t분포는 표준정규분포와 같이 0에서 좌우대칭이지만, 정규분포보다 더 긴 꼬리를 갖는다
→ 자유도가 커짐에 따라, t분포는 Z분포와 같아지기 때문에 n>30인 경우, t분포 대신 Z분포 이용 가능
3) 카이스퀘어 분포(chi-square 분포)
: 모분산의 검추정 또는 범주형 변수의 독립/동질성, 분포의 적합도 검정에 사용, 모집단이 1개인 경우 사용, 분포의 모수는 자유도이며 특징으로는 자유도에 따라 모양이 달라지며 모집단이 정규분포이며, 모분산이 알려져 있어야 한다.
4) F분포
: 두 모분산 비(ratio)의 검추정에 사용, 모집단이 2개인 경우 사용
정규분포이고, 분산이 동일한 두 모집단의 모분산들의 비
두 모집단의 표본 크기(n)가 커지면(자유도>30) 표준정규분포의 형태를 가지며 분포의 모수는 두집단의 자유도이다.
'통계' 카테고리의 다른 글
[식스시그마] 데이터 분석 기초 - 통계적 가설검정 (0) | 2023.07.10 |
---|---|
[식스시그마] 데이터 분석 기초 - 추론통계학 (0) | 2023.07.09 |
[식스시그마] 데이터 분석 기초 - 표본분포&표본추출 (0) | 2023.07.08 |
[식스시그마] 데이터 분석 기초 - 확률분포 (0) | 2023.07.06 |
[식스시그마] 데이터 분석 기초 - 기술 통계학 (0) | 2023.07.05 |