1. 표본분포
: 일반적으로 모집단이 매우 큼으로 모집단의 일부인 표본을 추출하여 모집단의 특성을 예측함
-모집단 : 우리의 관심대상이 되는 전체 집단(유한 또는 무한)
-표본 : 모집단에서 추출된 모집단의 일부(모집단의 성질을 추측할 수 있는 통계 자료)
모수는 모집단의 특성을 나타내는 값이며, 통계량은 표본의 특성을 나타내는 값이다.
표본의 정보를 이용하여 모집단의 특성을 예측할 때 오차가 발생한다.
-오차 : 표본에서 얻은 특성치와 모집단의 특성치와의 차이
2. 오차
: 오차는 표본 오차와 비표본 오차로 구분되며, 표본 오차 중 우연 오차는 올바른 표본 추출 방법으로 줄일 수 있다.
-표본오차 : 모집단을 대표할 수 있도록 표본을 선택하지 못했기 때문에 발생하는 오차
1) 우연오차 : 우연히 이상한 데이터들만 표본으로 취했을 때 발생, 여러가지 통제 불가능한 요인으로 인해 우연히 발생
→ 표본크기를 늘림으로 줄일 수 있다.
2) 편의(bias) : 표본을 랜덤하게 추출하지 않기 때문에 발생, 데이터의 수를 크게 하여도 줄일 수 없다. 편의 된 결과에 대해 거짓된 확산만 커진다.
→ 표본추출 방법을 교정해야 한다.
-비표본오차 : 표본 오차 이외의 오차이며, 측정오차가 대부분으로 관측방법의 부정확으로 발생한다.
3. 표본추출방법
: 표본추출방법에는 단순임의추출법, 층화입의추출법, 계통추출법, 집락추출법이 있음
-단순임의추출법(simple random smapling) : 모집단에 있는 개개의 표본들이 뽑혀질 수 있는 확률이 같도록 우연히 뽑아 내는 것, 모집단이 균일하다고 가정할 수 있는 경우에 사용
-층화임의추출법(stratified random sampling) : 모집단이 서로 이질적인 원소들로 구성되어 있을 떄, 서로 겹치지 않는 동질적인 그룹들로 구분하고, 각 층에서 단순임의추출법을 시행하여 표본을 추출하는 방법
-계통추출법(systematic sampling) : 표본을 추출하고자 하는 모집단이 너무 커서 난수표를 통한 단순임의 추출법을 시행하기 곤란한 경우 모집단의 구성이 랜덤함을 가정하고 일정 간격으로 표본을 추출하는 방법
-집락추출법(cluster sampling) : 모집단이 여러 개의 집단이 결합된 형태로 구성되어 있고, 각 집단 내부에서 구성원소들에게 일련번호를 부여할 수 있는 경우, 각 집단을 임의로 추출하여 전수 조사하거나 추출된 집단으로부터 일정 수의 구성원소를 임의로 추출하는 방법
'통계' 카테고리의 다른 글
[식스시그마] 데이터 분석 기초 - 추론통계학 (0) | 2023.07.09 |
---|---|
[식스시그마] 데이터 분석 기초 - 표본분포&표본추출2 (0) | 2023.07.08 |
[식스시그마] 데이터 분석 기초 - 확률분포 (0) | 2023.07.06 |
[식스시그마] 데이터 분석 기초 - 기술 통계학 (0) | 2023.07.05 |
[식스시그마] 데이터 분석 기초 - 통계학 개요 (0) | 2023.07.04 |