1. 통계학 개요
표본으로부터 모집단의 특성을 설명하는 방법으로 기술통계학과 추론통계학이 있음
-기술통계학 : 수집된 자료를 그래프로 표현하고 산포나 평균과 같이 필요한 정보를 계산하여 자료를 수집/정리/요약하는 이론과 방법
-추론통계학 : 표본에서 얻은 정보를 이용하여 모집단에 대한 정보를 예측하고 불확실한 사실에 대한 결론을 이끌어 내는데 필요한 이론과 방법
2. 측정 척도와 데이터 유형
측정하는 방식에 따라 명목척도, 순위척도,구간척도,비율척도로 구분되며 분석 특성에 따라 연속형 데이터, 이산형 데이터로 구분함
동일한 데이터 수를 수집할 때 연속형 데이터는 이산형 데이터보다 의미 있는 정보의 양이 많음
1) 이산형 데이터 : 측정된 데이터의 숫자를 세어서 얻은 특성치 값, 데이터의 분해가 불가능
-명목척도 : 측정대상의 고유한 특성에 따라 분류할 목적으로, 동일한 특성을 갖는 대상들을 구분하는 척도
ex) 색깔, 남/여, 재료1/재료2/재료3
-순위척도 : 측정대상들의 특성과 다과 또는 대소의 서열에 따라 구분하는 척도
ex) 설문조사만족도, 얼룩수준
2)연속형 데이터 : 연속적으로 측정되는 정량적/계량적 데이터, 데이터의 분해가 가능하고 측정된 숫자의 크기가 의미가 있음
-구간척도 : 측정대상이 가지고 있는 속성의 양적인 정도에 따라 등간격으로 수치를 부여한 것으로, 해당 속성이 전혀 없는 상태인 절대적 원점과 계산된 비율이 의미가 없는 척도
ex) 온도,종합주가지수, Z값 등
-비율척도 : 구간척도와 동일하며 절대적 원점과 비율 계산이 가능한 척도
ex) 시간,길이,무게 등
3) 연속형 데이터와 이산형 데이터 관계
연속형 데이터는 범주화에 의해 이산형 데이터로 변환되지만 이산형 데이터는 연속형 데이터로 변형될 수 없다.
비율데이터는 순서형 데이터, 명목형 데이터로 변환 가능함
이산형 데이터를 이용하여 의미 있는 정보를 얻기 위해서는 연속형 데이터 대비 더 많은 데이터가 필요함.
'통계' 카테고리의 다른 글
[식스시그마] 데이터 분석 기초 - 표본분포&표본추출2 (0) | 2023.07.08 |
---|---|
[식스시그마] 데이터 분석 기초 - 표본분포&표본추출 (0) | 2023.07.08 |
[식스시그마] 데이터 분석 기초 - 확률분포 (0) | 2023.07.06 |
[식스시그마] 데이터 분석 기초 - 기술 통계학 (0) | 2023.07.05 |
[식스시그마] 식스시그마 의의 - 식스시그마 목표 (0) | 2023.07.03 |