티스토리 뷰

기술통계 정의

기술통계란 데이터셋의 주요 특징, 패턴, 특징 등을 요약하고 설명하기 위해 사용되는 통계적 기법의 집합을 의미합니다. 데이터의 중심적인 성향, 변동성, 분포 등에 대한 의미 있는 정보를 제공하기 위해 데이터를 구성, 제시, 분석하는 것을 포함합니다. 기술 통계량은 모집단 값이 아닌 표본 값의 분포를 설명하는 데 사용되는 통계량입니다. 데이터를 보거나 그림을 그릴 필요 없이 데이터에 대한 느낌을 얻기 위해 사용됩니다. 참고로, 기술 통계량은 오해를 불러일으킬 수 있으므로 가능하면 항상 데이터를 살펴야 합니다. 기술통계학의 가장 큰 두 범주는 중심적 경향성과 분산성입니다. 중심 성향의 척도는 평균, 중위수, 최빈값(통계), 중위수 등으로 측정을 합니다. 반면 분산 측정은 다음과 같습니다. 범위, 분산 또는 표준 편차, 사분위 간 범위 등을 사용합니다. 즉 기술 통계량은 어떤 식으로든 데이터를 설명하는 정보를 제공합니다. 예를 들어, 애완동물 가게가 고양이, 개, 새, 물고기를 판매한다고 가정해 보겠습니다. 만약 100마리의 애완동물이 판매되고 100마리 중 40마리가 개라면, 판매된 애완동물에 대한 데이터의 한 가지 설명은 40%가 개라는 것입니다. 이와 같은 애완동물 가게는 한 달 동안 매일 판매되는 물고기의 수에 대한 연구를 수행하여 하루에 평균 10마리가 판매되었다고 판단할 수 있습니다. 평균은 기술 통계의 한 예입니다. 또 다른 예를 들어 설명하겠습니다. 만약 어떤 사람이 10년 이상 진료를 받을 때마다 담당 의사가 제 몸무게를 측정했는데, 의사가 제 몸무게가 150파운드 정도 된다고 하면, 현재 몸무게는 10년 동안의 자료와 비교했을 때 평균이라고 하는 것이고, 이 사람의 몸무게 점수의 대부분보다 높거나 낮지도 않으며, 몸무게가 10년 동안의 평균이라고 말하는 것입니다. 이 사람의 몸무게를 최빈값이라고 말한다면, 몸무게가 지난 10년 동안 제가 가장 자주 측정 몸무게라고 말하는 것입니다.

 

기술통계의 주요 목적

기술통계의 주요 목적은 다음과 같습니다. 첫째, 데이터 설명입니다. 기술 통계량을 통해 데이터 집합의 주요 속성을 요약하고 설명할 수 있습니다. 여기에는 평균, 중위수, 모드, 범위 및 표준 편차와 같은 측정값이 포함됩니다. 둘째, 데이터를 시각적으로 표시하기 위함입니다. 기술 통계량에는 히스토그램, 막대 차트, 산점도 및 상자 그림과 같은 그래픽 표현이 포함되는 경우가 많으며, 이는 데이터에 있는 패턴과 관계를 시각적으로 전달하는 데 도움이 됩니다. 셋째, 중심 성향 파악 목적입니다. 기술 통계량은 데이터 집합 내의 일반적이거나 중심적인 값을 이해하는 데 도움이 됩니다. 평균(평균), 중앙값(중간값), 모드(가장 자주 발생하는 값)와 같은 측도는 데이터의 중심 성향에 대한 통찰력을 제공합니다. 넷째, 변동성 조사입니다. 기술 통계량은 데이터의 퍼짐 또는 변동성에 대한 정보도 제공합니다. 범위(최댓값과 최솟값의 차이), 표준 편차 및 분산과 같은 측정값은 데이터 집합의 변동성 정도를 정량화하는 데 도움이 됩니다. 다섯째, 분포 평가를 위함입니다. 기술 통계량은 데이터의 형태와 분포를 나타낼 수 있습니다. 예를 들어 왜도는 데이터 분포의 비대칭성을 측정하고 첨도는 분포의 첨도 또는 평탄도를 측정합니다. 연구원, 분석가 및 의사 결정자는 기술 통계를 사용하여 데이터를 더 잘 이해하고, 패턴 및 추세를 파악하며, 이러한 통계가 제공하는 정보를 바탕으로 정보에 입각한 의사 결정을 내릴 수 있습니다.

 

주의점

기술 통계량은 자료를 요약하고 점수나 자료를 원근감 있게 볼 때 유용합니다. 그들은 우리가 원인이나 관계에 대해 이야기하지 못하게 합니다. 평균이 오해를 불러일으킬 수 있다는 것을 유의해야 합니다. 한 사람은 많은 극단적인 점수를 가질 수 있는데, 평균은 이러한 큰 차이를 완화합니다. 평균 점수는 학생들의 반에서 가장 빈번한 점수일 수 있지만, 그것은 결코 그 반에서 평균 점수가 얼마였는지 말해주지 않습니다. 98점을 받은 사람들이 몇 명 있을 수 있지만, 평균은 65점에 가까울 수 있습니다. 범위는 빈도 곡선, 산포도 또는 막대그래프에 데이터를 표시하는 것이 이러한 경향을 시각적으로 보여주는 데 도움이 됩니다. 따라서 기술 통계량을 확인하고 나서 관련된 추세 그래프나 산포도 등 시각적 자료를 충분히 참고해야 할 것입니다.