📊 기술통계와 추리통계의 차이: 통계의 두 축을 이해하는 시간
통계는 두 개의 날개를 가지고 있습니다.
하나는 데이터를 요약하고 설명하는 기술통계,
다른 하나는 데이터를 기반으로 예측하고 결정을 내리는 추리통계입니다.
두 통계는 역할도, 사용하는 도구도, 해석하는 방식도 완전히 다릅니다.
하지만 현실에서는 종종 뒤섞여 사용되며, 그 차이가 명확히 인지되지 않곤 하죠.
이 글에서는 두 개념의 뿌리부터 실전 적용까지 정리해보겠습니다.
⸻
1️⃣ 기술통계(Descriptive Statistics): ‘있는 그대로’를 말하다
✔ 정의
기술통계는 관찰된 데이터를 요약하고 정리하는 통계입니다.
데이터의 중심경향성(평균, 중앙값), 산포도(표준편차, 범위), 분포(도수분포표, 히스토그램) 등을 통해
데이터 집합의 전반적인 특성과 패턴을 파악합니다.
✔ 목적
“무슨 일이 있었는가?”
현재 확보한 데이터를 통해 사실을 드러내는 것이 목적입니다.
추측이나 예측은 하지 않습니다.
✔ 사용 도구 예시
• 요약 지표: 평균, 중앙값, 최빈값
• 산포 지표: 범위, 분산, 표준편차, 사분위수
• 시각화: 히스토그램, 박스플롯, 파이차트, 산점도
✔ 실제 활용 예시
• 설문조사 결과에서 평균 응답 점수 구하기
• 시험 성적 분포 시각화
• 쇼핑몰 월별 매출 요약
⸻
2️⃣ 추리통계(Inferential Statistics): ‘전체를 향한 추론’의 도구
✔ 정의
추리통계는 표본 데이터를 이용해 모집단에 대한 결론을 도출하는 통계입니다.
즉, 제한된 정보를 바탕으로 전반적인 경향이나 인과관계를 추론하려는 시도입니다.
✔ 목적
“이걸 통해 더 넓은 세상을 이해할 수 있을까?”
표본만으로 전체에 대해 말하는 것은 언제나 불확실성이 동반됩니다.
그래서 추리통계는 언제나 확률적 해석을 동반합니다.
✔ 사용 도구 예시
• 추정(estimation): 신뢰구간(confidence interval)
• 검정(testing): 가설검정(hypothesis testing), p-value
• 모형(modeling): 회귀분석, 분산분석, 로지스틱 회귀, 시계열 예측
✔ 실제 활용 예시
• 신약 실험 결과로 전체 환자군에 대한 효과 예측
• 선거에서 일부 표본조사로 전체 유권자 성향 예측
• 온라인몰 방문자의 일부 행동을 통해 전체 전환율 추정
📌 왜 이 차이를 이해해야 할까?
단순한 지식 차원을 넘어서, 통계적 사고방식은 현실의 복잡한 문제를 다루는 데 필수적인 도구입니다.
다음의 상황을 예로 들어보세요.
• 🛒 마케팅팀이 “최근 1,000명의 고객” 데이터를 분석해 구매 패턴을 시각화한다면 → 기술통계
• 📈 그런데 그 데이터를 바탕으로 “앞으로 신규 고객도 이런 행동을 보일 것인가?”를 예측한다면 → 추리통계
두 분석은 같은 데이터를 가지고도 전혀 다른 질문을 던지고, 다른 해석을 합니다.
따라서, 두 통계의 차이를 명확히 구분할 줄 알아야, 데이터 기반 의사결정도 훨씬 더 정밀해질 수 있습니다.
⸻
🧠 정리: 기술통계와 추리통계는 통계의 양날검
• 기술통계는 거울처럼 현재의 데이터를 반영합니다.
• 추리통계는 망원경처럼 미래와 전체를 추측합니다.
둘 중 어느 하나만 가지고는 통계적 사고가 완성되지 않습니다.
데이터 분석의 실력은, 이 둘을 구분해서 적절히 사용하는 능력에서 나옵니다.
'통계' 카테고리의 다른 글
📊 추리통계를 제대로 하려면 꼭 지켜야 할 조건들 (쉽게 설명해봄) (4) | 2025.07.01 |
---|---|
회귀분석, 요인분석, 클러스터링 같은 추리 통계의 함정 -추리통계를 사용전 갖춰야 할 조건들 (4) | 2025.07.01 |