데이터 분석에서 그래프는 단순한 시각화 도구 그 이상이다.
이 포스트에서는 그래프의 필요성과 활용 방법, 그리고 좋은 그래프를 그리기 위한 조건들을 하나씩 살펴본다.
그래프의 중요성
- 그래프란?
인간이 가진 시각적 인지 능력을 활용하여 복잡한 현상을 직관적으로 이해하게 해주는 도구다. - 기능
통계 데이터를 요약해 시각적으로 표현함으로써 그 특징이나 경향을 쉽게 파악할 수 있다. - 주의할 점
그래프는 실제 데이터뿐만 아니라 시각적 인상을 강하게 주기 때문에,
과도한 해석의 오류가 발생할 수 있음에 주의해야 한다. - 활용
데이터를 시각화함으로써 이상치 탐지, 분석 방향 설정, 이후 통계 분석 준비에 도움을 준다.
Minard’s 그래프 - 역사적 사례
- Minard’s graphic diagram (1868)
나폴레옹의 러시아 원정(1812~1813)을 시각적으로 표현한 대표적인 인포그래픽이다. - 특징
군대의 이동 경로, 병사 수 감소, 날씨(기온) 등을 한 눈에 파악할 수 있음.
→ 단순 숫자가 아니라 시간·공간·양적 정보를 결합한 훌륭한 시각화 사례. - 시사점
좋은 그래프는 단순히 데이터를 보여주는 것이 아니라 스토리텔링까지 가능하다.
막대그래프 vs 원그래프
- 막대그래프와 원그래프의 차이점
- 둘 다 비율이나 분포를 나타낼 수 있지만,
- 차이에 대한 인지는 막대그래프가 더 뛰어남
(높낮이로 비교가 가능하기 때문)
- 활용 팁
구체적인 수치 비교가 필요한 상황에서는 막대그래프를 우선 고려하자.
나이팅게일의 로즈 다이어그램
- 로즈 다이어그램이란?
원 형태의 도표로, 범주형 데이터의 크기를 방사형으로 표현하는 방식 - 역사적 배경
플로렌스 나이팅게일이 1854~1856년 크림 전쟁에서 병사 사망 원인을 시각화한 도표
→ Red: 부상 / Blue: 질병 / Black: 기타 - 의의
단순히 수치를 나열하는 것이 아닌, 원인별 사망률을 직관적으로 전달함
올바른 그래프 그리기 - 축과 단위
- 좋은 그래프의 조건
- 적절한 제목
- 출처, 표본 크기, 수집 방법 등의 명시
- 축의 시작점을 0으로 맞추기
- 축 단위 및 측정 단위가 반드시 표기되어야 함
- 예시
동일한 데이터라도 축이 다르면 시각적 인상이 왜곡될 수 있다.
→ 그래프는 진실을 전달하기도, 오해를 유도하기도 한다.
올바른 그래프 그리기 - 비교자료 포함
- Y축이 0이 아닐 때 주의사항
- 단일 수치만 보여주지 말고, 관련된 비교 데이터를 함께 시각화하는 것이 중요하다.
- 예: 임금 상승률만 보여주는 것이 아니라 물가 상승률과 함께 비교하면 훨씬 객관적.
- 의미
비교 자료를 함께 시각화하면 맥락과 변화를 정확히 전달할 수 있다. - "Y축이 0이 아니다"라는 말은 그래프의 세로축(y축)이 0에서 시작하지 않는다는 의미
'통계 이론' 카테고리의 다른 글
평균에도 종류가 있다고요? (0) | 2025.04.20 |
---|---|
분할표(Contingency Table)란? (0) | 2025.03.31 |
[기술통계분석] 도수분포표 (0) | 2025.03.23 |
[기술통계분석] 자료와 척도 (0) | 2025.03.23 |
[기술통계분석] 자료와 분석방법 (0) | 2025.03.16 |