K-means 클러스터링이란?

공간 분석/공간 분석 기초

K-means 클러스터링이란?

Data Jun 2025. 12. 14. 22:05

K-means 클러스터링은

비지도 학습(Unsupervised Learning) 알고리즘으로,
사용자가 미리 정한 K개의 클러스터 수를 기준으로
데이터를 자동으로 K개의 그룹으로 묶는 방법입니다.

데이터에 정답(label) 이 없는 상태에서

서로 비슷한 데이터끼리 묶는 것이 핵심 목적입니다.

1. QGIS에서 K-means 클러스터링 실행 흐름

QGIS에서 K-means를 실행하면 다음 과정을 거칩니다.

1️⃣ 입력 레이어 선택

예: 지하철 역사 위치(점 데이터)

2️⃣ 클러스터 수(K) 입력

예: K = 5

3️⃣ 알고리즘 실행

실행 결과로 속성 테이블에 새로운 필드가 추가됩니다.

CLUSTER_ID
→ 각 객체가 어느 클러스터에 속하는지 나타내는 번호
CLUSTER_SIZE
→ 해당 클러스터에 몇 개의 객체가 포함되어 있는지\

2. K 값에 따라 결과는 어떻게 달라질까?

K-means의 가장 중요한 특징은

👉 K 값에 따라 결과가 완전히 달라진다는 점입니다.

K = 2
→ 매우 거친 그룹화 (큰 덩어리 2개)
K = 5
→ 적절한 수준의 공간적 분리
K = 10
→ 세밀하지만 과도하게 쪼개질 수 있음

✔️ 따라서 K 선택은 분석 목적에 따라 결정해야 합니다.

3. 공간 데이터에서의 K-means 활용

공간 데이터(GIS)에 K-means를 적용하면,

행정구역
생활권
서비스 권역
수요 패턴 지역

등을 객관적인 기준으로 구분할 수 있습니다.

예를 들어,

서울시 행정동을 K-means로 묶으면
→ 유사한 공간 특성을 가진 지역 그룹을 도출할 수 있습니다.

정리하면

K-means는 사전에 정한 K 값을 기준으로 데이터를 그룹화하는 비지도 학습 기법
QGIS에서는 실행 시 CLUSTER_ID, CLUSTER_SIZE 필드가 자동 생성됨
K 값이 작을수록 거칠고, 클수록 세밀한 분류
공간 분석에서는 지역 유형화·권역 분석에 매우 유용

K-means는 “몇 개로 나눌지(K)”를 정하고, 그 기준에 따라 데이터를 가장 비슷하게 묶는 방법이다.

'공간 분석 > 공간 분석 기초' 카테고리의 다른 글

QGIS Python 콘솔로 공간 처리 알고리즘 파악하기 (0)	2026.02.28
QGIS에서 유효하지 않은 객체 처리 설정 방법 (0)	2026.02.28
QGIS 필드 재작성(Refactor Fields)이란? (0)	2025.12.14
필드 계산기 사용 (0)	2025.12.13
위치에 따른 속성 결합 (0)	2025.12.13

현재글K-means 클러스터링이란?

Data Mastery: From Analysis to System De

커피박 프로젝트(서울 행정동 별 카페 매출), 카페 매출 분석(배달 서비스), grid-template-areas, Fast_Campus, grid-row #, grid-column #, 호박너구리, span,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Data Mastery: From Analysis to System De