데이터 엔지니어링(정리)

데이터, 정보, 메타데이터 정리

Data Jun 2026. 2. 18. 22:33

데이터와 정보는 비슷해 보이지만 본질적으로 다르다.
그리고 그 위에 또 하나의 개념이 있다. 바로 메타데이터다.

 

이 세 가지를 구분하지 못하면
데이터 엔지니어링의 전체 흐름을 이해하기 어렵다.


1. 데이터(Data)

데이터는 가공되지 않은 원시 사실이나 값이다.

 

예시:

  • 2024.08.08
  • 14:37:21
  • 2.48MB
  • 매출 1200000

그 자체로는 의미가 명확하지 않다.
단지 “기록된 값”일 뿐이다.

 

2. 정보(Information)

정보는 데이터를 해석하고 맥락을 부여해 의미 있는 결과로 만든 것이다.

 

예시:

  • 8월 8일 오후 2시에 촬영된 사진
  • 이번 달 매출이 전월 대비 10% 증가

데이터에 “맥락”이 추가될 때
비로소 의사결정에 활용 가능한 정보가 된다.

 

3. 메타데이터(Metadata)

메타데이터는 데이터에 대한 데이터다.

 

예시:

  • 파일 이름: 202408_001.JPG
  • 촬영 날짜
  • 촬영 시간
  • 파일 용량
  • 저장 위치

즉,
데이터의 구조·속성·생성 시점·형식을 설명하는 정보다.

 

메타데이터는
데이터를 체계적으로 관리하고 검색·추적·통제하기 위해 사용된다.

 

4. 정리

 

  • 데이터 → 값 자체
  • 정보 → 해석된 의미
  • 메타데이터 → 데이터를 설명하는 속성 정보

데이터는 원시 값이고, 정보는 해석된 의미이며, 메타데이터는 데이터를 체계적으로 관리하기 위한 설명 정보이다.