데이터와 정보는 비슷해 보이지만 본질적으로 다르다.
그리고 그 위에 또 하나의 개념이 있다. 바로 메타데이터다.
이 세 가지를 구분하지 못하면
데이터 엔지니어링의 전체 흐름을 이해하기 어렵다.
1. 데이터(Data)
데이터는 가공되지 않은 원시 사실이나 값이다.
예시:
- 2024.08.08
- 14:37:21
- 2.48MB
- 매출 1200000
그 자체로는 의미가 명확하지 않다.
단지 “기록된 값”일 뿐이다.
2. 정보(Information)
정보는 데이터를 해석하고 맥락을 부여해 의미 있는 결과로 만든 것이다.
예시:
- 8월 8일 오후 2시에 촬영된 사진
- 이번 달 매출이 전월 대비 10% 증가
데이터에 “맥락”이 추가될 때
비로소 의사결정에 활용 가능한 정보가 된다.
3. 메타데이터(Metadata)
메타데이터는 데이터에 대한 데이터다.
예시:
- 파일 이름: 202408_001.JPG
- 촬영 날짜
- 촬영 시간
- 파일 용량
- 저장 위치
즉,
데이터의 구조·속성·생성 시점·형식을 설명하는 정보다.
메타데이터는
데이터를 체계적으로 관리하고 검색·추적·통제하기 위해 사용된다.
4. 정리
- 데이터 → 값 자체
- 정보 → 해석된 의미
- 메타데이터 → 데이터를 설명하는 속성 정보
데이터는 원시 값이고, 정보는 해석된 의미이며, 메타데이터는 데이터를 체계적으로 관리하기 위한 설명 정보이다.
'데이터 엔지니어링(정리)' 카테고리의 다른 글
| OLTP와 OLAP의 개념 차이와 역할 구분 (0) | 2026.02.18 |
|---|---|
| 분산 처리, 분산 저장, 분산 컴퓨팅의 개념과 장단점 이해 (0) | 2026.02.18 |
| 데이터 레이크, 웨어하우스, 마트의 구조와 데이터 거버넌스 이해 (0) | 2026.02.18 |
| 데이터 엔지니어링이 중요한 이유: 효율성과 신뢰를 만드는 기반 구조 (0) | 2026.02.18 |
| 데이터 엔지니어링의 개념과 수명 주기 구조 (0) | 2026.02.18 |