2025/05/06 2

Dagster의 강력한 기능, MonthlyPartitionsDefinition으로 월별 데이터 처리 자동화하기!

데이터 파이프라인 구축에 있어서 시간 기반 파티셔닝은 매우 중요한 개념입니다. 특히 매월 생성되는 데이터를 처리하거나, 특정 월별 기준으로 분석 작업을 수행해야 할 때 유용하게 활용됩니다. Dagster는 이러한 요구 사항을 충족시키기 위해 강력하고 편리한 기능, **MonthlyPartitionsDefinition**을 제공합니다.오늘은 Dagster의 MonthlyPartitionsDefinition이 무엇이고, 어떻게 활용하여 월별 데이터 처리를 자동화할 수 있는지 간단하게 알아보겠습니다. 파티션(Partition)이란 무엇일까요? 📦파티션은 마치 거대한 서랍장 속의 칸칸 나누어진 서랍과 같습니다. 원래 하나의 커다란 데이터 덩어리를 특정 기준(예: 날짜, 지역, 제품 종류 등)에 따라 더 작고 ..

Dagster deps 파헤치기: 자산 간 의존성 관리의 핵심

Dagster를 사용하다 보면 @dg.asset 데코레이터의 deps라는 파라미터를 심심찮게 만나게 됩니다. 겉보기엔 단순한 리스트처럼 보이지만, 이 deps는 Dagster 파이프라인의 흐름을 정의하고 관리하는 데 있어 핵심적인 역할을 수행합니다. 오늘은 이 deps의 숨겨진 힘과 그 중요성에 대해 쉽게 알아보겠습니다. deps, 너는 누구냐?@dg.asset 데코레이터 내에서 deps는 현재 정의하고 있는 자산이 어떤 다른 Dagster 자산에 의존하는지를 명시하는 파라미터입니다. 마치 레시피에서 특정 요리가 완성되기 위해 먼저 준비되어야 하는 재료와 같은 개념이라고 생각하시면 됩니다. deps의 주요 역할:실행 순서의 설계자: Dagster는 deps에 정의된 의존성 정보를 바탕으로 자산들의 실행 ..