머신러닝에서 모델 성능도 중요하지만, 어떤 변수가 중요한지 해석할 수 있는 능력도 매우 중요하다.특히 금융, 의료처럼 설명력이 필요한 분야에선 더욱 그렇다.이번 글에선 로지스틱 회귀 + L1(Lasso) 규제를 활용해서 유의미한 변수만 선택하는 과정을 소개한다. 목표select_features_by_logistic_lasso(df, '채무 불이행 여부') -> 이 함수는 데이터프레임 df에서 채무 불이행 여부를 타겟으로,중요한 변수만 골라내고 학습된 로지스틱 회귀 모델까지 반환한다! 주요 단계 설명파이프라인 구성clf = Pipeline(steps=[ ('preprocessor', preprocessor), ('classifier', LogisticRegression( penalt..