AI/ML(3)
-
LightGBM(LGBM)을 사용한 부동산 가격 예측 - 3(테스트 모델 개발)
LightGBM을 사용한 부동산 실거래가 예측을 위한 개발 과정을 담았습니다. 대략적인 순서는 모델 선정,학습 데이터 전처리, 테스트 모델 개발, 변수 및 파라미터 값 조정 순으로 진행해보려 합니다. 이번 글은 앞선 전처리 글에 이어지는 테스트 모델링 · 하이퍼파라미터 튜닝 · Expanding Window · SHAP 분석까지 포함한 글입니다.LightGBM 부동산 가격 예측 – 모델링, Optuna 튜닝, Expanding Window 검증, SHAP 해석이전 글에서는 전처리 전략을 다뤘고 그에 이어, 이번 글에서는 다음 내용을 정리합니다.왜 KFold가 아닌 Expanding Window인가?Optuna를 활용한 하이퍼파라미터 탐색최종 테스트 성능 평가SHAP 기반 모델 해석1. 왜 KFold가 아..
2026.03.09 -
LightGBM(LGBM)을 사용한 부동산 가격 예측 - 2(전처리)
LightGBM을 사용한 부동산 실거래가 예측을 위한 개발 과정을 담았습니다. 대략적인 순서는 모델 선정, 테스트 모델 개발, 학습 데이터 전처리, 변수 및 파라미터 값 조정 순으로 진행해보려 합니다. 이번 글에서는 학습 데이터 전처리, 테스트 모델 개발부분을 다룹니다. 전처리 전략 설계 과정부동산 가격 예측은 단순한 회귀 문제가 아닙니다.실거래 데이터는 heavy-tail 분포, 극단값 존재, 시계열적 특성, 지역 범주형 변수 다수 포함이라는 특징을 가집니다.모델 성능을 좌우했던 데이터 전처리 전략을 정리해보겠습니다.글에서 df_train, df_test는 각각 학습 데이터, 예측 결과 데이터 입니다.1. LGBM 특성과 전처리 핵심LGBM 특징스케일링이 거의 필요 없음비선형 관계를 잘 포착범주형 변수..
2026.03.06 -
LightGBM(LGBM)을 사용한 부동산 가격 예측 - 1(모델 선정)
LightGBM을 사용한 부동산 실거래가 예측을 위한 개발 과정을 담았습니다. 대략적인 순서는 모델 선정, 테스트 모델 개발, 학습 데이터 전처리, 변수 및 파라미터 값 조정 순으로 진행해보려 합니다. 이번 글에서는 모델 선정 과정을 정리합니다. 모델 특징 비교부동산 가격추정에 유리한 모델을 정리하여 추렸습니다.구분LGBMXGBoostCatBoost기본 구조Leaf-wise BoostingLevel-wise BoostingOrdered Boosting학습 속도매우 빠름보통느린 편튜닝 난이도중간중간~높음비교적 쉬움범주형 처리직접 인코딩 필요직접 인코딩 필요자동 처리 강점과적합 경향다소 있음비교적 안정적가장 안정적이상치 대응약간 민감중간강함SHAP 해석매우 좋음매우 좋음좋음대용량 데이터매우 강함강함중간실무..
2026.03.04