수업 1배포 고려사항: 재훈련 주기, 데이터 파이프라인, 드리프트 모니터링 및 백테스팅 예측수익 예측 시스템의 배포를 계획하며, 재훈련 주기, 자동화된 데이터 파이프라인, 데이터 및 개념 드리프트 모니터링, 변화하는 시장 환경에서 안정적인 성능을 보장하기 위한 지속적인 백테스팅을 포함합니다.
강건한 데이터 파이프라인 설계재훈련 및 업데이트 스케줄링데이터 및 개념 드리프트 모니터링지속적인 백테스팅 및 벤치마킹알림 및 롤백 전략수업 2이해관계자에게 예측 전달: 점 예측 및 구간 시각화, 시나리오 분석, 가정의 투명성점 및 구간 예측의 명확한 시각화, 시나리오 분석, 가정, 한계, 모델 위험 고려사항의 투명한 문서를 사용하여 수익 예측을 이해관계자에게 효과적으로 전달합니다.
점 및 구간 예측 시각화시나리오 및 가정 분석 설계주요 요인 및 핵심 특징 설명가정 및 한계 문서화이해관계자에 맞춘 메시지 전달수업 3머신러닝 시계열 모델: 지연 특징을 사용한 랜덤 포레스트/그래디언트 부스팅, XGBoost/LightGBM, 시퀀스 모델(LSTM/GRU)비정상성, 계절성, 상품별 이질성을 처리하면서 지연 특징을 사용한 트리 앙상블 및 LSTM, GRU와 같은 시퀀스 모델을 포함하여 시계열 수익 예측을 위한 머신러닝 모델을 훈련합니다.
지연 특징을 사용한 랜덤 포레스트그래디언트 부스팅, XGBoost, LightGBM전역 vs 지역 예측 모델LSTM 및 GRU를 사용한 시퀀스 모델비정상성 처리 및 스케일링수업 4예측 목표 및 평가 기간 설정(예: 다음 3, 6, 12개월)예측 대상, 기간, 세분성을 선택하여 핵심 은행 상품의 예측 목표를 정의하고, 예산 편성, 가격 책정, 유동성 계획, 규제 또는 위험 보고 요구사항과 같은 비즈니스 결정과 조정합니다.
수익 목표 및 단위 선택예측 기간 및 빈도 선택비즈니스 결정과의 예측 조정상품, 세그먼트, 지역별 세분성신규 상품 및 짧은 이력 처리수업 5시계열 데이터 식별 및 소싱(공개 금융 시계열, 결제량, 합성 생성 기법)내부 상품 지표, 공개 금융 시계열, 희귀하거나 노이즈가 많은 과거 기록을 안전하게 보강하는 합성 데이터를 포함하여 은행 수익 예측을 위한 시계열 데이터를 식별, 평가, 소싱하는 방법을 배웁니다.
내부 상품 수익 시계열 카탈로그화공개 거시 및 시장 데이터 소스 사용결제 및 거래량 데이터 수집데이터 품질, 누락, 수정 평가스트레스 시나리오를 위한 합성 데이터 생성수업 6훈련 및 하이퍼파라미터 튜닝: 그리드/랜덤 서치, 베이지안 최적화, 시간 인식 스코어링그리드 및 랜덤 서치, 베이지안 최적화, 시간 순서를 존중하고 비즈니스 핵심 기간에 초점을 맞춘 시간 인식 스코어링을 포함한 구조화된 하이퍼파라미터 튜닝 전략을 사용하여 모델 성능을 최적화합니다.
검색 공간 및 사전 정의그리드 및 랜덤 서치 장단점베이지안 최적화 워크플로우시간 인식 검증 및 스코어링조기 종료 및 자원 제한수업 7모델 앙상블 및 조정: 단순 모델 평균화, 가중 앙상블, 시계열 스태킹단순 평균, 가중 앙상블, 스태킹을 사용하여 은행 수익을 위한 여러 예측 모델을 결합하고, 상품, 지점, 조직 수준에서 일관된 예측을 보장하기 위해 계층적 조정을 적용합니다.
단순 및 가중 모델 평균화시계열을 위한 스태킹 및 메타러너모델 간 다양성 및 상관관계계층적 및 그룹 조정시간에 따른 앙상블 안정성 평가수업 8기준 시계열 방법: ARIMA, ETS, 단순 및 계절 단순 모델, 분해(추세/계절성)단순, 계절 단순, ARIMA, ETS, 분해를 포함한 은행 수익을 위한 기준 시계열 모델을 탐구하여 복잡한 머신러닝 모델을 사용하기 전에 기준 성능을 설정하고 추세 및 계절성을 해석합니다.
단순 및 계절 단순 벤치마크추세 및 계절성의 고전적 분해은행 수익 시계열을 위한 ARIMA 모델링지수 평활화 및 ETS 변형상품 간 기준 비교수업 9수익을 위한 특징 공학: 지연, 롤링 평균/표준편차, 차분, 달력 효과, 휴일 지표, 코호트 효과, 마케팅/캠페인 플래그지연, 롤링 통계, 차분, 달력 및 휴일 효과, 코호트 및 라이프사이클 지표, 수요 변화 및 구조적 단절을 포착하는 마케팅 또는 캠페인 플래그를 포함하여 은행 수익을 위한 예측 특징을 공학합니다.
수익을 위한 지연 및 리드 특징롤링 평균, 변동성, 비율달력, 휴일, 급여일 효과코호트 및 라이프사이클 기반 특징마케팅 및 캠페인 영향 플래그수업 10시계열을 위한 데이터 분할 및 교차검증: 훈련/검증/테스트 분할, 확장 윈도우 CV, 블록 CV롤링 및 블록 접근 방식을 포함하여 수익 예측을 위한 시간 인식 데이터 분할 및 교차검증 방식을 설계하여 누출을 방지하고 프로덕션 사용을 모방하며 시간에 따른 신뢰할 수 있는 모델 성능 추정을 얻습니다.
홀드아웃 훈련, 검증, 테스트 분할롤링 및 확장 윈도우 검증계절성을 위한 블록 교차검증특징에서의 시간 누출 방지다중 예측 출발점에 대한 백테스팅수업 11평가 지표 및 오류 분석: MAE, RMSE, MAPE, 대칭 MAPE, 예측 구간 및 커버리지MAE, RMSE, MAPE, 대칭 MAPE, 구간 커버리지를 사용한 지표로 수익 예측을 평가하고, 세그먼트, 기간, 체제별 상세 오류 분석을 수행하여 편향 및 모델 약점을 발견합니다.
스케일 의존 오류 지표백분율 및 상대 오류 지표예측 구간 및 커버리지기간 및 세그먼트 수준 진단체제 및 이벤트 기반 오류 분석수업 12거시 및 외부 회귀변수: CPI, 실업률, 금리, 이동성, Google Trends 사용; 특징 선택 및 지연 정렬CPI, 실업률, 금리, 이동성, 검색 트렌드와 같은 거시경제 및 외부 회귀변수를 수익 모델에 통합하고, 과적합을 피하기 위한 지연 정렬, 스케일링, 특징 선택 기법을 배웁니다.
관련 거시 지표 선택거시와 수익 간 지연 정렬외부 데이터 변환 및 스케일링특징 선택 및 정규화거시를 사용한 스트레스 및 시나리오 오버레이