Bài học 1Các cân nhắc triển khai: chu kỳ huấn luyện lại, đường ống dữ liệu, giám sát trôi dữ liệu và kiểm tra ngược dự báoLập kế hoạch triển khai hệ thống dự báo doanh thu, bao gồm chu kỳ huấn luyện lại, đường ống dữ liệu tự động, giám sát trôi dữ liệu và khái niệm, cũng như kiểm tra ngược liên tục để đảm bảo hiệu suất ổn định trong điều kiện thị trường thay đổi.
Designing robust data pipelinesScheduling retraining and updatesMonitoring data and concept driftOngoing backtesting and benchmarkingAlerting and rollback strategiesBài học 2Truyền đạt dự báo đến các bên liên quan: hình ảnh hóa dự báo điểm và khoảng, phân tích kịch bản, minh bạch giả địnhTruyền đạt dự báo doanh thu hiệu quả đến các bên liên quan bằng cách sử dụng hình ảnh hóa rõ ràng cho dự báo điểm và khoảng, phân tích kịch bản, và tài liệu minh bạch về các giả định, hạn chế và cân nhắc rủi ro mô hình.
Visualizing point and interval forecastsScenario and what-if analysis designExplaining drivers and key featuresDocumenting assumptions and limitsTailoring messages to stakeholdersBài học 3Mô hình chuỗi thời gian học máy: rừng ngẫu nhiên/tăng cường gradient với đặc trưng trễ, XGBoost/LightGBM, và mô hình chuỗi (LSTM/GRU)Huấn luyện các mô hình học máy cho dự báo doanh thu chuỗi thời gian, bao gồm các ensemble cây với đặc trưng trễ và mô hình chuỗi như LSTM và GRU, đồng thời xử lý tính không dừng, tính mùa vụ và sự không đồng nhất cấp sản phẩm.
Random forests with lagged featuresGradient boosting, XGBoost, LightGBMGlobal versus local forecasting modelsSequence models with LSTM and GRUHandling nonstationarity and scalingBài học 4Xây dựng mục tiêu dự báo và chân trời đánh giá (ví dụ: 3, 6, 12 tháng tới)Xác định mục tiêu dự báo cho các sản phẩm ngân hàng cốt lõi bằng cách chọn mục tiêu dự đoán, chân trời và độ chi tiết, và liên kết chúng với các quyết định kinh doanh như lập ngân sách, định giá, lập kế hoạch thanh khoản và báo cáo quy định hoặc rủi ro.
Choosing revenue targets and unitsSelecting forecast horizons and frequencyAligning forecasts with business decisionsGranularity by product, segment, and regionHandling new products and short historiesBài học 5Xác định và lấy nguồn dữ liệu chuỗi thời gian (chuỗi tài chính công khai, khối lượng thanh toán, kỹ thuật tạo dữ liệu tổng hợp)Học cách xác định, đánh giá và lấy nguồn dữ liệu chuỗi thời gian cho dự báo doanh thu ngân hàng, bao gồm chỉ số sản phẩm nội bộ, chuỗi tài chính công khai và dữ liệu tổng hợp an toàn bổ sung hồ sơ lịch sử khan hiếm hoặc nhiễu.
Cataloging internal product revenue seriesUsing public macro and market data sourcesCollecting payment and transaction volume dataAssessing data quality, gaps, and revisionsSynthetic data generation for stress scenariosBài học 6Huấn luyện và điều chỉnh siêu tham số: tìm kiếm lưới/ngẫu nhiên, tối ưu hóa Bayesian, chấm điểm nhận thức thời gianTối ưu hóa hiệu suất mô hình bằng các chiến lược điều chỉnh siêu tham số có cấu trúc, bao gồm tìm kiếm lưới và ngẫu nhiên, tối ưu hóa Bayesian và chấm điểm nhận thức thời gian tôn trọng thứ tự thời gian và tập trung vào chân trời quan trọng kinh doanh.
Defining search spaces and priorsGrid and random search trade-offsBayesian optimization workflowsTime-aware validation and scoringEarly stopping and resource limitsBài học 7Kết hợp ensemble mô hình và hòa giải: trung bình mô hình đơn giản, ensemble có trọng số, stacking cho chuỗi thời gianKết hợp nhiều mô hình dự báo cho doanh thu ngân hàng bằng trung bình đơn giản, ensemble có trọng số và stacking, và áp dụng hòa giải phân cấp để đảm bảo dự báo nhất quán qua các sản phẩm, chi nhánh và cấp tổ chức.
Simple and weighted model averagingStacking and meta-learners for seriesDiversity and correlation among modelsHierarchical and grouped reconciliationEvaluating ensemble stability over timeBài học 8Phương pháp chuỗi thời gian cơ bản: ARIMA, ETS, mô hình ngây thơ và ngây thơ mùa vụ, phân tích (xu hướng/mùa vụ)Khám phá các mô hình chuỗi thời gian cơ bản cho doanh thu ngân hàng, bao gồm ngây thơ, ngây thơ mùa vụ, ARIMA, ETS và phân tích, để thiết lập hiệu suất tham chiếu và diễn giải xu hướng và mùa vụ trước khi sử dụng mô hình học máy phức tạp.
Naive and seasonal naive benchmarksClassical decomposition of trend and seasonalityARIMA modeling for bank revenue seriesExponential smoothing and ETS variantsComparing baselines across productsBài học 9Xây dựng đặc trưng cho doanh thu: trễ, trung bình/std cuộn, sai phân, hiệu ứng lịch, chỉ báo ngày lễ, hiệu ứng nhóm, cờ tiếp thị/chiến dịchXây dựng đặc trưng dự đoán cho doanh thu ngân hàng, bao gồm trễ, thống kê cuộn, sai phân, hiệu ứng lịch, chỉ báo ngày lễ, hiệu ứng nhóm và cờ chiến dịch tiếp thị nắm bắt sự thay đổi nhu cầu và đứt gãy cấu trúc.
Lag and lead features for revenueRolling means, volatility, and ratiosCalendar, holiday, and payday effectsCohort and lifecycle based featuresMarketing and campaign impact flagsBài học 10Chia dữ liệu và xác thực chéo cho chuỗi thời gian: chia train/validation/test, CV cửa sổ mở rộng, CV chặnThiết kế chia dữ liệu và xác thực chéo nhận thức thời gian cho dự báo doanh thu, bao gồm cách tiếp cận cuộn và chặn, để tránh rò rỉ, mô phỏng sử dụng sản xuất và có được ước lượng đáng tin cậy về hiệu suất mô hình theo thời gian.
Holdout train, validation, and test splitsRolling and expanding window validationBlocked cross-validation for seasonalityPreventing temporal leakage in featuresBacktesting over multiple forecast originsBài học 11Chỉ số đánh giá và phân tích lỗi: MAE, RMSE, MAPE, sMAPE, khoảng dự báo và độ bao phủĐánh giá dự báo doanh thu bằng các chỉ số như MAE, RMSE, MAPE, sMAPE đối xứng và độ bao phủ khoảng, và thực hiện phân tích lỗi chi tiết theo phân khúc, chân trời và chế độ để phát hiện thiên kiến và điểm yếu mô hình.
Scale-dependent error metricsPercentage and relative error metricsPrediction intervals and coverageHorizon and segment level diagnosticsRegime and event-driven error analysisBài học 12Hồi quy vĩ mô và bên ngoài: sử dụng CPI, thất nghiệp, lãi suất, di động, Google Trends; chọn đặc trưng và căn chỉnh trễKết hợp các hồi quy vĩ mô và bên ngoài vào mô hình doanh thu, như CPI, thất nghiệp, lãi suất, di động và xu hướng Google, và học kỹ thuật căn chỉnh trễ, mở rộng và chọn đặc trưng để tránh quá khớp.
Selecting relevant macro indicatorsAligning lags between macro and revenueTransforming and scaling external dataFeature selection and regularizationStress and scenario overlays with macros