Leçon 1Considérations de déploiement : cadence de réentraînement, pipelines de données, surveillance de la dérive et backtesting des prévisionsPlanifiez le déploiement de systèmes de prévision des revenus, incluant la cadence de réentraînement, les pipelines de données automatisés, la surveillance de la dérive des données et des concepts, et le backtesting continu pour assurer une performance stable dans des conditions de marché changeantes.
Conception de pipelines de données robustesPlanification de réentraînement et mises à jourSurveillance de la dérive des données et des conceptsBacktesting continu et benchmarksStratégies d'alertes et de rollbackLeçon 2Communication des prévisions aux parties prenantes : visualisation des prévisions ponctuelles et intervalles, analyse de scénarios, transparence des hypothèsesCommuniquez efficacement les prévisions de revenus aux parties prenantes en utilisant des visualisations claires des prédictions ponctuelles et intervalles, l'analyse de scénarios et une documentation transparente des hypothèses, limites et considérations de risque des modèles.
Visualisation des prévisions ponctuelles et intervallesConception d'analyse de scénarios et what-ifExplication des facteurs clés et caractéristiquesDocumentation des hypothèses et limitesAdaptation des messages aux parties prenantesLeçon 3Modèles d'apprentissage automatique pour séries chronologiques : forêts aléatoires/gradient boosting avec caractéristiques retardées, XGBoost/LightGBM, et modèles de séquence (LSTM/GRU)Entraînez des modèles d'apprentissage automatique pour la prévision des revenus en séries chronologiques, incluant les ensembles d'arbres avec caractéristiques retardées et les modèles de séquence comme LSTM et GRU, tout en gérant la non-stationnarité, la saisonnalité et l'hétérogénéité au niveau des produits.
Forêts aléatoires avec caractéristiques retardéesGradient boosting, XGBoost, LightGBMModèles de prévision globaux vs locauxModèles de séquence avec LSTM et GRUGestion de la non-stationnarité et mise à l'échelleLeçon 4Formulation des objectifs de prévision et horizons d'évaluation (ex. : 3, 6, 12 prochains mois)Définissez les objectifs de prévision pour les produits bancaires de base en sélectionnant les cibles de prédiction, les horizons et la granularité, et alignez-les avec les décisions d'affaires telles que le budget, la tarification, la planification de la liquidité et les besoins de rapports réglementaires ou de risque.
Choix des cibles et unités de revenusSélection des horizons et fréquences de prévisionAlignement des prévisions avec les décisions d'affairesGranularité par produit, segment et régionGestion des nouveaux produits et historiques courtsLeçon 5Identification et approvisionnement en données de séries chronologiques (séries financières publiques, volumes de paiements, techniques de génération synthétique)Apprenez à identifier, évaluer et approvisionner des données de séries chronologiques pour la prévision des revenus bancaires, incluant les métriques internes de produits, les séries financières publiques et les données synthétiques qui augmentent en toute sécurité les historiques rares ou bruités.
Catalogage des séries de revenus de produits internesUtilisation de sources publiques macro et de marchéCollecte de données de volumes de paiements et transactionsÉvaluation de la qualité, lacunes et révisions des donnéesGénération de données synthétiques pour scénarios de stressLeçon 6Entraînement et réglage des hyperparamètres : recherche en grille/aléatoire, optimisation bayésienne, notation adaptée au tempsOptimisez la performance des modèles en utilisant des stratégies structurées de réglage des hyperparamètres, incluant la recherche en grille et aléatoire, l'optimisation bayésienne et une notation adaptée au temps qui respecte l'ordre temporel et se concentre sur les horizons critiques pour l'entreprise.
Définition des espaces de recherche et priorsCompromis recherche en grille et aléatoireFlux de travail d'optimisation bayésienneValidation et notation adaptées au tempsArrêt anticipé et limites de ressourcesLeçon 7Ensembles de modèles et réconciliation : moyenne simple de modèles, ensembles pondérés, stacking pour séries chronologiquesCombinez plusieurs modèles de prévision pour les revenus bancaires en utilisant des moyennes simples, des ensembles pondérés et du stacking, et appliquez la réconciliation hiérarchique pour assurer des prévisions cohérentes à travers les produits, succursales et niveaux organisationnels.
Moyenne simple et pondérée de modèlesStacking et méta-apprenants pour sériesDiversité et corrélation entre modèlesRéconciliation hiérarchique et groupéeÉvaluation de la stabilité des ensembles dans le tempsLeçon 8Méthodes de base pour séries chronologiques : ARIMA, ETS, modèles naïfs et naïfs saisonniers, décomposition (tendance/saisonnalité)Explorez les modèles de base pour séries chronologiques de revenus bancaires, incluant naïf, naïf saisonnier, ARIMA, ETS et décomposition, pour établir une performance de référence et interpréter la tendance et la saisonnalité avant d'utiliser des modèles d'apprentissage automatique complexes.
Benchmarks naïfs et naïfs saisonniersDécomposition classique de tendance et saisonnalitéModélisation ARIMA pour séries de revenus bancairesLissage exponentiel et variantes ETSComparaison des bases à travers les produitsLeçon 9Ingénierie de caractéristiques pour revenus : retards, moyennes/std glissantes, différenciation, effets calendaires, indicateurs de jours fériés, effets de cohorte, indicateurs de marketing/campagnesConcevez des caractéristiques prédictives pour les revenus bancaires, incluant retards, statistiques glissantes, différenciation, effets calendaires et de jours fériés, indicateurs de cohorte et cycle de vie, et indicateurs de marketing ou campagnes qui capturent les changements de demande et ruptures structurelles.
Caractéristiques de retard et avance pour revenusMoyennes glissantes, volatilité et ratiosEffets calendaires, fériés et paieCaractéristiques basées sur cohortes et cycle de vieIndicateurs d'impact marketing et campagnesLeçon 10Fractionnement des données et validation croisée pour séries chronologiques : fractionnements train/validation/test, CV fenêtre glissante, CV bloquéeConcevez des fractionnements de données et schémas de validation croisée adaptés au temps pour la prévision des revenus, incluant approches glissantes et bloquées, pour éviter les fuites, imiter l'usage en production et obtenir des estimations fiables de la performance des modèles dans le temps.
Fractionnements train, validation et test holdoutValidation fenêtre glissante et expansiveValidation croisée bloquée pour saisonnalitéPrévention des fuites temporelles dans les caractéristiquesBacktesting sur multiples origines de prévisionLeçon 11Métriques d'évaluation et analyse d'erreurs : MAE, RMSE, MAPE, MAPE symétrique, intervalles de prédiction et couvertureÉvaluez les prévisions de revenus en utilisant des métriques telles que MAE, RMSE, MAPE, MAPE symétrique et couverture d'intervalles, et effectuez une analyse détaillée des erreurs par segment, horizon et régime pour découvrir les biais et faiblesses des modèles.
Métriques d'erreur dépendantes de l'échelleMétriques d'erreur en pourcentage et relativesIntervalles de prédiction et couvertureDiagnostics au niveau horizon et segmentAnalyse d'erreurs par régime et événementLeçon 12Régresseurs macro et externes : utilisation de l'IPC, chômage, taux d'intérêt, mobilité, Google Trends ; sélection de caractéristiques et alignement des retardsIntégrez des régresseurs macroéconomiques et externes dans les modèles de revenus, tels que l'IPC, le chômage, les taux d'intérêt, la mobilité et les tendances de recherche, et apprenez des techniques d'alignement des retards, mise à l'échelle et sélection de caractéristiques pour éviter le surapprentissage.
Sélection d'indicateurs macro pertinentsAlignement des retards entre macro et revenusTransformation et mise à l'échelle des données externesSélection de caractéristiques et régularisationSuperpositions de stress et scénarios avec macros