บทเรียนที่ 1Validation framework: train/validation/test ตาม application vintage, time-based backtesting, population stability index, PSI และ feature drift checksเรียนรู้วิธีการ operationalize รุ่นความเสี่ยงเครดิต ครอบคลุม scoring latency, system integration, data lineage, monitoring pipelines, periodic revalidation, และ automated alerts สำหรับ performance degradation และ retraining triggers
Batch เทียบ real-time scoring flowsLatency และ throughput targetsData lineage และ audit trailsModel performance dashboardsRevalidation และ review cadenceAutomated retraining triggersบทเรียนที่ 2Regulatory และ fairness controls: bias detection (disparate impact, equalized odds), protected attribute handling, documentation และ model cards, explainability requirementsใช้ stress testing และ scenario analysis กับ credit portfolios สร้าง adverse macroeconomic scenarios ประเมิน sensitivity ต่อ unemployment และ interest rates และตรวจสอบ concentration risks ข้าม sectors และ regions
Regulatory เทียบ internal stress testsการออกแบบ macroeconomic scenariosการเชื่อมโยง PD และ LGD กับ macro pathsUnemployment และ rate sensitivitiesSector และ regional concentrationsReverse stress testing methodsบทเรียนที่ 3Data preprocessing: data cleaning, missing value strategies (imputation, indicator variables), outlier handling และ winsorizationสำรวจวิธีการจัดหา public และ synthetic credit datasets เข้าใจ typical feature groups และออกแบบ realistic synthetic data ที่รักษาความสัมพันธ์หลัก ขณะปกป้องความเป็นส่วนตัวและสนับสนุนการทดลอง
Key public credit data sourcesDemographic และ employment featuresIncome และ affordability variablesAccount behavior และ delinquency dataCredit bureau และ inquiry variablesการออกแบบ realistic synthetic datasetsบทเรียนที่ 4Stress testing และ scenario analysis สำหรับ credit portfolios: adverse macro scenarios, sensitivity ต่อ unemployment และ rates, concentration risk checksเรียนรู้วิธีการกำหนด prediction targets สำหรับความเสี่ยงเครดิต เชื่อมโยงกับ business objectives เช่น underwriting และ collections และออกแบบ robust labeling strategies ที่เคารพ time ordering และหลีกเลี่ยง target leakage
PD horizon และ default definitionsLGD และ EAD proxy constructionUse cases: underwriting เทียบ limitsTime windows และ lookback periodsการหลีกเลี่ยง target leakage ใน labelsบทเรียนที่ 5การกำหนด prediction target และ business use (PD ภายใน 12 เดือน, loss given default proxies) และ required labeling strategiesออกแบบ robust validation framework สำหรับ credit models โดยใช้ time-aware splits ตาม application vintage, backtesting บน historical periods, และ monitoring stability ด้วย PSI และ feature drift checks ข้าม portfolios และ segments
Train/validation/test ตาม vintageRolling และ expanding backtestsOut-of-time validation designPopulation Stability Index (PSI)Feature drift และ covariate shiftSegment-level performance checksบทเรียนที่ 6Explainability และ interpretability: SHAP values, partial dependence plots, monotonic constraints, simplified scorecard mapping จาก model outputsตรวจสอบวิธีการจัดการ class imbalance ใน default prediction รวมถึง resampling, class-weighted และ focal losses, และ threshold selection ที่สอดคล้องกับ business constraints เรื่อง approval rates, losses, และ capital usage
การวัด imbalance และ rarityRandom oversampling และ undersamplingSMOTE และ related techniquesClass-weighted และ focal lossesThreshold tuning ต่อ business KPIsReject inference considerationsบทเรียนที่ 7Modeling choices: logistic regression ด้วย regularization, tree ensembles (XGBoost/LightGBM/CatBoost), neural nets และ calibrated probability outputsพัฒนา explainable credit models โดยใช้ SHAP values, partial dependence, และ monotonic constraints และแปลง complex model outputs เป็น simplified scorecards ที่ตรงตาม regulatory และ business stakeholder needs
Global เทียบ local explanationsSHAP value computation และ usePartial dependence และ ICE plotsMonotonic constraints ใน modelsSurrogate และ rule-based modelsScorecard mapping จาก ML outputsบทเรียนที่ 8Model selection และ calibration: ROC AUC, PR AUC, Brier score, calibration plots, isotonic และ Platt calibrationเข้าใจ regulatory expectations และ fairness controls สำหรับ credit models รวมถึง bias detection metrics, handling protected attributes, documentation standards, model cards, และ explainability obligations ตาม key regulations
Key credit risk regulations overviewProtected attributes และ proxiesBias metrics และ disparate impactEqualized odds และ calibrationAdverse action และ reason codesModel cards และ documentationบทเรียนที่ 9การจัดหา public credit datasets และ synthetic dataset design: expected feature groups (demographics, employment, income, account behavior, credit bureau variables)เปรียบเทียบ modeling options สำหรับความเสี่ยงเครดิต จาก regularized logistic regression และ scorecards ถึง tree ensembles และ neural networks โดยเน้น probability outputs, stability, interpretability, และ deployment constraints
Regularized logistic regressionScorecard-style logistic modelsGradient boosting และ XGBoostLightGBM และ CatBoost specificsNeural networks สำหรับ tabular creditCalibrated probability outputsบทเรียนที่ 10Feature engineering สำหรับความเสี่ยงเครดิต: scorecard-style variables, binning/WOE transformation, interaction terms, behavioral features จาก transaction historyเรียนรู้วิธีการเลือกและ calibrate credit risk models โดยใช้ metrics เช่น ROC AUC, PR AUC, และ Brier score และใช้ calibration methods เช่น Platt scaling และ isotonic regression พร้อม validation และ monitoring อย่างระมัดระวัง
ROC AUC และ PR AUC interpretationGini, KS, และ rank orderingBrier score และ log loss usageCalibration curves และ plotsPlatt scaling implementationIsotonic regression calibrationบทเรียนที่ 11Operationalization และ monitoring: scoring latency, data lineage, periodic revalidation, performance degradation alerts, retraining triggersเข้าใจ data preprocessing สำหรับ credit modeling รวมถึงการทำความสะอาด raw tables, จัดการ missing values ด้วย strategies ที่เหมาะสม, จัดการ outliers, และใช้ winsorization ขณะรักษา risk signal และ auditability
Data quality checks และ cleaningJoin keys และ deduplication rulesMissing value imputation methodsMissingness indicators เป็น featuresOutlier detection และ treatmentWinsorization และ capping choicesบทเรียนที่ 12การจัดการ class imbalance: resampling (oversampling, SMOTE), class-weighted losses, focal loss, threshold selection ที่สอดคล้องกับ business constraintsเรียนรู้การสร้าง predictive features สำหรับความเสี่ยงเครดิต รวมถึง scorecard-style variables, binning และ WOE, interaction terms, และ behavioral features จาก transaction และ repayment histories เพื่อจับ borrower dynamics
Scorecard-style variable designSupervised binning และ WOEMonotonic binning constraintsInteraction และ ratio featuresBehavioral features จาก historyAggregation windows และ recency