سبق 1ਕ੍ਰੈਡਿਟ ਰਿਸਕ ਲਈ ਫੀਚਰ ਇੰਜੀਨੀਅਰਿੰਗ: ਇੰਟਰੈਕਸ਼ਨ ਸ਼ਬਦ, ਰੇਸ਼ੋ (ਕਰਜ਼ਾ-ਤੋਂ-ਆਯ), ਇਤਿਹਾਸਕ ਏਗਰੀਗੇਟਸਉੱਦਮੀ ਰਿਸਕ ਨੂੰ ਫੜਨ ਵਾਲੀਆਂ ਡੋਮੇਨ-ਜਾਣਕਾਰੀ ਵਾਲੀਆਂ ਫੀਚਰਾਂ ਨੂੰ ਵਿਕਸਿਤ ਕਰੋ। ਕਰਜ਼ਾ-ਤੋਂ-ਆਯ ਰੇਸ਼ੋ, ਇੰਟਰੈਕਸ਼ਨ ਸ਼ਬਦਾਂ ਅਤੇ ਇਤਿਹਾਸਕ ਏਗਰੀਗੇਟਸ ਬਣਾਓ, ਜਦੋਂ ਕਿ ਰੈਗੂਲੇਟਰੀ ਸਮੀਖਿਆ ਲਈ ਗੁੰਝਲਦਾਰੀ, ਸਥਿਰਤਾ ਅਤੇ ਵਿਆਖਿਆਯੋਗਤਾ ਨੂੰ ਟਰੈਕ ਕਰੋ।
Designing debt and affordability ratiosBehavioral features from transaction historyInteraction terms between key risk driversRolling and cumulative historical aggregatesEvaluating feature stability and drift riskسبق 2ਡਾਟਾ ਸੈੱਟ ਸਕੀਮਾ ਨੂੰ ਸਮਝਣਾ: ਡੈਮੋਗ੍ਰਾਫਿਕਸ, ਕ੍ਰੈਡਿਟ ਵਿਹਾਰ, ਪ੍ਰੋਡਕਟ, ਟਾਰਗੇਟਕ੍ਰੈਡਿਟ ਰਿਸਕ ਡਾਟਾ ਸੈੱਟਾਂ ਦੀ ਸਕੀਮਾ ਨੂੰ ਪੜ੍ਹਨ ਅਤੇ ਵੈਲੀਡੇਟ ਕਰਨਾ ਸਿੱਖੋ। ਡੈਮੋਗ੍ਰਾਫਿਕ, ਵਿਹਾਰਕ ਅਤੇ ਪ੍ਰੋਡਕਟ ਟੇਬਲਾਂ ਵਿੱਚ ਅੰਤਰ ਕਰੋ, ਟਾਰਗੇਟ ਲੇਬਲਾਂ ਅਤੇ ਸਮੇਂ ਦੇ ਫੀਲਡਾਂ ਨੂੰ ਸਮਝੋ, ਅਤੇ ਵਪਾਰਕ ਪਰਿਭਾਸ਼ਾਵਾਂ ਨਾਲ ਸਕੀਮਾ ਅਸੂਲੀਆਂ ਨੂੰ ਅਲਾਈਨ ਕਰੋ।
Mapping tables, keys, and grain of dataDemographic attributes and their limitationsCredit behavior and performance variablesProduct and exposure related attributesTarget labels, dates, and observation windowsسبق 3ਵਰਗੀਕ੍ਰਿਤ ਵੇਰੀਏਬਲਾਂ ਨੂੰ ਐਨਕੋਡ ਕਰਨਾ: ਆਰਡੀਨਲ ਵਿਚ ਨਾਮੀਕ, ਟਾਰਗੇਟ/ਇੰਪੈਕਟ ਐਨਕੋਡਿੰਗ, ਵਨ-ਹੌਟ, ਫ੍ਰੀਕੁਐਂਸੀ ਐਨਕੋਡਿੰਗਕ੍ਰੈਡਿਟ ਸਕੋਰਿੰਗ ਲਈ ਵਰਗੀਕ੍ਰਿਤ ਵੇਰੀਏਬਲਾਂ ਨੂੰ ਐਨਕੋਡ ਕਰਨ ਦੇ ਤਰੀਕਿਆਂ ਨੂੰ ਸਮਝੋ। ਆਰਡੀਨਲ ਅਤੇ ਨਾਮੀਕ ਐਨਕੋਡਿੰਗਾਂ, ਵਨ-ਹੌਟ ਅਤੇ ਫ੍ਰੀਕੁਐਂਸੀ ਸਕੀਮਾਂ, ਅਤੇ ਟਾਰਗੇਟ ਜਾਂ ਇੰਪੈਕਟ ਐਨਕੋਡਿੰਗ ਦੀ ਤੁਲਨਾ ਕਰੋ ਜਦੋਂ ਕਿ ਲੀਕੇਜ ਨੂੰ ਕੰਟਰੋਲ ਕਰੋ ਅਤੇ ਵਿਆਖਿਆਯੋਗਤਾ ਨੂੰ ਬਚਾਓ।
Identifying ordinal versus nominal categoriesOne‑hot encoding and curse of dimensionalityFrequency and count encodings for stabilityTarget and impact encoding with leakage controlEvaluating encodings for fairness and XAIسبق 4ਡਾਟਾ ਕੁਆਲਿਟੀ ਮੁਲਾਂਕਣ: ਗੈਰ-ਹਾਜ਼ਰੀ ਪੈਟਰਨਾਂ, ਅਸਧਾਰਨ ਵੈਲੂਆਂ, ਅਸੰਗਤ ਵਰਗਕ੍ਰੈਡਿਟ ਰਿਸਕ ਡਾਟਾ ਕੁਆਲਿਟੀ ਨੂੰ ਇੰਸਪੈਕਟ ਕਰਨਾ ਸਿੱਖੋ ਗੈਰ-ਹਾਜ਼ਰੀ ਪੈਟਰਨਾਂ, ਅਸਧਾਰਨ ਵੈਲੂਆਂ ਅਤੇ ਅਸੰਗਤ ਵਰਗਾਂ ਨੂੰ ਪਛਾਣ ਕੇ। ਸਮਝੋ ਕਿ ਇਹ ਮੁੱਦੇ ਰਿਸਕ ਅਨੁਮਾਨਾਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ ਅਤੇ ਮਾਡਲਿੰਗ ਤੋਂ ਪਹਿਲਾਂ ਠੀਕ ਕਰਨ ਲਈ ਤਰਜੀਹ ਕਿਵੇਂ ਦਿਓ।
Profiling variables and basic summary statisticsDetecting systematic and random missingnessIdentifying univariate and multivariate outliersFinding inconsistent or rare categorical levelsPrioritizing data quality issues by model impactسبق 5ਪ੍ਰੀਪ੍ਰੋਸੈੱਸਿੰਗ ਫੈਸਲਿਆਂ ਨੂੰ ਦਸਤਾਵੇਜ਼ੀਕਰਨਾ: ਦੁਹਰਾਉਣਯੋਗ ਪਾਈਪਲਾਈਨਾਂ, ਵਰਜ਼ਨਿੰਗ, ਮੈਟਾਡਾਟਾ ਕੈਪਚਰਕ੍ਰੈਡਿਟ ਰਿਸਕ ਲਈ ਦੁਹਰਾਉਣਯੋਗ ਪ੍ਰੀਪ੍ਰੋਸੈੱਸਿੰਗ ਪਾਈਪਲਾਈਨਾਂ ਬਣਾਓ। ਹਰ ਰূਪਾਂਤਰਣ ਨੂੰ ਦਸਤਾਵੇਜ਼ੀਕਰੋ, ਵਰਜ਼ਨਾਂ ਨੂੰ ਪ੍ਰਬੰਧਿਤ ਕਰੋ, ਅਤੇ ਮੈਟਾਡਾਟਾ ਕੈਪਚਰ ਕਰੋ ਤਾਂ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਆਡਿਟ, ਵਿਆਖਿਆ ਅਤੇ ਸਮੇਂ ਨਾਲ ਭਰੋਸੇਯੋਗ ਰੀ-ਰਨ ਕੀਤਾ ਜਾ ਸਕੇ।
Structuring end‑to‑end preprocessing pipelinesRecording assumptions and data decisionsTracking code, config, and model versionsCapturing feature and dataset metadataPreparing documentation for audits and XAIسبق 6ਸਮੇਂ ਸਬੰਧੀ ਲੀਕੇਜ ਅਤੇ ਡਾਟਾ ਸਪਲਿੱਟਸ ਨਾਲ ਨਿਪਟਣਾ: ਸਮੇਂ-ਅਧਾਰਤ ਵੰਡਾਂ, ਲੇਬਲ ਲੀਕੇਜ ਰੋਕਣਾਕ੍ਰੈਡਿਟ ਰਿਸਕ ਮਾਡਲਿੰਗ ਵਿੱਚ ਸਮੇਂ ਸਬੰਧੀ ਲੀਕੇਜ ਨੂੰ ਹੱਲ ਕਰੋ। ਸਮੇਂ-ਅਧਾਰਤ ਸਪਲਿੱਟਸ ਡਿਜ਼ਾਈਨ ਕਰੋ, ਫੀਚਰ ਵਿੰਡੋਜ਼ ਨੂੰ ਟਾਰਗੇਟ ਤਾਰੀਖਾਂ ਨਾਲ ਅਲਾਈਨ ਕਰੋ, ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਵੈਲੀਡੇਸ਼ਨ ਡਾਟਾ ਸੈੱਟਾਂ ਵਿੱਚ ਲੇਬਲ ਅਤੇ ਭਵਿੱਖ ਦੀ ਜਾਣਕਾਰੀ ਲੀਕੇਜ ਨੂੰ ਰੋਕੋ।
Defining event dates and reference timesDesigning time‑based train–test splitsAligning feature windows with targetsDetecting and preventing label leakageBacktesting strategies for stability checksسبق 7ਫੀਚਰ ਗਰੁੱਪਿੰਗ ਅਤੇ ਡੋਮੇਨ ਮੈਪਿੰਗ: ਡੈਮੋਗ੍ਰਾਫਿਕ, ਵਿਹਾਰ ਅਤੇ ਪ੍ਰੋਡਕਟ ਫੀਚਰ ਸੈੱਟਸ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾਮਾਡਲਿੰਗ ਅਤੇ ਵਿਆਖਿਆਵਾਂ ਨੂੰ ਸਮਰਥਨ ਦੇਣ ਲਈ ਫੀਚਰਾਂ ਨੂੰ ਸੰਗਠਿਤ ਡੋਮੇਨ ਗਰੁੱਪਾਂ ਵਿੱਚ ਵੰਡੋ। ਡੈਮੋਗ੍ਰਾਫਿਕ, ਵਿਹਾਰਕ ਅਤੇ ਪ੍ਰੋਡਕਟ ਫੀਚਰ ਸੈੱਟਸ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ, ਅਤੇ ਕੱਚੇ ਫੀਲਡਾਂ ਨੂੰ ਵਪਾਰਕ ਸੰਕਲਪਾਂ ਅਤੇ ਰੈਗੂਲੇਟਰੀ ਟੈਕਸੋਨੋਮੀਆਂ ਨਾਲ ਮੈਪ ਕਰੋ।
Creating demographic feature groupsGrouping behavioral and utilization featuresProduct and collateral feature setsMapping raw fields to business conceptsUsing groups in reports and explanationsسبق 8ਸਕੇਲਿੰਗ ਅਤੇ ਰੂਪਾਂਤਰਣ: ਕਦੋਂ ਸਟੈਂਡਰਡਾਈਜ਼ ਕਰੋ, ਵਿਕ੍ਰਿਤ ਆਰਥਿਕ ਫੀਚਰਾਂ ਲਈ ਲੌਗ ਰੂਪਾਂਤਰਾਨਕ੍ਰੈਡਿਟ ਫੀਚਰਾਂ ਨੂੰ ਸਕੇਲ ਜਾਂ ਰੂਪਾਂਤਰਿਤ ਕਰਨ ਦਾ ਅਧਿਐਨ ਕਰੋ ਕਿ ਕਦੋਂ ਅਤੇ ਕਿਵੇਂ। ਸਟੈਂਡਰਡਾਈਜ਼ੇਸ਼ਨ, ਰੋਬਸਟ ਸਕੇਲਿੰਗ, ਅਤੇ ਵਿਕ੍ਰਿਤ ਆਰਥਿਕ ਵੇਰੀਏਬਲਾਂ ਲਈ ਲੌਗ ਜਾਂ ਪਾਵਰ ਰੂਪਾਂਤਰਾਨਾਂ ਨੂੰ ਸਿੱਖੋ, ਅਤੇ ਦੂਰੀ-ਅਧਾਰਤ ਅਤੇ ਲੀਨੀਅਰ ਮਾਡਲਾਂ ਤੇ ਉਹਨਾਂ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਸਮਝੋ।
Choosing scaling based on model familyStandardization versus min–max scalingRobust scaling for heavy‑tailed distributionsLog and power transforms for skewed amountsHandling zeros and negatives in transformsسبق 9ਵੇਰੀਏਬਲ ਟਾਈਪ ਪ੍ਰਤੀ ਇੰਪਿਊਟੇਸ਼ਨ ਰਣਨੀਤੀਆਂ: ਸਾਧਾਰਨ, ਮਾਡਲ-ਅਧਾਰਤ, ਇੰਡੀਕੇਟਰ ਫਲੈਗਾਂਕ੍ਰੈਡਿਟ ਰਿਸਕ ਡਾਟਾ ਵਿੱਚ ਨਿਊਮੈਰਿਕ, ਵਰਗੀਕ੍ਰਿਤ ਅਤੇ ਤਾਰੀਖ ਵੇਰੀਏਬਲਾਂ ਲਈ ਇੰਪਿਊਟੇਸ਼ਨ ਵਿਧੀਆਂ ਦੀ ਖੋਜ ਕਰੋ। ਸਾਧਾਰਨ ਨਿਯਮਾਂ, ਮਾਡਲ-ਅਧਾਰਤ ਇੰਪਿਊਟਰਾਂ, ਅਤੇ ਗੈਰ-ਹਾਜ਼ਰੀ ਇੰਡੀਕੇਟਰ ਫਲੈਗਾਂ ਦੀ ਤੁਲਨਾ ਕਰੋ, ਪੱਖਪਾਤ, ਵੇਰੀਏਂਸ ਅਤੇ ਵਿਆਖਿਆਯੋਗਤਾ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰਦੇ ਹੋਏ।
Classifying variables by type and roleMean, median, and mode imputation trade‑offsKNN and model‑based imputation for numericsImputing categorical and date features safelyUsing missingness indicator flags in XAI