سبق 1total_sessions ਅਤੇ total_spent ਲਈ ਔਟਲਾਈਅਰ ਡਿਟੈਕਸ਼ਨ ਅਤੇ ਟ੍ਰੀਟਮੈਂਟਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ, ਰੋਬਸਟ ਸਟੈਟਿਸਟਿਕਸ ਅਤੇ ਮਾਡਲ-ਆਧਾਰਿਤ ਵਿਧੀਆਂ ਵਰਤ ਕੇ total_sessions ਅਤੇ total_spent ਵਿੱਚ ਔਟਲਾਈਅਰ ਨੂੰ ਡਿਟੈਕਟ ਅਤੇ ਟ੍ਰੀਟ ਕਰੋ, ਚੁਰਨ ਸਿਗਨਲ ਅਤੇ ਬਿਜ਼ਨਸ ਪ੍ਰਭਾਵ ਆਧਾਰਿਤ ਕੈਪ, ਟ੍ਰਾਂਸਫਾਰਮ ਜਾਂ ਐਕਸਟ੍ਰੀਮਜ਼ ਰੱਖਣ ਦਾ ਫੈਸਲਾ ਕਰੋ।
Profiling sessions and spend tailsZ-scores and robust z-scoresIQR and percentile-based cappingTransforming vs trimming outliersImpact on churn model stabilityسبق 2ਪਾਈਪਲਾਈਨ ਨਿਰਮਾਣ ਅਤੇ ਰੀਪ੍ਰੋਡਿਊਸੀਬਿਲਟੀ: sklearn ਪਾਈਪਲਾਈਨਾਂ, ਕਾਲਮ ਟ੍ਰਾਂਸਫਾਰਮਰ, ਡਾਟਾਸੈੱਟ ਵਰਜ਼ਨਿੰਗsklearn ਪਾਈਪਲਾਈਨਾਂ ਅਤੇ ਕਾਲਮਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਨਾਲ ਰੀਪ੍ਰੋਡਿਊਸੀਬਲ ਪ੍ਰੀਪ੍ਰੋਸੈਸਿੰਗ ਬਣਾਓ, ਫੀਚਰ ਬ੍ਰਾਂਚਾਂ ਮੈਨੇਜ ਕਰੋ, ਡਾਟਾਸੈੱਟ ਵਰਜ਼ਨ ਟਰੈਕ ਕਰੋ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਐਨਵਾਇਰਨਮੈਂਟਸ ਵਿਚਕਾਰ ਸਥਿਰ ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨਾਂ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ।
Basics of sklearn PipelinesUsing ColumnTransformer effectivelyCustom transformers for churn dataPersisting and loading pipelinesDataset and feature versioningسبق 3ਨਿਊਮੈਰਿਕ ਅਤੇ ਕੈਟੈਗੋਰੀਕਲ ਫੀਲਡਸ ਲਈ ਇੰਪਿਊਟੇਸ਼ਨ ਰਣਨੀਤੀਆਂ; ਮਿਸਿੰਗਨੈੱਸ ਟਾਈਪ ਅਨੁਸਾਰ ਢੰਗਮਿਸਿੰਗਨੈੱਸ ਮੀਕੈਨਿਜ਼ਮ ਨੂੰ ਸਮਝੋ, ਨਿਊਮੈਰਿਕ ਅਤੇ ਕੈਟੈਗੋਰੀਕਲ ਗੈਪਸ ਦਾ ਪ੍ਰੋਫਾਈਲ, ਅਤੇ ਔਸਤ, ਮੀਡੀਅਨ, ਮੋਡ, MICE ਅਤੇ ਮਾਡਲ-ਆਧਾਰਿਤ ਇੰਪਿਊਟੇਸ਼ਨ ਲਾਗੂ ਕਰੋ ਜਦੋਂ ਤੱਕ ਵੰਡਾਂ ਨੂੰ ਸੰਭਾਲੋ ਅਤੇ ਚੁਰਨ ਡਾਟਾਸੈੱਟਸ ਵਿੱਚ ਟਾਰਗੈਟ ਲੀਕੇਜ ਤੋਂ ਬਚੋ।
Types of missingness: MCAR, MAR, MNARSimple numeric imputation methodsCategorical imputation strategiesAdvanced and model-based imputationImputation and leakage concernsسبق 4ਸਕੇਲਿੰਗ ਅਤੇ ਨੌਰਮਲਾਈਜ਼ੇਸ਼ਨ ਵਿਧੀਆਂ: ਸਟੈਂਡਰਡਾਈਜ਼ੇਸ਼ਨ, ਰੋਬਸਟ ਸਕੇਲਿੰਗ, ਸਕਿਊਡ ਖਰਚ ਲਈ ਲੌਗ ਟ੍ਰਾਂਸਫਾਰਮਸਟੈਂਡਰਡਾਈਜ਼ੇਸ਼ਨ, ਮਿਨ-ਮੈਕਸ ਅਤੇ ਰੋਬਸਟ ਸਕੇਲਿੰਗ ਦੀ ਤੁਲਨਾ ਕਰੋ, ਸਕਿਊਡ ਖਰਚ ਲਈ ਲੌਗ ਅਤੇ ਬਾਕਸ-ਕੌਕਸ ਟ੍ਰਾਂਸਫਾਰਮ ਲਾਗੂ ਕਰੋ, ਅਤੇ ਸਕੇਲਿੰਗ ਨੇ ਡਿਸਟੈਂਸ-ਆਧਾਰਿਤ, ਲੀਨੀਅਰ ਅਤੇ ਟ੍ਰੀ-ਆਧਾਰਿਤ ਚੁਰਨ ਮਾਡਲਾਂ ਨਾਲ ਕਿਵੇਂ ਇੰਟਰੈਕਟ ਕਰਦਾ ਹੈ ਇਹ ਸਮਝੋ।
When scaling is necessaryStandardScaler vs MinMaxScalerRobust scaling for heavy tailsLog transforms for skewed spendScaling effects on algorithmsسبق 5ਕੈਟੈਗੋਰੀਕਲ ਵੇਰੀਏਬਲਸ ਐਨਕੋਡ ਕਰਨਾ: ਵਨ-ਹੌਟ, ਟਾਰਗੈਟ ਐਨਕੋਡਿੰਗ, ਆਰਡੀਨਲ ਐਨਕੋਡਿੰਗ ਅਤੇ ਹਰੇਕ ਵਰਤਣ ਦਾ ਸਮਾਂਵਨ-ਹੌਟ, ਆਰਡੀਨਲ ਅਤੇ ਟਾਰਗੈਟ ਐਨਕੋਡਿੰਗ ਵਰਤਣ ਦਾ ਸਮਾਂ ਐਕਸਪਲੋਰ ਕਰੋ, ਹਾਈ-ਕਾਰਡੀਨੈਲਿਟੀ ਫੀਚਰਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰੋ, ਟਾਰਗੈਟ ਐਨਕੋਡਿੰਗ ਵਿੱਚ ਟਾਰਗੈਟ ਲੀਕੇਜ ਤੋਂ ਬਚੋ, ਅਤੇ ਲੀਨੀਅਰ ਅਤੇ ਟ੍ਰੀ-ਆਧਾਰਿਤ ਚੁਰਨ ਮਾਡਲਾਂ ਤੇ ਐਨਕੋਡਿੰਗ ਪ੍ਰਭਾਵ ਨੂੰ ਅਸੈੱਸ ਕਰੋ।
One-hot encoding and sparsityOrdinal encoding for ordered levelsTarget encoding with smoothingHandling high-cardinality featuresEncoding choices by model typeسبق 6ਡਾਟਾ ਲੀਕੇਜ ਰਿਸਕਸ: ਸਮੇਂ ਵਾਲਾ ਲੀਕੇਜ, ਭਵਿੱਖ ਦੀ ਜਾਣਕਾਰੀ ਵਰਤਣਾ, ਸਹੀ ਟ੍ਰੇਨ-ਟੈਸਟ ਸਪਲਿਟਸਸਮੇਂ ਵਾਲੇ ਆਰਡਰਿੰਗ, ਭਵਿੱਖ ਦੀ ਜਾਣਕਾਰੀ ਅਤੇ ਟਾਰਗੈਟ-ਡਰਾਈਵਡ ਫੀਚਰਾਂ ਤੋਂ ਡਾਟਾ ਲੀਕੇਜ ਨੂੰ ਆਈਡੈਂਟੀਫਾਈ ਅਤੇ ਰੋਕੋ, ਸਹੀ ਟ੍ਰੇਨ-ਟੈਸਟ ਸਪਲਿਟਸ ਡਿਜ਼ਾਈਨ ਕਰੋ, ਅਤੇ ਚੁਰਨ ਪਰਫਾਰਮੈਂਸ ਅਨੁਮਾਨਾਂ ਨੂੰ ਹੌਨੈਸਟ ਰੱਖਣ ਲਈ ਪਾਈਪਲਾਈਨਾਂ ਵੈਲੀਡੇਟ ਕਰੋ।
Common leakage patterns in churnTemporal ordering and cut-off datesFeature creation without targetsSafe cross-validation strategiesAuditing pipelines for leakageسبق 7ਡੇਟ/ਟਾਈਮ ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨਾਂ: ਟੈਨਿਊਰ, ਰੀਸੈਂਸੀ, ਫ੍ਰੀਕੁਐਂਸੀ, ਸੀਜ਼ਨੈਲਿਟੀ ਫੀਚਰ ਕੱਢਣਾਟੈਨਿਊਰ, ਰੀਸੈਂਸੀ, ਫ੍ਰੀਕੁਐਂਸੀ ਅਤੇ ਸੀਜ਼ਨੈਲਿਟੀ ਵਰਗੀਆਂ ਡੇਟ ਅਤੇ ਟਾਈਮ ਫੀਚਰਾਂ ਨੂੰ ਇੰਜੀਨੀਅਰ ਕਰੋ, ਟਾਈਮ ਜ਼ੋਨ ਅਤੇ ਅਨਿਯਮਿਤ ਐਕਟੀਵਿਟੀ ਨੂੰ ਹੈਂਡਲ ਕਰੋ, ਅਤੇ ਸਮੇਂ ਨਾਲ ਚੁਰਨ ਰਿਸਕ ਡਾਇਨੈਮਿਕਸ ਨੂੰ ਕੈਪਚਰ ਕਰਨ ਵਾਲੀਆਂ ਸਮੇਂ ਵਾਲੀਆਂ ਫੀਚਰਾਂ ਤਿਆਰ ਕਰੋ।
Parsing and cleaning timestampsCustomer tenure and age featuresRecency and frequency metricsSeasonality and calendar effectsTime windows and aggregationسبق 8ਚੁਰਨ ਲਈ ਕਲਾਸ ਇੰਬੈਲੈਂਸ ਹੈਂਡਲ ਕਰਨਾ: ਅੰਡਰਸੈਂਪਲਿੰਗ, ਓਵਰਸੈਂਪਲਿੰਗ, SMOTE, ਕਲਾਸ ਵੈਟਸਚੁਰਨ ਕਲਾਸ ਇੰਬੈਲੈਂਸ ਨੂੰ ਡਾਇਗਨੋਜ਼ ਕਰਨ ਦਾ ਢੰਗ ਸਿੱਖੋ, ਅੰਡਰਸੈਂਪਲਿੰਗ, ਓਵਰਸੈਂਪਲਿੰਗ, SMOTE ਅਤੇ ਕਲਾਸ ਵੈਟਸ ਦੀ ਤੁਲਨਾ ਕਰੋ, ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਚੁਰਨ ਮਾਡਲਾਂ ਵਿੱਚ ਮੈਟ੍ਰਿਕਸ, ਮਾਡਲ ਸਥਿਰਤਾ ਅਤੇ ਬਿਜ਼ਨਸ ਇੰਟਰਪ੍ਰੇਟੇਸ਼ਨ ਤੇ ਉਹਨਾਂ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਮੁਲਾਂਕਣ ਕਰੋ।
Measuring churn class imbalanceRandom under- and oversamplingSMOTE and SMOTE variantsUsing class weights in modelsEvaluating imbalance strategiesسبق 9ਬਿਹੇਵੀਅਰਲ ਫੀਚਰ ਇੰਜੀਨੀਅਰਿੰਗ: ਸੈਸ਼ਨ ਫ੍ਰੀਕੁਐਂਸੀ, ਸੈਸ਼ਨ ਪ੍ਰਤੀ ਔਸਤ ਖਰਚ, ਚੁਰਨ ਪ੍ਰੌਕਸੀਸੈਸ਼ਨ ਅਤੇ ਖਰਚ ਤੋਂ ਫ੍ਰੀਕੁਐਂਸੀ, ਇੰਟੈਂਸਿਟੀ ਅਤੇ ਵੋਲੈਟਿਲਿਟੀ ਵਰਗੀਆਂ ਬਿਹੇਵੀਅਰਲ ਫੀਚਰਾਂ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰੋ, ਚੁਰਨ ਪ੍ਰੌਕਸੀ ਲੇਬਲ ਬਣਾਓ, ਅਤੇ ਕੱਚੇ ਲੌਗਸ ਨੂੰ ਚੁਰਨ ਮਾਡਲਾਂ ਲਈ ਸਥਿਰ, ਇੰਟਰਪ੍ਰੇਟੇਬਲ ਪ੍ਰੈਡਿਕਟਰਾਂ ਵਿੱਚ ਬਦਲੋ।
Session frequency and intensityAverage and median spend metricsVolatility and trend featuresEngagement and inactivity signalsConstructing churn proxy labelsسبق 10ਫੀਚਰ ਚੋਣ ਅਤੇ ਡਾਈਮੈਂਸ਼ਨੈਲਿਟੀ ਘਟਾਉਣਾ: ਕੋਰੀਲੇਸ਼ਨ ਜਾਂਚਾਂ, ਮਿਊਚੁਅਲ ਜਾਣਕਾਰੀ, PCA ਬੇਸਿਕਸਕੋਰੀਲੇਸ਼ਨ ਜਾਂਚਾਂ, ਮਿਊਚੁਅਲ ਜਾਣਕਾਰੀ ਅਤੇ ਮਾਡਲ-ਆਧਾਰਿਤ ਮਹੱਤਵ ਲਾਗੂ ਕਰਕੇ ਫੀਚਰ ਚੁਣੋ, ਡਾਈਮੈਂਸ਼ਨੈਲਿਟੀ ਘਟਾਉਣ ਲਈ PCA ਪੇਸ਼ ਕਰੋ, ਅਤੇ ਚੁਰਨ ਪ੍ਰੈਡਿਕਸ਼ਨ ਵਿੱਚ ਇੰਟਰਪ੍ਰੇਟੇਬਿਲਟੀ ਨੂੰ ਪਰਫਾਰਮੈਂਸ ਨਾਲ ਬੈਲੈਂਸ ਕਰੋ।
Univariate filter methodsCorrelation and redundancy checksMutual information for churnWrapper and embedded methodsPCA basics and interpretation