سبق 1ਵਰਗੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਐਨਕੋਡ ਕਰਨਾ: ਉਤਪਾਦ_ਕੈਟੇਗਰੀ ਅਤੇ ਖੇਤਰ ਲਈ ਵਨ-ਹੌਟ, ਟਾਰਗੇਟ/ਔਸਤ ਐਨਕੋਡਿੰਗ, ਅਤੇ ਘੱਟ ਆਮ ਵਰਗੀਆਂ ਨੂੰ ਹੈਂਡਲ ਕਰਨਾਅਨੁਮਾਨ ਮਾਡਲਾਂ ਲਈ ਵਰਗੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਐਨਕੋਡ ਕਰਨ ਦੀਆਂ ਵਿਹਾਰਕ ਵਿਧੀਆਂ ਸਿੱਖੋ। ਅਸੀਂ ਉਤਪਾਦ ਅਤੇ ਖੇਤਰ ਲਈ ਵਨ-ਹੌਟ ਅਤੇ ਟਾਰਗੇਟ ਐਨਕੋਡਿੰਗ, ਘੱਟ ਆਮ ਪੱਧਰਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰਨ ਅਤੇ ਟਾਰਗੇਟ-ਅਧਾਰਤ ਐਨਕੋਡਰਾਂ ਵਰਤੋਂ ਸਮੇਂ ਲੀਕੇਜ ਤੋਂ ਬਚਣ ਬਾਰੇ ਚਰਚਾ ਕਰਾਂਗੇ।
One-hot encoding for stable categoriesTarget and mean encoding for high-cardinalityFrequency encoding for sparse categoriesGrouping and pooling rare category levelsLeakage-safe target encoding proceduresسبق 2ਸਮੇਂ-ਸ਼੍ਰੇਣੀ ਲਈ ਡਾਟਾ ਵੰਡਣਾ: ਢੁਕਵੀਂ ਸਮੇਂ-ਅਧਾਰਤ ਟ੍ਰੇਨ/ਵੈਲੀਡੇਸ਼ਨ/ਟੈਸਟ ਵੰਡ ਰਣਨੀਤੀਆਂ, ਰੋਲਿੰਗ ਵਿੰਡੋਜ਼, ਅਤੇ ਸਮੇਂ ਸੰਬੰਧੀ ਨਿਰਭਰਤਾ ਲਈ ਬਲਾਕਡ ਕ੍ਰੌਸ-ਵੈਲੀਡੇਸ਼ਨਅਨੁਮਾਨ ਮੁਲਾਂਕਣ ਲਈ ਸਮੇਂ-ਜਾਗਰੂਕ ਡਾਟਾ ਵੰਡੋਗੇ ਨੂੰ ਮਾਹਰ ਬਣੋ। ਤੁਸੀਂ ਟ੍ਰੇਨ, ਵੈਲੀਡੇਸ਼ਨ ਅਤੇ ਟੈਸਟ ਵੰਡਾਂ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰੋਗੇ ਜੋ ਸਮੇਂ ਦੇ ਕ੍ਰਮ ਨੂੰ ਗੌਰਵ ਕਰਦੀਆਂ ਹਨ, ਰੋਲਿੰਗ ਵਿੰਡੋਜ਼ ਵਰਤਦੀਆਂ ਹਨ, ਅਤੇ ਅਸਲ ਡਿਪਲਾਏਮੈਂਟ ਸਥਿਤੀਆਂ ਨੂੰ ਨਕਲ ਕਰਨ ਲਈ ਬਲਾਕਡ ਕ੍ਰੌਸ-ਵੈਲੀਡੇਸ਼ਨ ਲਾਗੂ ਕਰੋਗੇ।
Holdout splits that respect temporal orderRolling and expanding window evaluationBlocked cross-validation for time seriesAligning split dates with business cyclesAvoiding lookahead bias in split designسبق 3ਮੌਸਮੀ ਅਤੇ ਛੁੱਟੀ ਸੰਕੇਤ: ਸਾਲ ਦੇ ਮਹੀਨੇ, ਕੁਆਰਟਰ, ਮੁੱਖ ਅਮਰੀਕੀ ਛੁੱਟੀ ਝੰਡੇ, ਖਰੀਦਦਾਰੀ ਇਵੈਂਟ (ਬਲੈਕ ਫ੍ਰਾਈਡੇ, ਸਾਈਬਰ ਮੰਡੇ) ਅਤੇ ਪ੍ਰੋਮੋ ਵਿੰਡੋਜ਼ ਬਣਾਉਣਾਮੌਸਮੀ ਅਤੇ ਛੁੱਟੀ ਸੰਕੇਤਾਂ ਨਾਲ ਫਿਰਦਾਰ ਪੈਟਰਨ ਨੂੰ ਫੜੋ। ਤੁਸੀਂ ਮਹੀਨੇ ਅਤੇ ਕੁਆਰਟਰ ਡੱਮੀਜ਼, ਮੁੱਖ ਅਮਰੀਕੀ ਛੁੱਟੀ ਝੰਡੇ, ਖਰੀਦਦਾਰੀ ਇਵੈਂਟ ਮਾਰਕਰ (ਬਲੈਕ ਫ੍ਰਾਈਡੇ, ਸਾਈਬਰ ਮੰਡੇ) ਅਤੇ ਰਿਟੇਲ ਵਿਕਰੀ ਅਨੁਮਾਨ ਲਈ ਢੁਕਵੀਂ ਪ੍ਰੋਮੋ ਵਿੰਡੋ ਸੰਕੇਤ ਬਣਾਓਗੇ।
Lagged marketing_spend by channel and campaignMarketing_spend × discount_rate interaction featuresWebsite_visits as channel attribution proxyAligning marketing features to monthly salesAvoiding data leakage in causal featuresسبق 4ਮਾਰਕੀਟਿੰਗ ਅਤੇ ਕਾਰਨ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ: ਲੈਗਡ marketing_spend, ਇੰਟਰੈਕਸ਼ਨ ਸ਼ਬਦ (marketing_spend × discount_rate), website_visits ਤੋਂ ਚੈਨਲ ਐਟ੍ਰੀਬਿਊਸ਼ਨ ਪ੍ਰੌਕਸੀਆਂ ਬਣਾਉਣਾਕੱਚੇ ਮਾਰਕੀਟਿੰਗ ਅਤੇ ਵੈੱਬ ਡਾਟਾ ਨੂੰ ਪੂਰਵਾਨੁਮਾਨ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿੱਚ ਬਦਲਣ ਦੇ ਤਰੀਕੇ ਸਿੱਖੋ। ਅਸੀਂ ਲੈਗਡ ਮਾਰਕੀਟਿੰਗ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਡਿਸਕਾਊਂਟ ਨਾਲ ਇੰਟਰੈਕਸ਼ਨ ਸ਼ਬਦਾਂ, ਅਤੇ ਮਹੀਨਾਵਾਰ ਵਿਕਰੀਆਂ ਤੇ ਮਾਰਕੀਟਿੰਗ ਪ੍ਰਭਾਵ ਨੂੰ ਬਿਹਤਰ ਫੜਨ ਵਾਲੇ ਚੈਨਲ ਐਟ੍ਰੀਬਿਊਸ਼ਨ ਪ੍ਰੌਕਸੀਆਂ ਨੂੰ ਘੇਰਾਂਗੇ।
Month-of-year and quarter dummy variablesUS federal and retail holiday flagsBlack Friday and Cyber Monday indicatorsPromo window start and end markersOverlapping holiday and promo effectsسبق 5ਅਸਧਾਰਨ ਪਛਾਣ ਅਤੇ ਇਲਾਜ: ਗਣਿਤਕ ਨਿਯਮ (IQR, z-ਸਕੋਰ), ਵਪਾਰਕ ਨਿਯਮ ਫਿਲਟਰ, ਵਿਨਸੋਰਾਈਜ਼ਿੰਗ ਬਨਾਮ ਟ੍ਰਿਮਿੰਗ, ਅਤੇ ਅਸਧਾਰਨ ਨੂੰ ਕਦੇ ਰੱਖਣਾਵਿਕਰੀ ਅਤੇ ਮਾਰਕੀਟਿੰਗ ਡਾਟਾ ਵਿੱਚ ਅਸਧਾਰਨ ਮੁੱਲਾਂ ਨੂੰ ਪਛਾਣਨ ਅਤੇ ਇਲਾਜ ਕਰਨ ਦੇ ਤਰੀਕੇ ਸਮਝੋ। ਤੁਸੀਂ ਗਣਿਤਕ ਨਿਯਮ, ਵਪਾਰਕ ਫਿਲਟਰ ਲਾਗੂ ਕਰੋਗੇ, ਅਤੇ ਵਿਨਸੋਰਾਈਜ਼ਿੰਗ ਬਨਾਮ ਟ੍ਰਿਮਿੰਗ ਦੀ ਤੁਲਨਾ ਕਰੋਗੇ, ਜਦੋਂ ਚਰਮ ਮੁੱਲਾਂ ਨੂੰ ਰੱਖਣਾ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਤੌਰ ਤੇ ਜਾਇਜ਼ ਹੈ ਤਾਂ ਸਿੱਖੋਗੇ।
Visual inspection with boxplots and time plotsIQR and z-score based outlier rulesBusiness rule filters for implausible valuesWinsorizing versus trimming extreme pointsDeciding when to keep influential outliersسبق 6ਹਰ ਫੀਲਡ ਦੀ ਵਿਆਖਿਆ: ਮਹੀਨਾ, product_category, ਖੇਤਰ, units_sold, ਰੈਵੇਨਿਊ, marketing_spend, website_visits, discount_rate ਅਤੇ ਉਪਜੌੜ ਵਪਾਰਕ ਅਰਥਵਿਕਰੀ ਡਾਟਾ ਸੈੱਟ ਵਿੱਚ ਹਰ ਫੀਲਡ ਨੂੰ ਡੂੰਘੀ ਸਮਝ ਵਿਕਸਿਤ ਕਰੋ। ਤੁਸੀਂ ਮਹੀਨਾ, ਉਤਪਾਦ, ਖੇਤਰ ਅਤੇ ਵਪਾਰਕ ਮਾਪ ਨੂੰ ਵਿਆਖਿਆ ਕਰੋਗੇ, ਉਹਨਾਂ ਨੂੰ ਵਪਾਰਕ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨਾਲ ਜੋੜੋਗੇ ਅਤੇ ਅਨੁਮਾਨ ਉਦੇਸ਼ਾਂ ਤੇ ਉਹਨਾਂ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਜਾਣੋਗੇ।
Calendar month and forecasting horizon roleProduct_category hierarchy and assortmentRegion definitions and market structureUnits_sold, revenue, and price relationshipsMarketing_spend, visits, and discount_rateسبق 7ਸਮੇਂ ਸੂਚਕ ਵੈਲੀਡੇਸ਼ਨ ਅਤੇ ਕੈਲੰਡਰ ਜੋੜ: ਮਹੀਨੇ ਸੀਮਾਵਾਂ, ਰਿਟੇਲ ਕੈਲੰਡਰ ਬਨਾਮ ਕੈਲੰਡਰ ਮਹੀਨੇ, ਅਵਕਸ਼ਪ ਵਰ੍ਹੇ ਅਤੇ DST ਪ੍ਰਭਾਵ ਹੈਂਡਲ ਕਰਨਾਸਮੇਂ ਸੂਚਕ ਨੂੰ ਵੈਲੀਡੇਟ ਕਰਨ ਅਤੇ ਡਾਟਾ ਨੂੰ ਇਕਸਾਰ ਕੈਲੰਡਰ ਨਾਲ ਜੋੜਨ ਦੇ ਤਰੀਕੇ ਸਿੱਖੋ। ਅਸੀਂ ਮਹੀਨੇ ਦੀਆਂ ਸੀਮਾਵਾਂ, ਰਿਟੇਲ ਕੈਲੰਡਰ ਬਨਾਮ ਕੈਲੰਡਰ ਮਹੀਨੇ, ਅਵਕਸ਼ਪ ਵਰ੍ਹੇ ਅਤੇ DST ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਹੱਲ ਕਰਾਂਗੇ ਜੋ ਸਮੇਂ-ਅਧਾਰਤ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਏਗਰੀਗੇਟਸ ਨੂੰ ਵਿਗਾੜ ਸਕਦੇ ਹਨ।
Checking for gaps and duplicates in time indexAligning to retail versus calendar monthsHandling leap years in monthly aggregatesManaging daylight saving time in timestampsReconciling mismatched time zones and feedsسبق 8ਵਿਸ਼ੇਸ਼ਤਾ ਇੰਜੀਨੀਅਰਿੰਗ: ਲੈਗ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਰੋਲਿੰਗ ਔਸਤ/ਮੀਡੀਅਨ, ਬਦਲਾਅ ਦਰ, ਵਿਕਾਸ ਦਰਾਂ, ਅਤੇ ਘਟਾਉਣ ਵਾਲੇ ਮਾਪ ਬਣਾਉਣਾਕੱਚੇ ਵਿਕਰੀ ਅਤੇ ਮਾਰਕੀਟਿੰਗ ਡਾਟਾ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿਕਸਿਤ ਕਰੋ। ਤੁਸੀਂ ਲੈਗਸ, ਰੋਲਿੰਗ ਗਣਿਤਕ, ਵਿਕਾਸ ਦਰਾਂ, ਅਤੇ ਘਟਾਉਣ ਵਾਲੇ ਮਾਪ ਬਣਾਓਗੇ ਜੋ ਮਹੀਨਾਵਾਰ ਵਿਕਰੀ ਵਿਵਹਾਰ ਵਿੱਚ ਗਤੀ, ਬਣਤਰ ਅਤੇ ਢਾਂਚਾਗਤ ਪੈਟਰਨ ਨੂੰ ਫੜਦੇ ਹਨ।
Lag features for sales and marketing signalsRolling means, medians, and rolling sumsMonth over month and year over year growthCumulative revenue and units_sold metricsStability checks for engineered featuresسبق 9ਡਾਟਾ ਗੁਣਵੱਤਾ ਜਾਂਚਾਂ: ਮਿਸਿੰਗਨੈੱਸ ਨੂੰ ਪਛਾਣਨ ਅਤੇ ਪ੍ਰੋਫਾਈਲ ਕਰਨ ਦੀਆਂ ਵਿਧੀਆਂ, ਮਿਸਿੰਗ ਡਾਟਾ ਦੇ ਪ੍ਰਕਾਰ, ਅਤੇ ਵਰਗ/ਖੇਤਰ ਅਨੁਸਾਰ ਮਿਸਿੰਗਨੈੱਸ ਪੈਟਰਨ ਰਿਪੋਰਟ ਕਰਨਾਮਿਸਿੰਗਨੈੱਸ ਅਤੇ ਅਸੰਗਤੀਆਂ ਨੂੰ ਪ੍ਰੋਫਾਈਲ ਕਰਕੇ ਡਾਟਾ ਗੁਣਵੱਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ। ਤੁਸੀਂ ਮਿਸਿੰਗ ਡਾਟਾ ਤੰਤਰਾਂ ਨੂੰ ਵਰਗੀਕਰਨ ਕਰੋਗੇ, ਉਤਪਾਦ ਅਤੇ ਖੇਤਰ ਅਨੁਸਾਰ ਪੈਟਰਨ ਪਛਾਣੋਗੇ, ਅਤੇ ਇੰਪਿਊਟੇਸ਼ਨ ਅਤੇ ਅਪਸਟ੍ਰੀਮ ਡਾਟਾ ਠੀਕ ਕਰਨ ਲਈ ਰਿਪੋਰਟ ਡਿਜ਼ਾਈਨ ਕਰੋਗੇ।
Field-level completeness and validity checksMCAR, MAR, and MNAR missingness typesHeatmaps of missingness by time and regionMissingness by product_category and channelDocumenting data quality issues for ownersسبق 10ਏਗਰੀਗੇਸ਼ਨ ਅਤੇ ਗ੍ਰੈਨੂਲੈਰਿਟੀਆਂ: ਕੈਟੇਗਰੀ × ਮਹੀਨਾ, ਖੇਤਰ × ਮਹੀਨਾ ਤੱਕ ਏਗਰੀਗੇਟ ਕਰਨਾ, ਅਤੇ ਮਲਟੀ-ਇੰਡੈਕਸ ਪਿਵੋਟਿੰਗ; ਡਾਊਨਸੈਂਪਲਿੰਗ ਅਤੇ ਅਪਸੈਂਪਲਿੰਗ ਵਿਚਾਰਸਮੇਂ ਅਤੇ ਮਾਪਾਂ ਅਨੁਸਾਰ ਡਾਟਾ ਨੂੰ ਏਗਰੀਗੇਟ ਅਤੇ ਰੀਸ਼ੇਪ ਕਰਨ ਦੇ ਤਰੀਕੇ ਸਿੱਖੋ। ਅਸੀਂ ਕੈਟੇਗਰੀ × ਮਹੀਨਾ ਅਤੇ ਖੇਤਰ × ਮਹੀਨਾ ਵਿਊਜ਼, ਮਲਟੀ-ਇੰਡੈਕਸ ਪਿਵੋਟਿੰਗ, ਅਤੇ ਇਕਸਾਰ ਮਾਡਲ ਇਨਪੁਟਸ ਲਈ ਡਾਊਨਸੈਂਪਲਿੰਗ ਜਾਂ ਅਪਸੈਂਪਲਿੰਗ ਕਦੇ ਕਰਨਾ ਹੈ ਘੇਰਾਂਗੇ।
Choosing base granularity for modelingCategory × month and region × month tablesMulti-index pivoting and unpivotingDownsampling daily data to monthly levelUpsampling sparse series with careful rules