పాఠం 1ఫీచర్ స్కేలింగ్ మరియు ట్రాన్స్ఫార్మేషన్: స్క్యుడ్ ఆదాయం/పరిమాణానికి లాగ్ ట్రాన్స్ఫార్మ్లు, రబస్ట్ స్కేలింగ్వేరియన్స్ను స్థిరీకరించడానికి మరియు ఆదాయం మరియు పరిమాణంలో స్క్యునెస్ను తగ్గించడానికి స్కేలింగ్ మరియు ట్రాన్స్ఫార్మేషన్లను అప్లై చేయండి, లాగ్ ట్రాన్స్ఫార్మ్లు, రబస్ట్ స్కేలింగ్, మరియు పవర్ ట్రాన్స్ఫార్మ్లను ఉపయోగించి అవసరమైతే ఇంటర్ప్రెటబిలిటీని కాపాడుతారు.
Diagnosing skewness and heavy tailsLog and power transformationsStandard, min-max, and robust scalingScaling pipelines with sklearnInverse transforms for interpretationపాఠం 2డేట్టైమ్ ఫీచర్ ఇంజనీరింగ్: వీక్డే, గంట, సీజనాలిటీ, ఆర్డర్_డేట్ మరియు కస్టమర్ హిస్టరీ నుండి రీసెన్సీ మరియు టెన్యూర్ ఫీచర్లుఆర్డర్ డేట్లు మరియు కస్టమర్ హిస్టరీ నుండి వీక్డే, గంట, సీజనాలిటీ, రీసెన్సీ మరియు టెన్యూర్ ఫీచర్లను ఇంజనీర్ చేయండి, ఫోర్కాస్టింగ్ మరియు క్లాసిఫికేషన్ టాస్క్లలో లీకేజ్ జరగకుండా టెంపరల్ ఆర్డర్ను గౌరవించండి.
Extracting calendar-based featuresCyclic encoding of time variablesSeasonality and holiday indicatorsRecency and tenure feature designTime-aware leakage preventionపాఠం 3న్యూమరిక్ (మీడియన్, KNN, మోడల్-ఆధారిత) మరియు కేటగారికల్ ఫీల్డుల కోసం ఇంప్యూటేషన్ వ్యూహాలు (మోడ్, 'అజ్ఞాత')మీడియన్, KNN, మోడల్-ఆధారిత, మోడ్, మరియు స్పష్టమైన "అజ్ఞాత" కేటగిరీలతో సహా న్యూమరిక్ మరియు కేటగారికల్ ఇంప్యూటేషన్ వ్యూహాలను పోల్చండి, పూర్తయిన డేటాసెట్ యొక్క బయాస్, వేరియన్స్, మరియు రబస్ట్నెస్ను అంచనా వేయడానికి డయాగ్నోస్టిక్స్తో.
Missingness mechanisms and patternsSimple numeric imputation methodsKNN and model-based imputationCategorical mode and "unknown" binsUsing missingness indicator flagsపాఠం 4ఎంపిక చేసిన ప్రెడిక్షన్ కోసం టార్గెట్ వేరియబుల్ సృష్టించడం (బైనరీ రిటర్న్డ్, కంటిన్యూయస్ ఆదాయం, లేట్ డెలివరీ లేబుల్)కీ వ్యాపార ప్రెడిక్షన్ల కోసం టార్గెట్ వేరియబుల్స్ నిర్వచించి నిర్మించండి, బైనరీ రిటర్న్ ఫ్లాగ్లు, కంటిన్యూయస్ ఆదాయం, మరియు లేట్ డెలివరీ లేబుల్స్తో సహా, స్పష్టమైన నిర్వచనాలు మరియు ఎవాల్యుయేషన్ మెట్రిక్స్తో సమలేఖనాన్ని నిర్ధారించండి.
Choosing the prediction objectiveDefining return and churn labelsRevenue and margin regression targetsLate delivery and SLA breach labelsAligning targets with metricsపాఠం 5ఎన్కోడింగ్ టెక్నిక్లు: వన్-హాట్, టార్గెట్ ఎన్కోడింగ్, ఫ్రీక్వెన్సీ ఎన్కోడింగ్, హై-కార్డినాలిటీ ఫీచర్ల కోసం ఎంబెడ్డింగ్లుసింపుల్ వన్-హాట్ నుండి టార్గెట్, ఫ్రీక్వెన్సీ, మరియు ఎంబెడ్డింగ్-ఆధారిత ఎన్కోడింగ్ల వరకు కేటగారికల్ వేరియబుల్స్ కోసం ఎన్కోడింగ్ మెథడ్స్ అన్వేషించండి, లీకేజ్ నివారణ, రెగ్యులరైజేషన్, మరియు హై-కార్డినాలిటీ ఫీచర్లను హ్యాండిల్ చేయడంపై మార్గదర్శకత్వంతో.
When to use one-hot encodingTarget encoding with leakage controlFrequency and count encodingsHashing and rare category handlingLearned embeddings for categoriesపాఠం 6ప్రైస్, పరిమాణం, డెలివరీ_టైమ్_డేస్, మరియు ఆదాయం కోసం ఔట్లైయర్ డిటెక్షన్ మరియు హ్యాండ్లింగ్స్టాటిస్టికల్ రూల్స్ మరియు బిజినెస్ లాజిక్ ఉపయోగించి ప్రైస్, పరిమాణం, డెలివరీ_టైమ్_డేస్, మరియు ఆదాయంలో ఔట్లైయర్లను గుర్తించడం, డయాగ్నోస్ చేయడం, మరియు చికిత్స చేయడం తెలుసుకోండి, డౌన్స్ట్రీమ్ మోడల్స్ను అస్థిరత నుండి కాపాడుతూ సమాచార నష్టాన్ని కనిష్టం చేయండి.
Univariate outlier detection rulesMultivariate and contextual outliersCapping, trimming, and winsorizationBusiness-rule based outlier flagsImpact of outliers on model trainingపాఠం 7అగ్రిగేషన్లు మరియు కస్టమర్-లెవల్ ఫీచర్లు: హిస్టారికల్ రిటర్న్ రేటు, యావరేజ్ ఆర్డర్ విలువ, ఫ్రీక్వెన్సీ, లాస్ట్ ఆర్డర్ నుండి టైమ్హిస్టారికల్ రిటర్న్ రేటు, యావరేజ్ ఆర్డర్ విలువ, ఫ్రీక్వెన్సీ, మరియు లాస్ట్ ఆర్డర్ నుండి టైమ్ వంటి కస్టమర్-లెవల్ అగ్రిగేషన్లను బిల్డ్ చేయండి, కస్టమర్ లైఫ్టైమ్ బిహేవియర్ను క్యాప్చర్ చేసి సెగ్మెంటేషన్ మరియు ప్రెడిక్టివ్ పెర్ఫార్మెన్స్ను మెరుగుపరచండి.
Customer-level aggregation designHistorical return and complaint ratesAverage order value and basket sizePurchase frequency and recencyCustomer lifetime value proxiesపాఠం 8ప్రమోషన్ మరియు ప్రైసింగ్ ఫీచర్లు: ఎఫెక్టివ్_యూనిట్_ప్రైస్, డిస్కౌంట్_పీసీటీ, డిస్కౌంట్_అప్లైడ్ ఫ్లాగ్ఎఫెక్టివ్ యూనిట్ ప్రైస్, డిస్కౌంట్_పీసీటీ, డిస్కౌంట్_అప్లైడ్ ఫ్లాగ్ వంటి ప్రమోషన్ మరియు ప్రైసింగ్ ఫీచర్లను సృష్టించండి, ప్రమోషనల్ ఇంటెన్సిటీ, మార్జిన్ ప్రభావం, మరియు కస్టమర్ ప్రైస్ మార్పులకు సెన్సిటివిటీని క్యాప్చర్ చేయడానికి.
Computing effective unit priceDiscount percentage and depthBinary and multi-level promo flagsStacked and overlapping promotionsPrice elasticity proxy featuresపాఠం 9టైమ్-సిరీస్/ఆర్డర్ డేటా కోసం ట్రైన్/టెస్ట్ స్ప్లిట్ వ్యూహాలు (టైమ్-ఆధారిత స్ప్లిట్, టార్గెట్ ద్వారా స్ట్రాటిఫైడ్, కస్టమర్ హోల్డౌట్)టైమ్-ఆర్డర్డ్ ట్రాన్సాక్షనల్ డేటా కోసం ట్రైన్ మరియు టెస్ట్ స్ప్లిట్ వ్యూహాలను డిజైన్ చేయండి, టైమ్-ఆధారిత స్ప్లిట్లు, టార్గెట్ ద్వారా స్ట్రాటిఫికేషన్, మరియు కస్టమర్ హోల్డౌట్ స్కీమ్లను ఉపయోగించి రియలిస్టిక్ మరియు అన్బయాస్డ్ పెర్ఫార్మెన్స్ అంచనాలను పొందండి.
Pitfalls of random splits in time dataTime-based and rolling window splitsStratified splits for imbalanced targetsCustomer and store level holdoutsCross-validation for temporal dataపాఠం 10జియోగ్రాఫిక్ మరియు లాజిస్టిక్స్ ఫీచర్లు: కంట్రీ-లెవల్ మెట్రిక్స్, షిప్పింగ్ జోన్లు, టిపికల్ డెలివరీ_టైమ్ డిస్ట్రిబ్యూషన్కంట్రీ-లెవల్ మెట్రిక్స్, షిప్పింగ్ జోన్లు, మరియు డెలివరీ టైమ్ డిస్ట్రిబ్యూషన్లను ఉపయోగించి జియోగ్రాఫిక్ మరియు లాజిస్టిక్స్ ఫీచర్లను డిజైన్ చేయండి, ఆపరేషనల్ కన్స్ట్రైంట్స్, రీజనల్ బిహేవియర్, మరియు సర్వీస్-లెవల్ వేరియబిలిటీని ప్రెడిక్టివ్ మోడల్స్లో క్యాప్చర్ చేయడానికి.
Country and region level aggregationsDefining shipping zones and lanesDelivery time distribution featuresDistance and cross-border indicatorsService level and SLA featuresపాఠం 11కేటగారికల్ వేరియబుల్స్ను స్టాండర్డైజ్ చేయడం మరియు క్లీన్ చేయడం: ప్రొడక్ట్_కేటగరీ, కంట్రీ, మార్కెటింగ్_చానల్, డివైస్_టైప్ప్రొడక్ట్_కేటగరీ, కంట్రీ, మార్కెటింగ్_చానల్, డివైస్_టైప్ వంటి కేటగారికల్ వేరియబుల్స్ను స్టాండర్డైజ్ చేసి క్లీన్ చేయండి, లేబుల్స్ నార్మలైజ్ చేసి, రేర్ లెవల్స్ మర్జ్ చేసి, డేటాసెట్ల అంతటా స్థిరమైన టాక్సానమీలను అమలు చేయండి.
Detecting inconsistent category labelsString normalization and mappingMerging rare and noisy categoriesMaintaining category taxonomiesDocumenting categorical cleaning