سبق 1ਸਕੀਮਾ ਵੈਲੀਡੇਸ਼ਨ: ਜ਼ਰੂਰੀ ਫੀਲਡ, ਡਾਟਾ ਟਾਈਪਾਂ, ਤਾਰੀਖ ਪਾਰਸਿੰਗ ਅਤੇ ਟਾਈਮਜ਼ੋਨ ਹੈਂਡਲਿੰਗਆਰਡਰ-ਲੈਵਲ ਡਾਟਾ ਲਈ ਮਜ਼ਬੂਤ ਸਕੀਮੇ ਨਿਰਧਾਰਤ ਅਤੇ ਲਾਗੂ ਕਰਨ ਦੇ ਤਰੀਕਿਆਂ ਨੂੰ ਸਮਝੋ, ਜ਼ਰੂਰੀ ਫੀਲਡਾਂ, ਡਾਟਾ ਟਾਈਪਾਂ ਅਤੇ ਤਾਰੀਖ ਫਾਰਮੈਟਾਂ ਨੂੰ ਵੈਲੀਡੇਟ ਕਰੋ ਜਦੋਂ ਕਿ ਟਾਈਮ ਜ਼ੋਨਾਂ, ਦੇਰ ਨਾਲ ਪਹੁੰਚਣ ਵਾਲੇ ਡਾਟਾ ਅਤੇ ਵੱਖ-ਵੱਖ ਸਰੋਤ ਸਿਸਟਮਾਂ ਵਿੱਚ ਸਕੀਮਾ ਵਿਕਾਸ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਹੈਂਡਲ ਕਰੋ।
Defining required order‑level fieldsValidating numeric and string data typesParsing dates and timestamps safelyStandardizing time zones and offsetsCatching schema drift and evolutionAutomated schema checks in pipelinesسبق 2ਡਾਟਾ ਲਾਈਨੇਜ ਅਤੇ ਧਾਰਨਾਵਾਂ ਨੂੰ ਡਾਕੂਮੈਂਟ ਕਰਨਾ ਰੀਪ੍ਰੋਡਿਊਸਿਬਿਲਟੀ ਅਤੇ ਆਡਿਟੇਬਿਲਟੀ ਲਈਰਿਟੇਲ ਆਰਡਰ ਪਾਈਪਲਾਈਨਾਂ ਲਈ ਡਾਟਾ ਲਾਈਨੇਜ, ਬਿਜ਼ਨਸ ਨਿਯਮਾਂ ਅਤੇ ਮਾਡਲਿੰਗ ਧਾਰਨਾਵਾਂ ਨੂੰ ਡਾਕੂਮੈਂਟ ਕਰਨ ਦੇ ਤਰੀਕਿਆਂ ਨੂੰ ਸਮਝੋ, ਜੋ ਟੀਮਾਂ, ਟੂਲਾਂ ਅਤੇ ਵਿਕਸਤ ਹੋ ਰਹੇ ਸਰੋਤ ਸਿਸਟਮਾਂ ਵਿੱਚ ਪੁਨਰੁਤਪਾਦਨ, ਗਵਰਨੈਂਸ ਅਤੇ ਆਡਿਟੇਬਿਲਟੀ ਨੂੰ ਸਮਰਥਨ ਦਿੰਦੀਆਂ ਹਨ।
Capturing source‑to‑target mappingsRecording business transformation rulesTracking metric definitions over timeMaintaining data dictionariesVersioning pipelines and schemasAudit trails for regulatory reviewsسبق 3ਸੀਐਸਵੀ ਨੂੰ ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲਾਂ ਅਤੇ ਵਾਤਾਵਰਣ ਸੈੱਟਅਪ ਵਿੱਚ ਲੋਡ ਕਰਨਾ (ਐਕਸਲ, ਐਸਕਿਊਐਲ, ਪਾਈਥਨ, ਆਰ, ਬਾਈ ਟੂਲਾਂ)ਐਕਸਲ, ਐਸਕਿਊਐਲ ਡੇਟਾਬੇਸਾਂ, ਪਾਈਥਨ, ਆਰ ਅਤੇ ਬਾਈ ਟੂਲਾਂ ਵਿੱਚ ਸੀਐਸਵੀ ਆਰਡਰ ਫਾਈਲਾਂ ਲੋਡ ਕਰਨ ਲਈ ਵਿਹਾਰਕ ਹੁਨਰ ਹਾਸਲ ਕਰੋ, ਐਨਕੋਡਿੰਗਸ, ਡਿਲੀਮੀਟਰਾਂ, ਡਾਟਾ ਟਾਈਪਾਂ ਅਤੇ ਪ੍ਰੋਜੈਕਟ ਵਾਤਾਵਰਣ ਨੂੰ ਕੰਫਿਗਰ ਕਰੋ ਤਾਂ ਜੋ ਪੁਨਰੁਤਪਾਦਕ, ਸਕੇਲੇਬਲ ਵਿਸ਼ਲੇਸ਼ਣ ਵਰਕਫਲੋ ਨੂੰ ਯਕੀਨੀ ਬਣਾਇਆ ਜਾ ਸਕੇ।
Configuring CSV import optionsManaging encodings and delimitersBulk loading into SQL warehousesPython and R data ingestion scriptsConnecting BI tools to raw tablesVersioning and environment managementسبق 4ਟੈਂਪੋਰਲ ਡੈਰੀਵੇਸ਼ਨਾਂ: ਤਾਰੀਖ ਹਿੱਸੇ ਨਿਕਾਲਣਾ, ਰੋਲਿੰਗ ਵਿੰਡੋਜ਼, ਵਿੱਤੀ ਕੈਲੰਡਰ, ਵੀਕ/ਮਹੀਨਾ ਹੱਦਾਂਆਰਡਰ ਟਾਈਮਸਟੈਂਪਾਂ ਤੋਂ ਟੈਂਪੋਰਲ ਫੀਚਰਾਂ ਨੂੰ ਨਿਕਾਲਣ ਦੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਖੋਜ ਕਰੋ, ਜਿਸ ਵਿੱਚ ਕੈਲੰਡਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਵਿੱਤੀ ਅਵਧੀਆਂ, ਰੋਲਿੰਗ ਵਿੰਡੋਜ਼ ਅਤੇ ਰਿਟੇਲ ਟ੍ਰੇਡਿੰਗ ਪੈਟਰਨਾਂ ਅਤੇ ਰਿਪੋਰਟਿੰਗ ਲੋੜਾਂ ਨਾਲ ਮੇਲ ਖਾਂਦੇ ਕਸਟਮ ਵੀਕ ਜਾਂ ਮਹੀਨੇ ਦੀਆਂ ਹੱਦਾਂ ਸ਼ਾਮਲ ਹਨ।
Extracting standard date partsBuilding fiscal calendars and periodsCustom retail week and month boundariesRolling windows for KPIsLag and lead features for ordersSeasonality and holiday flagsسبق 5ਡਾਟਾ ਪਾਰਟੀਸ਼ਨਿੰਗ ਅਤੇ ਸੈਂਪਲਿੰਗ ਕੁਸ਼ਲ ਖੋਜ ਅਤੇ ਪੁਨਰੁਤਪਾਦਕ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈਵੱਡੇ ਰਿਟੇਲ ਆਰਡਰ ਡਾਟਾਸੈੱਟਾਂ ਨੂੰ ਪਾਰਟੀਸ਼ਨ ਅਤੇ ਸੈਂਪਲ ਕਰਨ ਦੇ ਤਰੀਕੇ ਸਿੱਖੋ ਜੋ ਕੁਸ਼ਲ ਖੋਜ, ਮਾਡਲ ਵਿਕਾਸ ਅਤੇ ਟੈਸਟਿੰਗ ਲਈ ਹਨ, ਜਦੋਂ ਕਿ ਟੈਂਪੋਰਲ ਢਾਂਚਾ, ਸੀਜ਼ਨੈਲਟੀ ਅਤੇ ਮੁੱਖ ਬਿਜ਼ਨਸ ਸੈਗਮੈਂਟਸ ਨੂੰ ਬਚਾਉਂਦੇ ਹੋਏ ਪੁਨਰੁਤਪਾਦਕ ਵਿਸ਼ਲੇਸ਼ਣ ਪ੍ਰਯੋਗਾਂ ਲਈ।
Partitioning by date and storeTrain, validation, and test splitsStratified sampling by segmentDownsampling and upsampling tacticsCreating reproducible random samplesManaging partitions in data warehousesسبق 6ਗੁੰਮ ਮੁੱਲਾਂ ਨੂੰ ਖੋਜਣ ਅਤੇ ਹੈਂਡਲ ਕਰਨਾ: ਟ੍ਰਾਂਜੈਕਸ਼ਨਲ ਡਾਟਾ ਲਈ ਖਾਸ ਰਣਨੀਤੀਆਂ ਅਤੇ ਇੰਪਿਊਟੇਸ਼ਨਟ੍ਰਾਂਜੈਕਸ਼ਨਲ ਰਿਟੇਲ ਡਾਟਾ ਵਿੱਚ ਗੁੰਮ ਹੋਏ ਮੁੱਲਾਂ ਨੂੰ ਖੋਜਣ, ਪ੍ਰੋਫਾਈਲ ਕਰਨ ਅਤੇ ਇਲਾਜ ਕਰਨ ਦੀਆਂ ਸਿਸਟਮੈਟਿਕ ਵਿਧੀਆਂ ਸਿੱਖੋ, ਉਪਯੁਕਤ ਇੰਪਿਊਟੇਸ਼ਨ ਜਾਂ ਐਕਸਕਲੂਜ਼ਨ ਰਣਨੀਤੀਆਂ ਚੁਣੋ ਜੋ ਆਮਦਨ, ਮਾਤਰਾ ਅਤੇ ਗ੍ਰਾਹਕ ਵਿਵਹਾਰ ਸਿਗਨਲਾਂ ਨੂੰ ਬਚਾਉਂਦੀਆਂ ਹਨ ਬਿਨਾਂ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕੀਤੇ।
Profiling missingness patternsMCAR, MAR, and MNAR in retail dataImputing prices, discounts, and costsHandling missing customer identifiersDealing with incomplete order linesDocumenting imputation decisionsسبق 7ਕੀਮਤ, ਮਾਤਰਾ, ਡਿਸਕਾਉਂਟ ਅਤੇ ਆਮਦਨ ਫੀਲਡਾਂ ਲਈ ਅਸਧਾਰਨ ਖੋਜ ਅਤੇ ਇਲਾਜਕੀਮਤ, ਮਾਤਰਾ, ਡਿਸਕਾਉਂਟ ਅਤੇ ਆਮਦਨ ਫੀਲਡਾਂ ਵਿੱਚ ਅਸਧਾਰਨਾਂ ਨੂੰ ਖੋਜਣ, ਨਿਦਾਨ ਅਤੇ ਇਲਾਜ ਕਰਨ ਦੇ ਤਰੀਕੇ ਸਿੱਖੋ, ਡਾਟਾ ਗਲਤੀਆਂ ਨੂੰ ਅਸਲ ਅੱਤਿਅਤ ਵਿਵਹਾਰ ਤੋਂ ਵੱਖ ਕਰੋ ਤਾਂ ਜੋ ਮਾਡਲ ਸਥਿਰਤਾ ਅਤੇ ਬਿਜ਼ਨਸ ਰਿਪੋਰਟਿੰਗ ਸਹੀਤਾ ਨੂੰ ਬਚਾਇਆ ਜਾ ਸਕੇ।
Profiling distributions and extremesRule‑based outlier thresholdsStatistical and robust detection methodsSeparating errors from rare eventsCapping, trimming, and winsorizingMonitoring outliers over timeسبق 8ਕੈਟੇਗੋਰੀਕਲ ਫੀਲਡਾਂ ਨੂੰ ਸਟੈਂਡਰਡਾਈਜ਼ ਕਰਨਾ: ਖੇਤਰ, ਉਤਪਾਦ_ਕੈਟੇਗਰੀ, ਉਤਪਾਦ_ਸਬਕੈਟੇਗਰੀ, ਮਾਰਕੀਟਿੰਗ_ਚੈਨਲ, ਡਿਵਾਈਸ_ਟਾਈਪਰਿਟੇਲ ਆਰਡਰਾਂ ਵਿੱਚ ਮੁੱਖ ਕੈਟੇਗੋਰੀਕਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸਟੈਂਡਰਡਾਈਜ਼ ਕਰਨ ਦੇ ਤਰੀਕੇ ਸਿੱਖੋ ਤਾਂ ਜੋ ਖੇਤਰ, ਉਤਪਾਦ ਹਾਈਰਾਰਕੀਆਂ, ਮਾਰਕੀਟਿੰਗ ਚੈਨਲਾਂ ਅਤੇ ਡਿਵਾਈਸ ਟਾਈਪਾਂ ਇਕਸਾਰ, ਵਿਸ਼ਲੇਸ਼ਣਯੋਗ ਅਤੇ ਸੈਗਮੈਂਟੇਸ਼ਨ, ਅਟ੍ਰੀਬਿਊਸ਼ਨ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਰਿਪੋਰਟਿੰਗ ਲਈ ਤਿਆਰ ਹੋਣ।
Designing canonical code listsNormalizing region and market labelsStandardizing product category hierarchiesCleaning marketing_channel valuesHarmonizing device_type and platformHandling legacy and deprecated valuesسبق 9ਡੈਰੀਵਡ ਫੀਲਡ ਬਣਾਉਣਾ: ਗ੍ਰਾਸ_ਮਾਰਜਨ, ਮਾਰਜਨ_ਰੇਟ, ਔਸਤ_ਆਰਡਰ_ਮੁੱਲ, ਯੂਨਿਟ_ਲਾਗਤ, ਆਰਡਰ_ਮੁੱਲ ਹਿੱਸੇਆਰਡਰ ਡਾਟਾ ਤੋਂ ਮੁੱਖ ਵਿੱਤੀ ਅਤੇ ਵਿਵਹਾਰਕ ਡੈਰੀਵਡ ਮੈਟ੍ਰਿਕਸ ਦੀ ਰਚਨਾ ਵਿੱਚ ਮਾਹਰ ਹੋਵੋ, ਜਿਸ ਵਿੱਚ ਗ੍ਰਾਸ ਮਾਰਜਨ, ਮਾਰਜਨ ਰੇਟ, ਔਸਤ ਆਰਡਰ ਮੁੱਲ, ਯੂਨਿਟ ਲਾਗਤ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਲਾਭਕਾਰੀਤਾ ਅਤੇ ਕੀਮਤ ਨਿਰਧਾਰਨ ਨੂੰ ਸਮਰਥਨ ਦੇਣ ਵਾਲੇ ਵਿਸਥਾਪਿਤ ਆਰਡਰ ਮੁੱਲ ਹਿੱਸੇ ਸ਼ਾਮਲ ਹਨ।
Calculating gross_margin and net_revenueComputing margin_rate and markupsAverage_order_value and basket sizeUnit_cost and unit_price derivationsDecomposing order_value componentsValidating derived metric consistency