سبق 1ਸਾਫ਼ ਕੀਤੇ ਡਾਟੇ ਦੀ ਵੈਲੀਡੇਸ਼ਨ: ਸੈਨਿਟੀ ਚੈੱਕ, ਸੰਖੇਪ ਟੇਬਲਾਂ ਅਤੇ ਡਾਟਾ ਗੁਣਵੱਤਾ ਲਈ ਯੂਨਿਟ ਟੈਸਟਕੈਂਪੇਨ CSV ਨੂੰ Excel, Google Sheets, Python ਅਤੇ R ਤੋਂ ਇੰਪੋਰਟ ਕਰਨਾ ਸਿੱਖੋ। ਅਸੀਂ delimiter ਮੁੱਦੇ, encoding, ਟਾਈਪ ਇਨਫਰੈਂਸ ਅਤੇ ਹੈਡਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਾਂ, ਅਤੇ ਚੁਪਚਾਪ ਡਾਟਾ ਕੁਪਰਸ਼ਨ ਤੋਂ ਬਚਣ ਲਈ ਮਜ਼ਬੂਤ ਵਰਕਫਲੋ ਵਿਖਾਉਂਦੇ ਹਾਂ।
Choosing correct delimiters and decimal separatorsHandling encodings, BOMs, and special charactersControlling header rows and column name parsingExplicitly setting column types on importVerifying row counts and duplicate importsسبق 2ਸਾਫ਼-ਸ਼ੁੱਧੀ ਕਦਮਾਂ ਨੂੰ ਡਾਕੂਮੈਂਟ ਕਰਨਾ ਅਤੇ ਕੋਡ ਨੋਟਬੁੱਕਾਂ ਜਾਂ ਸਕ੍ਰਿਪਟਾਂ ਨਾਲ ਦੁਹਰਾਉਣਯੋਗ ਪਾਈਪਲਾਈਨਾਂਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਇਕਸਾਰ ਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਵਿੱਚ ਮਾਹਰ ਹੋਵੋ। ਤੁਸੀਂ ਕਾਲਮ ਟਾਈਪਾਂ ਬਦਲੋਗੇ, ਵਰਗੀਕਰਣ ਵਾਲੀਆਂ ਵਿਚਾਰਣਾਵਾਂ ਨੂੰ ਸਟੈਂਡਰਡਾਈਜ਼ ਕਰੋਗੇ, ਅਤੇ ਜੁਆਇੰਜ਼, ਐਗਰੀਗੇਸ਼ਨਾਂ ਅਤੇ ਮਾਡਲਾਂ ਵਾਂਗ ਵਿਵਹਾਰ ਕਰਨ ਲਈ ਤਾਰੀਖਾਂ ਅਤੇ ਹਫ਼ਤਿਆਂ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਪਾਰਸ ਕਰੋਗੇ।
Casting numeric, integer, and boolean columnsNormalizing text case and trimming whitespaceDefining and ordering categorical levelsParsing dates, weeks, and time zonesAligning fiscal weeks with calendar datesسبق 3ਡਾਟਾ ਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਬਦਲਾਅ: ਟਾਈਪਾਂ ਬਦਲਣਾ, ਵਰਗੀਕਰਣ ਕਾਲਮਾਂ ਨੂੰ ਪਾਰਸ ਕਰਨਾ, ਅਤੇ ਤਾਰੀਖ/ਹਫ਼ਤਾ ਹੈਂਡਲਿੰਗਅਸਧਾਰਨ ਮੁੱਲਾਂ ਅਤੇ ਟਾਈਪਾਂ ਨੂੰ ਖੋਜਣ ਅਤੇ ਸੁਧਾਰਨ ਦੀਆਂ ਹੁਨਰ ਵਿਕਸਿਤ ਕਰੋ। ਤੁਸੀਂ ਨਕਾਰਾਤਮਕ ਬਜਟਾਂ, ਅਸੰਭਵ ਗਿਣਤੀਆਂ, ਅਤੇ ਮੁਦਰਾ ਫਾਰਮੈਟਿੰਗ ਮੁੱਦਿਆਂ ਨੂੰ ਹੈਂਡਲ ਕਰੋਗੇ, ਅਤੇ ਸ਼ੱਕੀ ਰਿਕਾਰਡਾਂ ਨੂੰ ਸਮੀਖਿਆ ਲਈ ਫਲੈਗ ਕਰਨ ਲਈ ਨਿਯਮ ਡਿਜ਼ਾਈਨ ਕਰੋਗੇ।
Rules for valid ranges and logical constraintsCatching negative spend and zero impressionsValidating integer counts and nonnegative ratesFixing currency symbols and thousand separatorsFlagging and logging suspect records for reviewسبق 4ਮਿਸਿੰਗ ਮੁੱਲਾਂ ਨੂੰ ਖੋਜਣਾ ਅਤੇ ਹੈਂਡਲ ਕਰਨਾ: ਪੈਟਰਨ, ਇੰਪਿਊਟੇਸ਼ਨ ਚੋਣਾਂ, ਅਤੇ ਕਦੋਂ ਰੋਵਾਂ ਡ੍ਰਾਪ ਕਰਨੀਆਂ ਹਨਸੈਨਿਟੀ ਚੈੱਕਾਂ, ਸੰਖੇਪ ਟੇਬਲਾਂ ਅਤੇ ਆਟੋਮੈਟਿਕ ਟੈਸਟਾਂ ਵਰਤ ਕੇ ਸਾਫ਼ ਕੀਤੇ ਡਾਟੇ ਨੂੰ ਵੈਲੀਡੇਟ ਕਰਨ ਦੀਆਂ ਆਦਤਾਂ ਬਣਾਓ। ਤੁਸੀਂ ਸਕੀਮਾ ਡ੍ਰਿਫਟ, ਟੁੱਟੇ ਜੁਆਇੰਜ਼, ਅਤੇ ਮੁੱਖ ਮੈਟ੍ਰਿਕਸ ਵਿੱਚ ਅਣਅਪੇਕਸ਼ਿਤ ਬਦਲਾਅ ਨੂੰ ਫੜਨ ਵਾਲੇ ਚੈੱਕ ਡਿਜ਼ਾਈਨ ਕਰੋਗੇ।
Row, column, and uniqueness checksDistribution and outlier sanity inspectionsCross-field consistency and ratio checksSummary tables for key campaign metricsUnit tests and regression tests for pipelinesسبق 5Excel, Google Sheets, Python (pandas), ਅਤੇ R (readr) ਵਿੱਚ ਫਾਈਲ ਇੰਪੋਰਟ ਪ੍ਰਕਿਰਿਆਵਾਂ ਅਤੇ ਆਮ ਗਿਰਾਵਟਾਂਕੈਂਪੇਨ ਕਾਲਮਾਂ ਨੂੰ ਵਿਆਖਿਆ ਕਰਨ ਦੇ ਤਰੀਕੇ ਸਮਝੋ, ਜਿਸ ਵਿੱਚ ਸਮਾਂ, ਚੈਨਲ, ਖਰਚਾ, ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਮੈਟ੍ਰਿਕਸ ਸ਼ਾਮਲ ਹਨ। ਬਿਜ਼ਨਸ ਪਰਿਭਾਸ਼ਾਵਾਂ ਨੂੰ ਕਾਲਮਾਂ ਨਾਲ ਮੈਪ ਕਰਨਾ, ਯੂਨਿਟਸ ਨੂੰ ਕਨਫਰਮ ਕਰਨਾ, ਅਤੇ ਬਾਅਦ ਵਾਲੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਗਲਤ ਵਿਆਖਿਆ ਤੋਂ ਬਚਣਾ ਸਿੱਖੋ।
Mapping business concepts to column namesConfirming monetary units and currenciesUnderstanding counts versus rates and ratiosHandling week_number and calendar alignmentStandardizing region and channel taxonomiesسبق 6ਕਾਲਮ ਸੈਮੈਂਟਿਕਸ ਅਤੇ ਯੂਨਿਟਸ ਨੂੰ ਵਿਆਖਿਆ ਕਰਨਾ: ਹਫ਼ਤਾ_ਨੰਬਰ, ਚੈਨਲ, ਬਜਟ_usd, ਇੰਪ੍ਰੈਸ਼ਨਾਂ, ਕਲਿੱਕਸ, ਕਨਵਰਜ਼ਨਾਂ, ਰੈਵੇਨਿਊ_usd, ਨਵੇਂ_ਗਾਹਕ, ਖੇਤਰਕੈਂਪੇਨ ਡਾਟੇ ਵਿੱਚ ਮਿਸਿੰਗ ਮੁੱਲਾਂ ਨੂੰ ਖੋਜਣ ਅਤੇ ਇਲਾਜ ਕਰਨਾ ਸਿੱਖੋ। ਅਸੀਂ ਬਣਤਰੀ ਵਿਰੁੱਧ ਰੈਂਡਮ ਮਿਸਿੰਗਨੈੱਸ ਨੂੰ ਮਾਨਤਾ ਦਿੰਦੇ ਹਾਂ, ਇੰਪਿਊਟੇਸ਼ਨ ਰਣਨੀਤੀਆਂ ਚੁਣਦੇ ਹਾਂ, ਅਤੇ ਰੋਵਾਂ ਜਾਂ ਕਾਲਮਾਂ ਡ੍ਰਾਪ ਕਰਨਾ ਕਦੋਂ ਸੁਰੱਖਿਅਤ ਹੈ ਤੈਅ ਕਰਦੇ ਹਾਂ।
Identifying missingness patterns by columnDistinguishing NA, blanks, and sentinel codesSimple numeric and categorical imputationsWhen to drop rows, columns, or campaignsDocumenting imputation rules and impactsسبق 7ਅਸਧਾਰਨ ਮੁੱਲਾਂ ਅਤੇ ਟਾਈਪਾਂ ਨੂੰ ਖੋਜਣਾ ਅਤੇ ਠੀਕ ਕਰਨਾ: ਨਕਾਰਾਤਮਕ ਬਜਟ, ਸ਼ੂਨਿਆ ਇੰਪ੍ਰੈਸ਼ਨਾਂ, ਨਾਨ-ਇੰਟੀਜਰ ਗਿਣਤੀਆਂ, ਅਤੇ ਮੁਦਰਾ ਫਾਰਮੈਟਿੰਗਨੋਟਬੁੱਕਾਂ ਜਾਂ ਸਕ੍ਰਿਪਟਾਂ ਵਰਤ ਕੇ ਸਾਫ਼-ਸ਼ੁੱਧੀ ਕਦਮਾਂ ਨੂੰ ਡਾਕੂਮੈਂਟ ਕਰਨਾ ਅਤੇ ਦੁਹਰਾਉਣਯੋਗ ਪਾਈਪਲਾਈਨਾਂ ਬਣਾਉਣਾ ਸਿੱਖੋ। ਅਸੀਂ ਵਰਜ਼ਨ ਕੰਟਰੋਲ, ਪੈਰਾਮੀਟਰਾਈਜ਼ੇਸ਼ਨ, ਅਤੇ ਕੋਡ ਨੂੰ ਸੰਸ਼ਲਿਤ ਕਰਨਾ ਕਵਰ ਕਰਦੇ ਹਾਂ ਤਾਂ ਜੋ ਹੋਰ ਲੋਕ ਤੁਹਾਡੇ ਵਰਕਫਲੋ ਨੂੰ ਦੁਹਰਾ ਅਤੇ ਆਡਿਟ ਕਰ ਸਕਣ।
Structuring notebooks for narrative and codeWriting reusable cleaning functions or modulesUsing configuration files for parametersVersion controlling data and transformation codeExporting logs and reports for audit trailsسبق 8ਭਰੋਸੇਯੋਗੀ ਨਾਲ ਗਣਨਾ ਕੀਤੇ ਕਾਲਮ ਬਣਾਉਣਾ: CTR = ਕਲਿੱਕਸ/ਇੰਪ੍ਰੈਸ਼ਨਾਂ, CR = ਕਨਵਰਜ਼ਨਾਂ/ਕਲਿੱਕਸ, ਕਨਵਰਜ਼ਨ ਪ੍ਰਤੀ ਰੈਵੇਨਿਊ ਅਤੇ ਇੰਪ੍ਰੈਸ਼ਨ ਪ੍ਰਤੀ ਰੈਵੇਨਿਊCTR, ਕਨਵਰਜ਼ਨ ਰੇਟ, ਅਤੇ ਇੰਪ੍ਰੈਸ਼ਨ ਪ੍ਰਤੀ ਰੈਵੇਨਿਊ ਵਰਗੇ ਭਰੋਸੇਯੋਗ ਡਰਾਈਵਡ ਮੈਟ੍ਰਿਕਸ ਗਣਨਾ ਕਰਨਾ ਸਿੱਖੋ। ਅਸੀਂ ਸੁਰੱਖਿਅਤ ਵੰਡ, ਇਕਸਾਰ ਯੂਨਿਟਸ, ਅਤੇ ਗਰੁੱਪਡ ਡਾਟੇ ਵਿੱਚ ਡਬਲ ਕਾਉਂਟਿੰਗ ਤੋਂ ਬਚਾਉਣ ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਾਂ।
Defining CTR, CVR, and cost per click preciselySafe division with zero denominatorsRevenue per conversion and per impressionAggregating metrics across channels and weeksValidating calculations against manual checks