Lektion 1Datavalideringsregler: dubbletter, referentiell integritet (kunder/produkter), värden utanför intervall, negativa priser/mängderDefiniera robusta valideringsregler för att hålla försäljnings-CSV:er trovärdiga. Du kommer att upptäcka dubbletter, upprätthålla referentiell integritet och markera värden utanför intervall eller negativa värden innan de korrumperar instrumentpaneler och nedströmsmodeller.
Upptäcka dubbla ordrar och orderlinjerKontrollera referentiella integritetsnycklarValidera numeriska intervall och trösklarHantera negativa priser och mängderBygga återanvändbara valideringschecklistorLektion 2Förstå kolumnsemantik: order_id, order_date, customer_id, customer_region, product_id, product_category, product_subcategory, quantity, unit_price, discount, revenue, cost, channelKlargör betydelsen och rollen för kärnkolumner i försäljning som används i instrumentpaneler. Du kommer att mappa identifikatorer, datum, produktattribut, mängder och monetära fält för att säkerställa konsekvent semantik över modeller och visualiseringar.
Order-nivå identifikatorer och granuläritetsvalKund- och regionsidentifikationsfältProdukt-, kategori- och underkategorierMängd, enhetspris, rabatt och intäktKostnad, kanal och marginalrelaterade fältLektion 3Hantera rabatter och prisberäkningar: omberäkna intäkt från enhetspris, mängd och rabatt samt stämma av med rapporterad intäktLär dig hur man omberäknar och validerar intäkts- och prismetriker. Du kommer att beräkna radintäkt från enhetspris, mängd och rabatt, stämma av med rapporterade totaler och markera inkonsekvenser för granskning.
Intäktsformler från enhetspris och mängdTillämpa procentuella och absoluta rabatterStämma av beräknad och rapporterad intäktUpptäcka inkonsekventa rabattmönsterDokumentera prissättning och rabattlogikLektion 4Tidsbaserade transformationer: extrahera år, kvartal, månad, vecka, veckodag, rullande fönster och finansiella kalendrarLär dig hur man transformerar orderdatum till rika tidsfunktioner för analys. Du kommer att härleda kalender- och finansiella attribut, bygga rullande fönster och förbereda konsekventa tidsfält för instrumentpaneler och tidsserie-modeller.
Extrahera år, kvartal, månad och veckaHärleda veckodags- och helgindikatorerBygga rullande och glidande fönster-metrikerImplementera finansiella kalendrar och förskjutningarSynkronisera tidsgranularitet för instrumentpanelerLektion 5Datarenings-transformationer: trimma, normalisera skiftläge, standardisera region- och kanaletiketterUtforska praktiska rengöringssteg för att göra råa försäljnings-CSV:er konsekventa och analysredo. Du kommer att trimma mellanslag, normalisera skiftläge och standardisera region- och kanaletiketter för att undvika dubbletter och trasiga instrumentpanelfilter.
Trimma mellanslag och osynliga teckenNormalisera skiftläge för textdimensionerStandardisera region- och kanaltaxonomierSlå ihop näst-dubbla etikettvarianterDokumentera rengöringsregler för återanvändningLektion 6Härledda metriker och transformationer: vinst = intäkt - kostnad, vinstmarginal = vinst / intäkt, bruttomarginal, AOV = intäkt / orderantal, enhetstotal = mängd * enhetsprisLär dig härleda nyckelförsäljningsmetriker från råa CSV-fält. Du kommer att beräkna vinst, marginaler, AOV och enhetstotaler, säkerställa att formler är konsekventa, väl dokumenterade och anpassade till affärsdefinitioner.
Beräkna vinst och bruttomarginalBeräkna vinstmarginal säkertHärleda AOV från intäkt och ordrarEnhetstotaler från mängd och enhetsprisSynkronisera metriker med affärsdefinitionerLektion 7Tekniker för reproducerbar ETL: dokumenterade steg, skript, notebooks och kontrollsummor för CSV-importintegritetLär dig designa reproducerbara ETL-pipelines för försäljnings-CSV:er. Du kommer att skriva transformationer, spåra versioner, använda notebooks för utforskning och tillämpa kontrollsummor och valideringssteg för att garantera importintegritet över tid.
Skripta upprepningsbara CSV-transformationerAnvända notebooks för explorativ ETLVersionshantering av ETL-kod och konfigurationKontrollsummor och filintegritetsvalideringAutomatiserade ETL-körningar och loggningLektion 8Saknade värden och nullmönster: detektionsmetoder, imputationsstrategier och när man ska ta bort raderBemästra tekniker för att upptäcka och behandla saknade eller nullvärden i försäljnings-CSV:er. Du kommer att profilera nullmönster, välja imputationsstrategier, besluta när rader ska tas bort och dokumentera antaganden för att skydda nedströmsmetriker.
Profilera saknadhet över nyckelkolumnerVisualisera nullmönster och korrelationerImputationsstrategier för numeriska fältImputationsstrategier för kategoriska fältRegler för säkert borttagande av rader eller kolumnerLektion 9Datatyper och parsning: datumformat, numeriska typer, kategorisk kodning, hantera sträng vs numeriska värdenLär dig korrekt parsa datum, siffror och kategorier i försäljnings-CSV:er. Du kommer att skilja text från numeriska fält, tillämpa lokalanpassad parsning och designa robusta kategoriska kodningar som förblir stabila vid uppdateringar.
Upptäcka kolumndatatyper vid CSV-importParsa datum med flera lokala formatHantera numeriska separatorer och valutasymbolerDesigna stabila kategoriska kodningarKonvertera blandade kolumntyper säkertLektion 10Hantera flerlinjiga ordrar och aggregering på order- vs orderlinjenivåLär dig hantera ordrar som spänner över flera rader i försäljnings-CSV:er. Du kommer att skilja order- och orderlinje-granularitet, aggregera korrekt och undvika dubbelräkning av intäkt, mängd och rabatter i instrumentpaneler.
Identifiera order- vs orderlinje-granularitetAggregera intäkt på ordnivåSummera rabatter över linjerUndvika dubbelräkning i rollupsVälja granularitet för instrumentpanelmetriker