Pelajaran 1Peraturan pengesahan data: pendua, integriti rujukan (pelanggan/produk), nilai luar julat, harga/kuantiti negatifTentukan peraturan pengesahan yang kukuh untuk mengekalkan CSV jualan boleh dipercayai. Anda akan mengesan pendua, menguatkuasakan integriti rujukan, dan menanda nilai luar julat atau negatif sebelum ia merosakkan papan pemuka dan model hiliran.
Mengesan pesanan dan baris pesanan penduaMemeriksa kunci integriti rujukanMengesahkan julat dan ambang nomborMengendalikan harga dan kuantiti negatifMembina senarai semak pengesahan boleh digunakan semulaPelajaran 2Memahami semantik lajur: order_id, order_date, customer_id, customer_region, product_id, product_category, product_subcategory, quantity, unit_price, discount, revenue, cost, channelJelaskan makna dan peranan lajur jualan teras yang digunakan dalam papan pemuka. Anda akan memetakan pengenalan, tarikh, atribut produk, kuantiti, dan medan monetari, memastikan semantik konsisten merentasi model dan visualisasi.
Pengenalan peringkat pesanan dan pemilihan butirMedan pengenalan pelanggan dan wilayahPeranan produk, kategori, dan subkategoriKuantiti, unit_price, diskaun, dan hasilKos, saluran, dan medan berkaitan marginPelajaran 3Mengendalikan diskaun dan pengiraan harga: mengira semula hasil daripada unit_price, kuantiti, dan diskaun serta menyegerakkan dengan hasil dilaporkanFahami cara mengira semula dan mengesahkan metrik hasil dan harga. Anda akan mengira hasil baris daripada unit_price, kuantiti, dan diskaun, menyegerakkan dengan jumlah dilaporkan, dan menanda ketidakselarasan untuk semakan.
Formula hasil daripada unit_price dan kuantitiMenerapkan diskaun peratusan dan mutlakMenyegerakkan hasil dikira dan dilaporkanMengesan corak diskaun tidak konsistenMendokumentasikan logik harga dan diskaunPelajaran 4Transformasi berasaskan masa: mengekstrak tahun, suku, bulan, minggu, hari kerja, tingkap bergulir, dan kalendar fiskalFahami cara mengubah tarikh pesanan kepada ciri masa yang kaya untuk analisis. Anda akan memperoleh atribut kalendar dan fiskal, membina tingkap bergulir, dan menyediakan medan masa konsisten untuk papan pemuka dan model siri masa.
Mengekstrak tahun, suku, bulan, dan mingguMemperoleh penunjuk hari kerja dan hujung mingguMembina metrik tingkap bergulir dan bergerakMelaksanakan kalendar fiskal dan ofsyetMenjajarkan butir masa untuk papan pemukaPelajaran 5Transformasi pembersihan data: memangkas, penormalkan kes, menstandardkan label wilayah dan saluranTeroka langkah pembersihan praktikal untuk menjadikan CSV jualan mentah konsisten dan sedia analisis. Anda akan memangkas ruang kosong, menormalkan kes, dan menstandardkan label wilayah dan saluran untuk mengelakkan pendua dan penapis papan pemuka yang rosak.
Memangkas ruang kosong dan aksara tidak kelihatanPenormalkan kes untuk dimensi teksMenstandardkan taksonomi wilayah dan saluranMenggabungkan varian label hampir penduaMendokumentasikan peraturan pembersihan untuk guna semulaPelajaran 6Metrik terbitan dan transformasi: untung = hasil - kos, margin_untung = untung / hasil, margin_kasar, AOV = hasil / bilangan_pesanan, jumlah_unit = kuantiti * unit_priceBelajar memperoleh metrik jualan utama daripada medan CSV mentah. Anda akan mengira untung, margin, AOV, dan jumlah unit, memastikan formula konsisten, didokumentasikan dengan baik, dan sejajar dengan definisi perniagaan.
Mengira untung dan margin kasarMengira margin_untung dengan selamatMemperoleh AOV daripada hasil dan pesananJumlah unit daripada kuantiti dan unit_priceMenjajarkan metrik dengan definisi perniagaanPelajaran 7Teknik untuk ETL boleh diulang: langkah didokumentasikan, skrip, buku nota, dan jumlah semak untuk integriti import CSVBelajar mereka bentuk saluran ETL boleh diulang untuk CSV jualan. Anda akan menulis skrip transformasi, menjejaki versi, menggunakan buku nota untuk penerokaan, dan menerapkan jumlah semak dan langkah pengesahan untuk menjamin integriti import dari masa ke masa.
Menulis skrip transformasi CSV boleh diulangMenggunakan buku nota untuk ETL penerokaanVersi kod ETL dan konfigurasiJumlah semak dan pengesahan integriti failLarian ETL automatik dan logPelajaran 8Nilai hilang dan corak null: kaedah pengesanan, strategi imputasi, dan bila drop barisKuasai teknik mengesan dan merawat nilai hilang atau null dalam CSV jualan. Anda akan profil corak null, pilih strategi imputasi, putuskan bila drop baris, dan dokumentasikan andaian untuk melindungi metrik hiliran.
Profil kehilangan merentasi lajur utamaVisualisasi corak null dan korelasiStrategi imputasi untuk medan nomborStrategi imputasi untuk medan kategoriPeraturan untuk drop baris atau lajur dengan selamatPelajaran 9Jenis data dan penghuraian: format tarikh, jenis nombor, pengkodan kategori, mengendalikan nilai rentetan vs nomborBelajar menghurai tarikh, nombor, dan kategori dengan betul dalam CSV jualan. Anda akan membezakan teks daripada medan nombor, terapkan penghuraian peka lokasi, dan mereka kod kategori kukuh yang kekal stabil merentasi penyegaran.
Mengesan jenis data lajur dalam import CSVMenghurai tarikh dengan pelbagai format lokasiMengendalikan pemisah nombor dan simbol mata wangMereka kod kategori stabilMenukar lajur jenis campuran dengan selamatPelajaran 10Mengendalikan pesanan berbaris berganda dan agregasi pada peringkat pesanan vs baris pesananBelajar mengendalikan pesanan yang merangkumi pelbagai baris dalam CSV jualan. Anda akan membezakan butir pesanan dan baris pesanan, agregat dengan betul, dan elakkan kira berganda hasil, kuantiti, dan diskaun dalam papan pemuka.
Mengenal pasti butir pesanan vs baris pesananMengagregat hasil pada peringkat pesananMerumuskan diskaun merentasi barisMengelakkan kira berganda dalam rollupMemilih butir untuk metrik papan pemuka