Pelajaran 1Aturan validasi data: duplikat, integritas referensial (pelanggan/produk), nilai di luar rentang, harga/kuantitas negatifTentukan aturan validasi yang kuat untuk menjaga CSV penjualan tetap dapat dipercaya. Anda akan mendeteksi duplikat, memastikan integritas referensial, dan menandai nilai di luar rentang atau negatif sebelum merusak dasbor dan model hilir.
Mendeteksi pesanan duplikat dan baris pesananMemeriksa kunci integritas referensialMemvalidasi rentang numerik dan ambang batasMenangani harga dan kuantitas negatifMembangun daftar periksa validasi yang dapat digunakan kembaliPelajaran 2Memahami semantik kolom: order_id, order_date, customer_id, customer_region, product_id, product_category, product_subcategory, quantity, unit_price, discount, revenue, cost, channelJelaskan arti dan peran kolom penjualan inti yang digunakan di dasbor. Anda akan memetakan pengenal, tanggal, atribut produk, kuantitas, dan field moneter, memastikan semantik konsisten di seluruh model dan visualisasi.
Pengidentifikasi tingkat pesanan dan pemilihan grainField identifikasi pelanggan dan wilayahPeran produk, kategori, dan subkategoriKuantitas, harga satuan, diskon, dan pendapatanField biaya, saluran, dan margin terkaitPelajaran 3Menangani diskon dan perhitungan harga: menghitung ulang pendapatan dari unit_price, quantity, dan discount serta merekonsiliasi dengan pendapatan yang dilaporkanPahami cara menghitung ulang dan memvalidasi metrik pendapatan dan harga. Anda akan menghitung pendapatan baris dari harga satuan, kuantitas, dan diskon, merekonsiliasi dengan total yang dilaporkan, serta menandai inkonsistensi untuk ditinjau.
Rumus pendapatan dari harga satuan dan kuantitasMenerapkan diskon persentase dan absolutMerekonsiliasi pendapatan yang dihitung dan dilaporkanMendeteksi pola diskon yang tidak konsistenMendokumentasikan logika harga dan diskonPelajaran 4Transformasi berbasis waktu: mengekstrak tahun, kuartal, bulan, minggu, hari kerja, jendela bergulir, dan kalender fiskalPahami cara mengubah tanggal pesanan menjadi fitur waktu yang kaya untuk analisis. Anda akan menurunkan atribut kalender dan fiskal, membangun jendela bergulir, serta menyiapkan field waktu konsisten untuk dasbor dan model deret waktu.
Mengekstrak tahun, kuartal, bulan, dan mingguMenurunkan indikator hari kerja dan akhir pekanMembangun metrik jendela bergulir dan bergerakMenerapkan kalender fiskal dan offsetMenyesuaikan grain waktu untuk dasborPelajaran 5Transformasi pembersihan data: trimming, normalisasi huruf, menstandarisasi label wilayah dan saluranJelajahi langkah pembersihan praktis untuk membuat CSV penjualan mentah konsisten dan siap analisis. Anda akan memangkas spasi kosong, menormalkan huruf, serta menstandarisasi label wilayah dan saluran untuk menghindari duplikat dan filter dasbor yang rusak.
Memangkas spasi kosong dan karakter tak terlihatNormalisasi huruf untuk dimensi teksMenstandarisasi taksonomi wilayah dan saluranMenggabungkan varian label hampir duplikatMendokumentasikan aturan pembersihan untuk digunakan kembaliPelajaran 6Metrik turunan dan transformasi: profit = revenue - cost, profit_margin = profit / revenue, gross_margin, AOV = revenue / order_count, unit_total = quantity * unit_pricePelajari cara menurunkan metrik penjualan kunci dari field CSV mentah. Anda akan menghitung profit, margin, AOV, dan total satuan, memastikan rumus konsisten, terdokumentasi dengan baik, dan selaras dengan definisi bisnis.
Menghitung profit dan gross marginMenghitung profit_margin dengan amanMenurunkan AOV dari pendapatan dan pesananTotal satuan dari kuantitas dan harga satuanMenyesuaikan metrik dengan definisi bisnisPelajaran 7Teknik ETL yang dapat direproduksi: langkah terdokumentasi, skrip, notebook, dan checksum untuk integritas impor CSVPelajari cara merancang pipeline ETL yang dapat direproduksi untuk CSV penjualan. Anda akan membuat skrip transformasi, melacak versi, menggunakan notebook untuk eksplorasi, serta menerapkan checksum dan langkah validasi untuk menjamin integritas impor dari waktu ke waktu.
Membuat skrip transformasi CSV yang dapat diulangMenggunakan notebook untuk ETL eksploratifPemversian kode dan konfigurasi ETLChecksum dan validasi integritas fileEksekusi ETL otomatis dan loggingPelajaran 8Nilai hilang dan pola null: metode deteksi, strategi imputasi, dan kapan menjatuhkan barisKuasai teknik mendeteksi dan menangani nilai hilang atau null di CSV penjualan. Anda akan memprofiling pola null, memilih strategi imputasi, memutuskan kapan menjatuhkan baris, serta mendokumentasikan asumsi untuk melindungi metrik hilir.
Memprofiling kehilangan di seluruh kolom kunciMemvisualisasikan pola null dan korelasiStrategi imputasi untuk field numerikStrategi imputasi untuk field kategorikalAturan untuk menjatuhkan baris atau kolom dengan amanPelajaran 9Tipe data dan parsing: format tanggal, tipe numerik, pengkodean kategorikal, menangani nilai string vs numerikPelajari cara mem-parsing tanggal, angka, dan kategori dengan benar di CSV penjualan. Anda akan membedakan teks dari field numerik, menerapkan parsing sadar lokalisasi, serta merancang pengkodean kategorikal yang stabil di seluruh penyegaran.
Mendeteksi tipe data kolom dalam impor CSVMem-parsing tanggal dengan berbagai format lokalisasiMenangani pemisah numerik dan simbol mata uangMerancang pengkodean kategorikal stabilMengonversi kolom tipe campuran dengan amanPelajaran 10Menangani pesanan multi-baris dan agregasi pada tingkat pesanan vs baris pesananPelajari cara menangani pesanan yang melintasi beberapa baris di CSV penjualan. Anda akan membedakan grain pesanan dan baris pesanan, mengagregasi dengan benar, serta menghindari penghitungan ganda pendapatan, kuantitas, dan diskon di dasbor.
Mengidentifikasi grain pesanan vs baris pesananMengagregasi pendapatan pada tingkat pesananMerangkum diskon di seluruh barisMenghindari penghitungan ganda dalam rollupMemilih grain untuk metrik dasbor