1-darsAnalitika uchun o'lchovli modelni loyihalash: faktlar va o'lchovlar xaritasiAnalitika uchun o'lchovli modellashtirishni o'rganing. Siz biznes jarayonlarini fakt jadvallariga xaritalashtirasiz, o'lchovlarni va donolikni belgilaysiz, ko'p-ko'p munosabatlarni boshqarasiz va o'z-o'ziga xizmat BI va yuqori samarali so'rovlarni qo'llab-quvvatlaydigan sxemalarni loyihalashtirasiz.
Biznes jarayonlari va faktlarni aniqlashFakt jadvallarining donoligini tanlashMuvofiqlashtirilgan o'lchovlarni loyihalashKo'p-ko'p munosabatlarni boshqarishYulduz va qor parcha sxema savdo-offs2-darsfact_user_activity: sxema maydonlari (event_id, user_id, course_id, event_type, timestamp, duration, device, session_id, ingestion_metadata)Xulq-atvor analitikasi uchun fact_user_activity jadvalini modellashtiring. Biz har bir maydonni belgilaymiz, voqea donoligini tanlaymiz, sessiyalar va qurilmalarni ushlab olamiz, ingestion metama'lumotlarini saqlaymiz va funnellar, ishtirok va saqlash hisobotlarini qo'llab-quvvatlaymiz.
Voqea darajasidagi donolikni belgilashevent_type va tasniflarni modellashtirishSessiya va qurilma atributlariingestion_metadata maydonlaridan foydalanishFunnellar va saqlashni qo'llab-quvvatlash3-darsHosildor metrikalar va agregatsiyalar: kunlik faol foydalanuvchilar (DAU), kurs bo'yicha faol foydalanuvchilar, mamlakat bo'yicha kurs tugallanish darajasi, kurs va kohort bo'yicha daromadFakt jadvallaridan hosildor metrikalar va agregatsiyalarni qurishni o'rganing. Biz DAU, kurs bo'yicha faollik, tugallanish darajalari va kohort daromadini hisoblaymiz, takrorlanadigan ta'riflarga va samarali materializatsiya naqshlariga e'tibor beramiz.
DAU va MAU ni izchil belgilashKurs bo'yicha faol foydalanuvchi metrikalariSegment va mamlakat bo'yicha tugallanish darajasiKurs va kohort bo'yicha daromadMa'lumotlar omborlarida agregatlarni materializatsiya qilish4-darsSekin o'zgaruvchi o'lchovlarni boshqarish (SCD Type 1/2) va vaqt-sayohat/versiyalashSekin o'zgaruvchi o'lchovlar va vaqt-sayohatni boshqarishni o'rganing. Biz SCD Type 1 va Type 2 ni solishtiramiz, samarali sana diapazonlarini loyihalaymiz, versiya metama'lumotlarini saqlaymiz va ombor xususiyatlaridan foydalanib tarixiy o'lchov holatlarini so'rashni o'rganamiz.
Qachon SCD Type 1 vs Type 2 dan foydalanishSamarali sanalar va joriy belgilariSQL va dbt da SCD ni amalga oshirishOmbor vaqt-sayohat xususiyatlaridan foydalanishTarixiy o'lchovlarning to'g'riligini sinovdan o'tkazish5-darsMa'lumotlarning yangiligi va deyarli real vaqtdagi KPI uchun oyna strategiyalariDeyarli real vaqtdagi KPI uchun yangilik strategiyalarini loyihalang. Biz kechikish byudjetlari, suv belgilari, oqim metrikalari uchun oynalash, kech kelgan ma'lumotlarni boshqarish va dashboardlarni ishonchli va harakatga tayyor holatda saqlash uchun yangilikni monitoring qilishni qamrab olamiz.
Yangilik va kechikish maqsadlarini belgilashSuv belgilari va kech ma'lumotlarni boshqarishAylanma, siljish va sessiya oynalariDeyarli real vaqt KPI hisoblashYangilik bo'yicha monitoring va ogohlantirish6-darsMa'lumotlarni tozalash bosqichlari: tahlil qilish, tur majburlash, vaqt belgisi normalizatsiyasi, dublikatlarni olib tashlash, boyitishModellashtirishdan oldin xom ma'lumotlarni tizimli ravishda tozalashni o'rganing. Biz yarim tuzilgan maydonlarni tahlil qilish, ma'lumot turlarini majburlash, vaqt zonalariga ko'ra vaqt belgilarni normalizatsiya qilish, yozuvlarni dublikatlashtirish va ma'lumotlar to'plamlarini havola va qidiruv ma'lumotlari bilan boyitishni qamrab olamiz.
JSON, CSV va ichma-ich maydonlarni tahlil qilishTur majburlash va sxema validatsiyasiVaqt zonasi normalizatsiyasi va standartlariYozuv dublikatlarini olib tashlash strategiyalariBoyitish uchun havola ma'lumotlari birikmalari7-darsdim_course: sxema maydonlari (course_id, title, author_id, category, price, published_date)Kurs analitikasi uchun dim_course o'lchovini loyihalang. Biz har bir maydonni belgilaymiz, proksi kalitlarni muhokama qilamiz, narx va kategoriya o'zgarishlarini boshqaramiz va aniq tarixiy va katalog hisobotlarini yoqish uchun nashr etilgan sanalarni modellashtiramiz.
Har bir dim_course maydonining biznes ma'nosiTabiiy kalitlar vs proksi course_idKurs narxi va kategoriya o'zgarishlarini boshqarishNashr etilgan va nashr etilmagan holatlarni modellashtirishBI so'rovlari uchun dim_course ni indekslash8-darsdim_user: sxema maydonlari (user_id, email_hash, signup_date, country, subscription_status, cohort)Foydalanuvchi analitikasi va segmentatsiyasi uchun dim_user o'lchovini loyihalang. Biz har bir maydonni belgilaymiz, sezgir ma'lumotlarni hashlaymiz, ro'yxatdan o'tish va kohortlarni kuzatamiz va o'sish, saqlash va monetizatsiya hisobotlarini qo'llab-quvvatlash uchun obuna holatini modellashtiramiz.
Foydalanuvchi identifikatorlari va proksi kalitlarEmail hashing va maxfiylik nazoratiRo'yxatdan o'tish_sana va kohortlarni modellashtirishsubscription_status hayot tsikliMamlakat va lokalizatsiya atributlari9-darsTransformatsiya naqshlari: ELT vs ETL, inkremental transformatsiyalar, batch vs oqim transformatsiyalariAsosiy transformatsiya naqshlarini va ularni qo'llash vaqtlarini tushuning. Biz ETL va ELT ni solishtiramiz, inkremental quvurlarni loyihalaymiz va batch va oqim transformatsiyalarini solishtiramiz, xarajat, kechikish, kuzatuvchanlik va operatsion savdo-offlarga e'tibor beramiz.
ETL va ELT arxitekturalarini solishtirishInkremental transformatsiyalarni loyihalashBatch qayta ishlash ijobiy va salbiy tomonlariOqim va mikro-batch naqshlariSLA va xarajat bo'yicha naqshlarni tanlash10-darsTransformatsiyalar uchun vositalar: dbt, Spark/Databricks, Beam/Flink, SQL-ga asoslangan transformatsiya freymvorklariAsosiy transformatsiya vositalarini va ular orasidan tanlashni o'rganing. Biz dbt, Spark, Databricks, Beam, Flink va SQL freymvorklarini solishtiramiz, masshtablilik, orkestratsiya, sinov va zamonaviy ma'lumotlar stacklari bilan integratsiyaga e'tibor beramiz.
SQL-markazli transformatsiyalar uchun dbtKatta ma'lumotlar uchun Spark va DatabricksOqim ishlar uchun Beam va FlinkSQL-ga asoslangan transformatsiya freymvorklariVosita tanlash mezonlari va savdo-offlar11-darsfact_payments: sxema maydonlari (payment_id, user_id, course_id, amount, currency, payment_method, status, timestamp, invoice_id)Daromad analitikasi uchun fact_payments jadvalini modellashtiring. Biz har bir maydonni belgilaymiz, idempotent ingestionni muhokama qilamiz, valyuta boshqaruvi, to'lov holati, qaytarib berishlar va to'lovlarni foydalanuvchilar, kurslar va hisob-fakturalarga bog'lashni o'rganamiz.
fact_payments donoligi va birlamchi kalitiTo'lov holati va hayot siklini modellashtirishKo'p valyutali summalarni boshqarishTo'lovlarni foydalanuvchilar va kurslarga bog'lashQaytarib berishlar va chargebacklarni ushlab olish