មេរៀនរងទី 1រចនាមូលដ្ឋានវិមាត្រសម្រាប់វិភាគ៖ ផែនទីហេតុការណ៍ និងវិមាត្រស្វែងយល់ការធ្វើមូលដ្ឋានវិមាត្រសម្រាប់វិភាគ។ អ្នកនឹងផែនទីដំណើរការអាជីវកម្មទៅតារាងហេតុការ កំណត់វិមាត្រ និងក្រាម ដោះស្រាយទំនាក់ទំនងច្រើនទល់នឹងច្រើន និងរចនាប្លង់ដែលគាំទ្រការប្រើប្រាស់ BI ឯករាជ្យ និងសួរប្រសិទ្ធភាព។
កំណត់ដំណើរការអាជីវកម្ម និងហេតុការជ្រើសរើសក្រាមតារាងហេតុការរចនាវិមាត្រស្របគ្នាដោះស្រាយទំនាក់ទំនងច្រើនទល់នឹងច្រើនការពិចារណាប្លង់ star vs snowflakeមេរៀនរងទី 2fact_user_activity៖ វាលប្លង់ (event_id, user_id, course_id, event_type, timestamp, duration, device, session_id, ingestion_metadata)ធ្វើមូលដ្ឋានតារាង fact_user_activity សម្រាប់វិភាគអាកប្បកិច្ច។ យើងកំណត់វាលនីមួយៗ ជ្រើសរើសក្រាមព្រឹត្តិការណ៍ ចាប់យកសម័យ និងឧបករណ៍ រក្សាមេតាចូល និងគាំទ្រផ្លូវសួរ ការចូលរួម និងរបាយការណ៍រក្សា។
កំណត់ក្រាមកម្រិតព្រឹត្តិការណ៍ធ្វើមូលដ្ឋាន event_type និងការចាត់ថ្នាក់ការកំណត់សម័យ និងឧបករណ៍ប្រើវាល ingestion_metadataគាំទ្រផ្លូវសួរ និងរក្សាមេរៀនរងទី 3សូចនាករបានគណនា និងការសង្ខេប៖ អ្នកប្រើសកម្មប្រចាំថ្ងៃ (DAU), អ្នកប្រើសកម្មក្នុងវគ្គសិក្សា, អត្រាបញ្ចប់វគ្គសិក្សាតាមប្រទេស, ប្រាក់ចំណូលតាមវគ្គសិក្សា និងក្រុមរៀនសាងសូចនាករបានគណនា និងការសង្ខេបពីតារាងហេតុការ។ យើងគណនា DAU សកម្មក្នុងវគ្គសិក្សា អត្រាបញ្ចប់ និងប្រាក់ចំណូលក្រុម ដោយសង្កត់ធ្ងន់លើការកំណត់អាចផលិតឡើងវិញ និងលំនាំសម្រាប់បង្កើតប្រសិទ្ធភាព។
កំណត់ DAU និង MAU ឱ្យស្របគ្នាសូចនាករអ្នកប្រើសកម្មក្នុងវគ្គសិក្សាអត្រាបញ្ចប់តាមក្រុម និងប្រទេសប្រាក់ចំណូលតាមវគ្គសិក្សា និងក្រុមបង្កើតការសង្ខេបនៅក្នុងឃ្លាំងមេរៀនរងទី 4ដោះស្រាយវិមាត្រផ្លាស់ប្តូរយឺត (SCD Type 1/2) និងការធ្វើដំណើរតាមពេលវេលា/កំណែរៀនរបៀបគ្រប់គ្រងវិមាត្រផ្លាស់ប្តូរយឺត និងការធ្វើដំណើរតាមពេលវេលា។ យើងប្រៀបធៀប SCD Type 1 និង Type 2 រចនាជួរកាលបរិច្ឆេទមានប្រសិទ្ធភាព រក្សាមេតាកំណែ និងប្រើគុណភាពឃ្លាំងដើម្បីសួរស្ថានភាពវិមាត្រប្រវត្តិសាស្ត្រ។
ពេលណាប្រើ SCD Type 1 vs Type 2កាលបរិច្ឆេទមានប្រសិទ្ធភាព និងដាល់បច្ចុប្បន្នអនុវត្ត SCD ក្នុង SQL និង dbtប្រើគុណភាពធ្វើដំណើរតាមពេលវេលាឃ្លាំងសាកល្បងភាពត្រឹមត្រូវវិមាត្រប្រវត្តិសាស្ត្រមេរៀនរងទី 5ភាពស្រស់ទិន្នន័យ និងយុទ្ធសាស្ត្របង្អួចសម្រាប់ KPI ជិតពេលវេលាជាក់ស្តែងរចនាយុទ្ធសាស្ត្រស្រស់សម្រាប់ KPI ជិតពេលវេលាជាក់ស្តែង។ យើងគ្របដណ្តប់ថវិកាយឺត សញ្ញាទឹក បង្អួចសម្រាប់សូចនាករស្ទ្រីម ដោះស្រាយទិន្នន័យយឺតមកដល់ និងតាមដានភាពស្រស់ដើម្បីរក្សាបន្ទះឱ្យអាចទុកចិត្ត និងអាចធ្វើបាន។
កំណត់គោលដៅស្រស់ និងយឺតសញ្ញាទឹក និងដោះស្រាយទិន្នន័យយឺតបង្អួចរំកិល រសើប និងសម័យគណនា KPI ជិតពេលវេលាជាក់ស្តែងតាមដាន និងសញ្ញាជូនដំណឹងស្រស់មេរៀនរងទី 6ជំហានសម្អាតទិន្នន័យ៖ វិភាគ បង្ខំប្រភេទ ការធម្មតាពេលវេលា លុបស្ទួន បំពេញរៀនរបៀបសម្អាតទិន្នន័យឆៅជាមួយប្រព័ន្ធមុនធ្វើមូលដ្ឋាន។ យើងគ្របដណ្តប់ការវិភាគវាលថេរ បង្ខំប្រភេទទិន្នន័យ ធម្មតាពេលវេលាពាសព្យានុរតនៅតាមតំបន់ពេលវេលា លុបស្ទួនកំណត់ហេតុ និងបំពេញសំ័យទិន្នន័យជាមួយទិន្នន័យយោង និងមើល។
វិភាគ JSON, CSV, និងវាលចង្អៀតបង្ខំប្រភេទ និងផ្ទៀងផ្ទាត់ប្លង់ទិន្នន័យការធម្មតាតំបន់ពេលវេលា និងស្តង់ដារយុទ្ធសាស្ត្រលុបស្ទួនកំណត់ហេតុការចម្លងទិន្នន័យយោងសម្រាប់បំពេញមេរៀនរងទី 7dim_course៖ វាលប្លង់ (course_id, title, author_id, category, price, published_date)រចនាវិមាត្រ dim_course ដើម្បីគាំទ្រវិភាគវគ្គសិក្សា។ យើងកំណត់វាលនីមួយៗ ពិភាក្សាកូនសោជំនួយ ដោះស្រាយការផ្លាស់ប្តូរតម្លៃ និងប្រភេទ និងធ្វើមូលដ្ឋានកាលបរិច្ឆេទបោះពុម្ពផ្សាយដើម្បីអនុញ្ញាតឱ្យរបាយការណ៍ប្រវត្តិសាស្ត្រ និងកាតាឡូគត្រឹមត្រូវ។
អត្ថន័យអាជីវកម្មនៃវាល dim_course នីមួយៗកូនសោធម្មជាតិ vs កូនសោជំនួយ course_idដោះស្រាយការផ្លាស់ប្តូរតម្លៃ និងប្រភេទវគ្គសិក្សាធ្វើមូលដ្ឋានស្ថានភាពបោះពុម្ព និងមិនបោះចាប់អ៊ីនដ៊ែក dim_course សម្រាប់សួរ BIមេរៀនរងទី 8dim_user៖ វាលប្លង់ (user_id, email_hash, signup_date, country, subscription_status, cohort)រចនាវិមាត្រ dim_user សម្រាប់វិភាគអ្នកប្រើ និងការបែងចែក។ យើងកំណត់វាលនីមួយៗ ហាសទិន្នន័យច្រើនអារម្មណ៍ តាមដានការចុះឈ្មោះ និងក្រុម និងធ្វើមូលដ្ឋានស្ថានភាពការជាញ្ញាក់ដើម្បីគាំទ្រការរីកចម្រើន រក្សា និងរបាយការណ៍ប្រាក់ចំណូល។
អត្តសញ្ញាណអ្នកប្រើ និងកូនសោជំនួយហាសអ៊ីមែល និងការគ្រប់គ្រងឯកជនភាពធ្វើមូលដ្ឋានកាលបរិច្ឆេទចុះឈ្មោះ និងក្រុមឆាកជីវិត subscription_statusប្រទេស និងគុណលក្ខណៈក្នុងស្រុកមេរៀនរងទី 9លំនាំផ្លាស់ប្តូរ៖ ELT vs ETL, ការផ្លាស់ប្តូរបន្ត, កញ្ចប់ vs ផ្លាស់ប្តូរស្ទ្រីមយល់ដឹងលំនាំផ្លាស់ប្តូរស្នូល និងពេលណាអនុវត្តពួកវា។ យើងប្រៀបធៀប ETL និង ELT រចនាបំពង់បន្ត និងប្រៀបធៀបផ្លាស់ប្តូរកញ្ចប់ និងស្ទ្រីម ដោយផ្តោតលើតម្លៃ ពេលវេលាយឺត ភាពអាចមើលឃើញ និងការពិចារណាប្រតិបត្តិការ។
ប្រៀបធៀបស្ថាបត្យកម្ម ETL និង ELTរចនាការផ្លាស់ប្តូរបន្តអត្ថប្រយោជន៍ និងគុណវិបត្តិកញ្ចប់លំនាំស្ទ្រីម និងកញ្ចប់តូចជ្រើសរើសលំនាំតាម SLA និងតម្លៃមេរៀនរងទី 10ឧបករណ៍សម្រាប់ផ្លាស់ប្តូរ៖ dbt, Spark/Databricks, Beam/Flink, ស៊ីសង់ផ្លាស់ប្តូរ SQLស្ទង់ឧបករណ៍ផ្លាស់ប្តូរសំខាន់ និងរបៀបជ្រើសរើសរវាងពួកវា។ យើងប្រៀបធៀប dbt, Spark, Databricks, Beam, Flink, និងស៊ីសង់ SQL ដោយផ្តោតលើការពង្រីក ការសម្រប ការសាកល្បង និងការរួមបញ្ចូលជាមួិកខ្សែទិន្នន័យទំនើប។
dbt សម្រាប់ផ្លាស់ប្តូរផ្តោតលើ SQLSpark និង Databricks សម្រាប់ទិន្នន័យធំBeam និង Flink សម្រាប់ការងារស្ទ្រីមស៊ីសង់ផ្លាស់ប្តូរផ្តោតលើ SQLលក្ខណៈវិនិច្ឆ័យជ្រើសរើសឧបករណ៍ និងការពិចារណាមេរៀនរងទី 11fact_payments៖ វាលប្លង់ (payment_id, user_id, course_id, amount, currency, payment_method, status, timestamp, invoice_id)ធ្វើមូលដ្ឋានតារាង fact_payments សម្រាប់វិភាគប្រាក់ចំណូល។ យើងកំណត់វាលនីមួយៗ ពិភាក្សាការចូលតែមួយ ការគ្រប់គ្រងរូបិយបណ្ណ ស្ថានភាពទូទាត់ ការសងប្រាក់ និងរបៀបភ្ជាប់ការទូទាត់ទៅអ្នកប្រើ វគ្គសិក្សា និងវិក័យបាត្រសម្រាប់របាយការណ៍ក្រោយ។
ក្រាម និងកូនសោដំបូងនៃ fact_paymentsធ្វើមូលដ្ឋានស្ថានភាពទូទាត់ និងឆាកជីវិតដោះស្រាយបរិមាណច្រើនរូបិយបណ្ណភ្ជាប់ការទូទាត់ទៅអ្នកប្រើ និងវគ្គសិក្សាចាប់យកការសងប្រាក់ និងការទាញយក