سبق 1ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਡਾਈਮੈਂਸ਼ਨਲ ਮਾਡਲ ਡਿਜ਼ਾਈਨ: ਫੈਕਟਸ ਅਤੇ ਡਾਈਮੈਂਸ਼ਨਾਂ ਮੈਪਿੰਗਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਡਾਈਮੈਂਸ਼ਨਲ ਮਾਡਲਿੰਗ ਖੋਜੋ। ਤੁਸੀਂ ਵਪਾਰਕ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਫੈਕਟ ਟੇਬਲਾਂ ਨਾਲ ਮੈਪ ਕਰੋਗੇ, ਡਾਈਮੈਂਸ਼ਨਾਂ ਅਤੇ ਗ੍ਰੇਨ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋਗੇ, ਬਹੁ-ਬਹੁ ਸਬੰਧਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰੋਗੇ ਅਤੇ ਸੈਲਫ-ਸਰਵਿਸ ਬਾਈ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨੀ ਕੁਏਰੀਆਂ ਨੂੰ ਸਮਰਥਨ ਕਰਨ ਵਾਲੀਆਂ ਸਕੀਮਾਵਾਂ ਡਿਜ਼ਾਈਨ ਕਰੋਗੇ।
Identifying business processes and factsChoosing the grain of fact tablesDesigning conformed dimensionsHandling many-to-many relationshipsStar vs snowflake schema trade-offsسبق 2ਫੈਕਟ_ਯੂਜ਼ਰ_ਐਕਟੀਵਿਟੀ: ਸਕੀਮਾ ਫੀਲਡ (ਘਟਨਾ_ਆਈਡੀ, ਯੂਜ਼ਰ_ਆਈਡੀ, ਕੋਰਸ_ਆਈਡੀ, ਘਟਨਾ_ਟਾਈਪ, ਟਾਈਮਸਟੈਂਪ, ਅਵਧੀ, ਡਿਵਾਈਸ, ਸੈਸ਼ਨ_ਆਈਡੀ, ਇੰਟੇਕ_ਮੈਟਾਡਾਟਾ)ਵਿਹਾਰਕ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਫੈਕਟ_ਯੂਜ਼ਰ_ਐਕਟੀਵਿਟੀ ਟੇਬਲ ਨੂੰ ਮਾਡਲ ਕਰੋ। ਅਸੀਂ ਹਰ ਫੀਲਡ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਾਂ, ਘਟਨਾ ਗ੍ਰੇਨ ਚੁਣਦੇ ਹਾਂ, ਸੈਸ਼ਨਾਂ ਅਤੇ ਡਿਵਾਈਸਾਂ ਨੂੰ ਕੈਪਚਰ ਕਰਦੇ ਹਾਂ, ਇੰਟੇਕ ਮੈਟਾਡਾਟਾ ਸਟੋਰ ਕਰਦੇ ਹਾਂ ਅਤੇ ਫੰਨਲਸ, ਏਂਗੇਜਮੈਂਟ ਅਤੇ ਰਿਟੈਨਸ਼ਨ ਰਿਪੋਰਟਿੰਗ ਨੂੰ ਸਮਰਥਨ ਕਰਦੇ ਹਾਂ।
Defining the event-level grainModeling event_type and taxonomiesSession and device attributionUsing ingestion_metadata fieldsSupporting funnels and retentionسبق 3ਉਤਪੰਨ ਮੈਟ੍ਰਿਕਸ ਅਤੇ ਏਗ੍ਰੀਗੇਸ਼ਨਾਂ: ਰੋਜ਼ਾਨਾ ਐਕਟਿਵ ਯੂਜ਼ਰ (DAU), ਕੋਰਸ ਪ੍ਰਤੀ ਐਕਟਿਵ ਯੂਜ਼ਰ, ਦੇਸ਼ ਅਨੁਸਾਰ ਕੋਰਸ ਪੂਰਤੀ ਦਰ, ਕੋਰਸ ਅਤੇ ਕੋਹੌਰਟ ਅਨੁਸਾਰ ਰੈਵੇਨਿਊਫੈਕਟ ਟੇਬਲਾਂ ਤੋਂ ਉਤਪੰਨ ਮੈਟ੍ਰਿਕਸ ਅਤੇ ਏਗ੍ਰੀਗੇਸ਼ਨਾਂ ਬਣਾਉਣਾ ਸਿੱਖੋ। ਅਸੀਂ DAU, ਪ੍ਰਤੀ-ਕੋਰਸ ਐਕਟੀਵਿਟੀ, ਪੂਰਤੀ ਦਰਾਂ ਅਤੇ ਕੋਹੌਰਟ ਰੈਵੇਨਿਊ ਗਣਨਾ ਕਰਦੇ ਹਾਂ, ਪੁਨਰੁਤਪਾਦਕ ਪਰਿਭਾਸ਼ਾਵਾਂ ਅਤੇ ਕੁਸ਼ਲ ਮੈਟੀਰੀਅਲਾਈਜ਼ੇਸ਼ਨ ਨਮੂਨਿਆਂ 'ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਾਂ।
Defining DAU and MAU consistentlyActive users per course metricsCompletion rate by segment and countryRevenue by course and cohortMaterializing aggregates in warehousesسبق 4ਧੀਮੇ ਬਦਲਦੀਆਂ ਡਾਈਮੈਂਸ਼ਨਾਂ (SCD ਟਾਈਪ 1/2) ਅਤੇ ਟਾਈਮ-ਟ੍ਰੈਵਲ/ਵਰਜ਼ਨਿੰਗ ਹੈਂਡਲ ਕਰਨਾਧੀਮੇ ਬਦਲਦੀਆਂ ਡਾਈਮੈਂਸ਼ਨਾਂ ਅਤੇ ਟਾਈਮ-ਟ੍ਰੈਵਲ ਨੂੰ ਪ੍ਰਬੰਧਿਤ ਕਰਨਾ ਸਿੱਖੋ। ਅਸੀਂ SCD ਟਾਈਪ 1 ਅਤੇ ਟਾਈਪ 2 ਦੀ ਤੁਲਨਾ ਕਰਦੇ ਹਾਂ, ਪ੍ਰਭਾਵੀ ਤਾਰੀਖ ਰੇਂਜਾਂ ਡਿਜ਼ਾਈਨ ਕਰਦੇ ਹਾਂ, ਵਰਜ਼ਨ ਮੈਟਾਡਾਟਾ ਸਟੋਰ ਕਰਦੇ ਹਾਂ ਅਤੇ ਇਤਿਹਾਸਕ ਡਾਈਮੈਂਸ਼ਨ ਹਾਲਤਾਂ ਨੂੰ ਕੁਏਰੀ ਕਰਨ ਲਈ ਵੇਅਰਹਾਊਸ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਰਤਦੇ ਹਾਂ।
When to use SCD Type 1 vs Type 2Effective dates and current flagsImplementing SCD in SQL and dbtUsing warehouse time-travel featuresTesting historical dimension correctnessسبق 5ਨੇੜੇ-ਰੀਅਲ-ਟਾਈਮ KPIs ਲਈ ਡਾਟਾ ਤਾਜ਼ਗੀ ਅਤੇ ਵਿੰਡੋਇੰਗ ਰਣਨੀਤੀਆਂਨੇੜੇ-ਰੀਅਲ-ਟਾਈਮ KPIs ਲਈ ਤਾਜ਼ਗੀ ਰਣਨੀਤੀਆਂ ਡਿਜ਼ਾਈਨ ਕਰੋ। ਅਸੀਂ ਲੇਟੈਂਸੀ ਬਜਟਸ, ਵਾਟਰਮਾਰਕਿੰਗ, ਸਟ੍ਰੀਮਿੰਗ ਮੈਟ੍ਰਿਕਸ ਲਈ ਵਿੰਡੋਇੰਗ, ਦੇਰ ਨਾਲ ਪਹੁੰਚਣ ਵਾਲੇ ਡਾਟੇ ਹੈਂਡਲਿੰਗ ਅਤੇ ਡੈਸ਼ਬੋਰਡਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗ ਅਤੇ ਕਿਰਿਆਸ਼ੀਲ ਰੱਖਣ ਲਈ ਤਾਜ਼ਗੀ ਨਿਗਰਾਨੀ ਘੇਰਦੇ ਹਾਂ।
Defining freshness and latency targetsWatermarks and late data handlingTumbling, sliding, and session windowsNear-real-time KPI computationMonitoring and alerting on freshnessسبق 6ਡਾਟਾ ਸਫ਼ਾਈ ਕਦਮ: ਪਾਰਸਿੰਗ, ਟਾਈਪ ਕੋਅਰਸ਼ਨ, ਟਾਈਮਸਟੈਂਪ ਨੌਰਮਲਾਈਜ਼ੇਸ਼ਨ, ਡੀਡੁਪਲੀਕੇਸ਼ਨ, ਅਨਰਿਚਮੈਂਟਮਾਡਲਿੰਗ ਤੋਂ ਪਹਿਲਾਂ ਕੱਚੇ ਡਾਟੇ ਨੂੰ ਸਿਸਟਮੈਟਿਕ ਢੰਗ ਨਾਲ ਸਾਫ਼ ਕਰਨਾ ਸਿੱਖੋ। ਅਸੀਂ ਅਰਧ-ਢਾਂਚਾਗਤ ਫੀਲਡਾਂ ਨੂੰ ਪਾਰਸ ਕਰਨਾ, ਡਾਟਾ ਤਰ੍ਹਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨਾ, ਟਾਈਮਜ਼ੋਨਾਂ ਵਿੱਚ ਟਾਈਮਸਟੈਂਪਸ ਨੂੰ ਨੌਰਮਲਾਈਜ਼ ਕਰਨਾ, ਰਿਕਾਰਡਾਂ ਨੂੰ ਡੀਡੁਪਲੀਕੇਟ ਕਰਨਾ ਅਤੇ ਰੈਫਰੈਂਸ ਅਤੇ ਲੁੱਕਅਪ ਡਾਟੇ ਨਾਲ ਡਾਟਾਸੈੱਟਸ ਨੂੰ ਅਨਰਿਚ ਕਰਨਾ ਘੇਰਦੇ ਹਾਂ।
Parsing JSON, CSV, and nested fieldsType coercion and schema validationTimezone normalization and standardsRecord deduplication strategiesReference data joins for enrichmentسبق 7ਡਿਮ_ਕੋਰਸ: ਸਕੀਮਾ ਫੀਲਡ (ਕੋਰਸ_ਆਈਡੀ, ਸਿਰਲੇਖ, ਲੇਖਕ_ਆਈਡੀ, ਸ਼੍ਰੇਣੀ, ਕੀਮਤ, ਪ੍ਰਕਾਸ਼ਿਤ_ਤਾਰੀਖ)ਕੋਰਸ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਸਮਰਥਨ ਕਰਨ ਲਈ ਡਿਮ_ਕੋਰਸ ਡਾਈਮੈਂਸ਼ਨ ਡਿਜ਼ਾਈਨ ਕਰੋ। ਅਸੀਂ ਹਰ ਫੀਲਡ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਾਂ, ਸਰੋਗੇਟ ਕੁੰਜੀਆਂ ਬਾਰੇ ਚਰਚਾ ਕਰਦੇ ਹਾਂ, ਕੀਮਤ ਅਤੇ ਸ਼੍ਰੇਣੀ ਬਦਲਾਅ ਨੂੰ ਹੈਂਡਲ ਕਰਦੇ ਹਾਂ ਅਤੇ ਇਤਿਹਾਸਕ ਅਤੇ ਕੈਟਾਲਾਗ ਰਿਪੋਰਟਿੰਗ ਲਈ ਸਹੀ ਪ੍ਰਕਾਸ਼ਿਤ ਤਾਰੀਖਾਂ ਨੂੰ ਮਾਡਲ ਕਰਦੇ ਹਾਂ।
Business meaning of each dim_course fieldNatural keys vs surrogate course_idHandling course price and category changesModeling published and unpublished statesIndexing dim_course for BI queriesسبق 8ਡਿਮ_ਯੂਜ਼ਰ: ਸਕੀਮਾ ਫੀਲਡ (ਯੂਜ਼ਰ_ਆਈਡੀ, ਈਮੇਲ_ਹੈਸ਼, ਸਾਈਨਅਪ_ਤਾਰੀਖ, ਦੇਸ਼, ਸਬਸਕ੍ਰਿਪਸ਼ਨ_ਹਾਲਤ, ਕੋਹੌਰਟ)ਯੂਜ਼ਰ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਸੈਗਮੈਂਟੇਸ਼ਨ ਲਈ ਡਿਮ_ਯੂਜ਼ਰ ਡਾਈਮੈਂਸ਼ਨ ਡਿਜ਼ਾਈਨ ਕਰੋ। ਅਸੀਂ ਹਰ ਫੀਲਡ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਾਂ, ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟੇ ਨੂੰ ਹੈਸ਼ ਕਰਦੇ ਹਾਂ, ਸਾਈਨਅਪ ਅਤੇ ਕੋਹੌਰਟਸ ਟਰੈਕ ਕਰਦੇ ਹਾਂ ਅਤੇ ਵਿਕਾਸ, ਰਿਟੈਨਸ਼ਨ ਅਤੇ ਮਾਨੀਟਾਈਜ਼ੇਸ਼ਨ ਰਿਪੋਰਟਿੰਗ ਲਈ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਹਾਲਤ ਨੂੰ ਮਾਡਲ ਕਰਦੇ ਹਾਂ।
User identifiers and surrogate keysEmail hashing and privacy controlsModeling signup_date and cohortsSubscription_status lifecycleCountry and localization attributesسبق 9ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨ ਨਮੂਨੇ: ELT ਬਨਾਮ ETL, ਵਧੇਰੇ ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨਾਂ, ਬੈਚ ਬਨਾਮ ਸਟ੍ਰੀਮ ਟ੍ਰਾਂਸਫਾਰਮਸਮੁੱਢਲੇ ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨ ਨਮੂਨੇ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਦਾ ਸਮਾਂ ਸਮਝੋ। ਅਸੀਂ ETL ਅਤੇ ELT ਦੀ ਤੁਲਨਾ ਕਰਦੇ ਹਾਂ, ਵਧੇਰੇ ਪਾਈਪਲਾਈਨਾਂ ਡਿਜ਼ਾਈਨ ਕਰਦੇ ਹਾਂ ਅਤੇ ਬੈਚ ਅਤੇ ਸਟ੍ਰੀਮਿੰਗ ਟ੍ਰਾਂਸਫਾਰਮਸ ਦੀ ਤੁਲਨਾ ਕਰਦੇ ਹਾਂ, ਲਾਗਤ, ਲੇਟੈਂਸੀ, ਨਿਗਰਾਨੀਯੋਗਤਾ ਅਤੇ ਓਪਰੇਸ਼ਨਲ ਟ੍ਰੇਡਆਫਸ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਿਤ ਕਰਦੇ ਹੋਏ।
Comparing ETL and ELT architecturesDesigning incremental transformationsBatch processing pros and consStreaming and micro-batch patternsChoosing patterns by SLA and costسبق 10ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨਾਂ ਲਈ ਟੂਲ: dbt, Spark/Databricks, Beam/Flink, SQL-ਅਧਾਰਤ ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨ ਫ੍ਰੇਮਵਰਕਸਮੁੱਖ ਟ੍ਰਾਂਸਫਾਰਮੇਸ਼ਨ ਟੂਲਾਂ ਦੀ ਸਰਵੇਖਣ ਅਤੇ ਉਹਨਾਂ ਵਿਚਕਾਰ ਚੋਣ ਕਰਨਾ ਸਿੱਖੋ। ਅਸੀਂ dbt, Spark, Databricks, Beam, Flink ਅਤੇ SQL ਫ੍ਰੇਮਵਰਕਸ ਦੀ ਤੁਲਨਾ ਕਰਦੇ ਹਾਂ, ਸਕੇਲੇਬਿਲਟੀ, ਓਰਕੈਸਟ੍ਰੇਸ਼ਨ, ਟੈਸਟਿੰਗ ਅਤੇ ਆਧੁਨਿਕ ਡਾਟਾ ਸਟੈਕਸ ਨਾਲ ਏਕੀਕਰਨ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਿਤ ਕਰਦੇ ਹੋਏ।
dbt for SQL-centric transformationsSpark and Databricks for big dataBeam and Flink for streaming jobsSQL-based transformation frameworksTool selection criteria and trade-offsسبق 11ਫੈਕਟ_ਪੇਮੈਂਟਸ: ਸਕੀਮਾ ਫੀਲਡ (ਪੇਮੈਂਟ_ਆਈਡੀ, ਯੂਜ਼ਰ_ਆਈਡੀ, ਕੋਰਸ_ਆਈਡੀ, ਰਕਮ, ਮੁਦਰਾ, ਭੁਗਤਾਨ_ਤਰੀਕਾ, ਹਾਲਤ, ਟਾਈਮਸਟੈਂਪ, ਇਨਵੌਇਸ_ਆਈਡੀ)ਰੈਵੇਨਿਊ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਫੈਕਟ_ਪੇਮੈਂਟਸ ਟੇਬਲ ਨੂੰ ਮਾਡਲ ਕਰੋ। ਅਸੀਂ ਹਰ ਫੀਲਡ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਾਂ, ਆਈਡੈਂਪੋਟੈਂਟ ਇੰਟੇਕ, ਮੁਦਰਾ ਹੈਂਡਲਿੰਗ, ਭੁਗਤਾਨ ਹਾਲਤ, ਰਿਫੰਡਸ ਬਾਰੇ ਚਰਚਾ ਕਰਦੇ ਹਾਂ ਅਤੇ ਡਾਊਨਸਟ੍ਰੀਮ ਰਿਪੋਰਟਿੰਗ ਲਈ ਭੁਗਤਾਨਾਂ ਨੂੰ ਯੂਜ਼ਰਾਂ, ਕੋਰਸਾਂ ਅਤੇ ਇਨਵੌਇਸਾਂ ਨਾਲ ਜੋੜਦੇ ਹਾਂ।
Grain and primary key of fact_paymentsModeling payment status and lifecycleHandling multi-currency amountsLinking payments to users and coursesCapturing refunds and chargebacks