שיעור 1כללי אימות נתונים: כפילויות, שלמות התייחסות (לקוחות/מוצרים), ערכים מחוץ לטווח, מחירים/כמויות שלילייםהגדרת כללי אימות חזקים כדי לשמור על אמינות קבצי CSV של מכירות. תזהו כפילויות, תאכפו שלמות התייחסות, ותסמנו ערכים מחוץ לטווח או שליליים לפני שהם משחיתים לוחות מחוונים ומודלים מורכבים.
Detecting duplicate orders and order linesChecking referential integrity keysValidating numeric ranges and thresholdsHandling negative prices and quantitiesBuilding reusable validation checklistsשיעור 2הבנת סמנטיקת עמודות: order_id, order_date, customer_id, customer_region, product_id, product_category, product_subcategory, quantity, unit_price, discount, revenue, cost, channelהבהרת המשמעות והתפקיד של עמודות מכירות מרכזיות המשמשות בלוחות מחוונים. תמיפו מזהים, תאריכים, מאפייני מוצרים, כמויות ושדות כספיים, ותבטיחו סמנטיקה עקבית על פני מודלים וויזואליזציות.
Order-level identifiers and grain selectionCustomer and region identification fieldsProduct, category, and subcategory rolesQuantity, unit_price, discount, and revenueCost, channel, and margin-related fieldsשיעור 3טיפול בהנחות וחישובי מחירים: חישוב מחדש של הכנסה ממחיר יחידה, כמות והנחה והתאמה עם הכנסה מדווחתהבנת כיצד לחשב מחדש ולוודא מדדי הכנסה ומחירים. תחשבו הכנסת שורה ממחיר יחידה, כמות והנחה, תתאמו עם סכומים מדווחים, ותסמנו אי התאמות לבדיקה.
Revenue formulas from unit_price and quantityApplying percentage and absolute discountsReconciling computed and reported revenueDetecting inconsistent discount patternsDocumenting pricing and discount logicשיעור 4טרנספורמציות מבוססות זמן: הפקת שנה, רבעון, חודש, שבוע, יום בשבוע, חלונות גלגלים, ולוחות שנה פיסקלייםהבנת כיצד להפוך תאריכי הזמנה למאפייני זמן עשירים לניתוח. תפיקו מאפייני לוח שנה ופיסקלי, תבנו חלונות גלגלים, ותכינו שדות זמן עקביים ללוחות מחוונים ומודלי סדרות זמן.
Extracting year, quarter, month, and weekDeriving weekday and weekend indicatorsBuilding rolling and moving window metricsImplementing fiscal calendars and offsetsAligning time grains for dashboardsשיעור 5טרנספורמציות ניקוי נתונים: קיצוץ, נרמול רישיות, סטנדרטיזציה של תוויות אזורים וערוציםחקירת צעדי ניקוי מעשיים כדי להפוך קבצי CSV גולמיים של מכירות לעקביים ומוכנים לניתוח. תקצצו רווחים, תנרמלו רישיות, ותסטנדרטו תוויות אזורים וערוצים כדי למנוע כפילויות ומסננים שבורים בלוחות מחוונים.
Trimming whitespace and invisible charactersCase normalization for text dimensionsStandardizing region and channel taxonomiesMerging near-duplicate label variantsDocumenting cleaning rules for reuseשיעור 6מדדים נגזרים וטרנספורמציות: רווח = הכנסה - עלות, מרווח רווח = רווח / הכנסה, מרווח גולמי, AOV = הכנסה / מספר הזמנות, סהכ יחידה = כמות * מחיר יחידהלימוד חישוב מדדי מכירות מרכזיים משדות CSV גולמיים. תחשבו רווח, מרווחים, AOV, וסכומי יחידות, ותבטיחו נוסחאות עקביות, מתועדות היטב ומתואמות להגדרות עסקיות.
Computing profit and gross marginCalculating profit_margin safelyDeriving AOV from revenue and ordersUnit totals from quantity and unit_priceAligning metrics with business definitionsשיעור 7טכניקות ל-ETL ניתן לשחזור: צעדים מתועדים, סקריפטים, מחברות, ו-checksums לשלמות ייבוא CSVלימוד עיצוב צינורות ETL ניתנים לשחזור לקבצי CSV של מכירות. תכתבו טרנספורמציות, תעקבו אחר גרסאות, תשתמשו במחברות לחקירה, ותיישמו checksums וצעדי אימות כדי להבטיח שלמות ייבוא לאורך זמן.
Scripting repeatable CSV transformationsUsing notebooks for exploratory ETLVersioning ETL code and configurationChecksums and file integrity validationAutomated ETL runs and loggingשיעור 8ערכים חסרים ודפוסי null: שיטות זיהוי, אסטרטגיות השלמה, ומתי למחוק שורותשליטה בטכניקות לזיהוי וטיפול בערכים חסרים או null בקבצי CSV של מכירות. תנתחו דפוסי null, תבחרו אסטרטגיות השלמה, תחליטו מתי למחוק שורות, ותתעדו הנחות כדי להגן על מדדים מורכבים.
Profiling missingness across key columnsVisualizing null patterns and correlationsImputation strategies for numeric fieldsImputation strategies for categorical fieldsRules for safely dropping rows or columnsשיעור 9סוגי נתונים ופרסינג: פורמטי תאריכים, סוגי מספרים, קידוד קטגוריאלי, טיפול בשדות טקסט מול ספרתייםלימוד ניתוח נכון של תאריכים, מספרים וקטגוריות בקבצי CSV של מכירות. תבדילו בין טקסט לשדות ספרתיים, תיישמו ניתוח מודע לשפה מקומית, ותעצבו קידודים קטגוריאליים חזקים שנותרים יציבים על פני רענונים.
Detecting column data types in CSV importsParsing dates with multiple locale formatsHandling numeric separators and currency symbolsDesigning stable categorical encodingsConverting mixed-type columns safelyשיעור 10טיפול בהזמנות רב-שורתיות ואגרגציה ברמת הזמנה מול שורת הזמנהלימוד טיפול בהזמנות רב-שורתיות בקבצי CSV של מכירות. תבדילו בין גרן הזמנה לשורת הזמנה, תאגדו נכון, ותמנעו ספירה כפולה של הכנסה, כמות והנחות בלוחות מחוונים.
Identifying order vs order-line grainAggregating revenue at order levelSummarizing discounts across linesAvoiding double counting in rollupsChoosing grain for dashboard metrics