שיעור 1עיצוב טבלאות עסקאות: הזמנות, פריטי_הזמנה, החזרות, סיגנלי_ערך_לכל_החיים ובחירות שדותלמדו כיצד לעצב טבלאות עסקאות מרכזיות שתופסות הזמנות, פריטי שורה, החזרות וסיגנלי ערך לכל החיים. אנו דנים בשדות מפתח, בחירות נורמליזציה וכיצד לתמוך בניתוחים קדימה ועומסי המלצות.
Order header vs line item schema designModeling returns, refunds, and cancellationsCapturing discounts, coupons, and taxesStoring lifetime value and margin signalsKeys, indexes, and partitioning choicesשיעור 2טיפול בנתוני התנהגות רועשים ודלילים: סשניזציה, סינון בוטים, דה-דופליקציה, משקל אירועיםחקרו טכניקות לניקוי יומני התנהגות רועשים ולהפוך נתונים דלילים לשמישים. תלמדו כללי סשניזציה, סינון בוטים ומגרדים, לוגיקת דה-דופליקציה ואסטרטגיות משקל אירועים המותאמות לאימון המלצות.
Sessionization rules and timeoutsDetecting and filtering bots and scrapersClick, view, and purchase deduplicationEvent weighting for model trainingHandling sparse users and cold startsשיעור 3עיצוב טבלת קטלוג מוצרים: product_id, כותרת, היררכיית קטגוריות, מאפיינים, מחיר, מותג, מלאי, תמונות, טקסט_קנוני, embeddingsלמדו כיצד לבנות טבלת קטלוג מוצרים שתומכת בהשגה מהירה והמלצות עשירות. אנו מכסים זיהויים, מאפיינים, תמחור, מלאי, מדיה, טקסט קנוני ואמבדינגים, בתוספת אסטרטגיות לעדכונים ודה-נורמליזציה.
Stable product and variant identifiersCategory hierarchy and attributesPrice, stock, and availability fieldsImages, media, and canonical textStoring and updating item embeddingsשיעור 4עקרונות הנדסת מאפיינים להמלצות: טריות, תדירות, כספי, פופולריות פריט, חיבור קטגוריה, אמבדינגי משתמשיםגלו עקרונות הנדסת מאפיינים מרכזיים למערכות המלצות. אנו מפרטים טריות, תדירות, ערך כספי, פופולריות, חיבור קטגוריה ואמבדינגי משתמשים, כולל חלונות אגרגציה ודפוסי חישוב בטוחי דליפה.
Recency, frequency, and monetary featuresItem and category popularity signalsUser–category and brand affinity scoresSequence‑based and session featuresUser and item embedding generationשיעור 5מערכי נתונים עזר: מטא-נתוני פריטים, טקסונומיה, מבצעים, תוכן (תיאורים), נתוני ספקיםהבינו כיצד מערכי נתונים עזר מעשירים המלצות מעבר לקליקים והזמנות גולמיות. אנו מכסים מטא-נתוני פריטים, טקסונומיה, מבצעים, תוכן וזרמי ספקים, בתוספת שמירה על עקביות, גרסאות וחיבור בקנה מידה.
Designing item metadata schemasMaintaining product taxonomy hierarchiesModeling promotions and price rulesStoring rich content and descriptionsIntegrating supplier and feed dataשיעור 6אסטרטגיות ניקוי נתונים והשלמה: מאפיינים חסרים, חריגויות מחירים, חותמות זמן לא תקינותלמדו שיטות ניקוי נתונים והשלמה מעשיות למסחר אלקטרוני. אנו מטפלים במאפיינים חסרים, מחירים חריגים, חותמות זמן לא תקינות ומטבעות לא עקביים, תוך התמקדות בכללים, עיקרונים והשפעה על איכות המלצות.
Detecting and fixing missing attributesHandling outlier and zero pricesCorrecting invalid or noisy timestampsCurrency, tax, and unit normalizationDocumenting cleaning rules and impactsשיעור 7עיצוב זרם אירועים וטבלת אינטראקציה: event_id, user_id/session_id, סוג_אירוע, product_id, חותמת_זמן, הקשר (מפנה, סוג_דף), מכשיר, ערך_אירועעצבו טבלת אינטראקציה מאוחדת וזרם אירועים שתופס התנהגות משתמשים על פני ערוצים. למדו סכמות אירועים, זיהויים, שדות הקשר וכיצד לתמוך גם בשידור זמן אמת וגם בצנרת המלצות אופליין.
Choosing event and user identifiersModeling event types and propertiesCapturing context, device, and referrerEvent time, ingestion time, and orderingStreaming vs batch storage patternsשיעור 8עיצוב טבלת פרופילי משתמשים: שדות חיוניים (user_id, signup_ts, email_hash, דמוגרפיה, שלב_מחזור_חיים, פלחים, דגלי_הסכמה) והיגיוןעצבו טבלת פרופילי משתמשים שאוזנת כוח התאמה אישית עם פרטיות וציות. אנו מכסים שדות חיוניים, מחזור חיים ופלחים, דגלי הסכמה, האשינג נתונים רגישים וכיצד פרופילים מזינים מודלי המלצות.
Core identifiers and signup metadataDemographics and lifecycle stagesBehavioral and marketing segmentsConsent, opt‑in, and preference flagsPrivacy, hashing, and retention rules