Μάθημα 1Κλιμάκωση και μετασχηματισμός χαρακτηριστικών: λογαριθμικοί μετασχηματισμοί για στρεβλά έσοδα/ποσότητα, στιβαρή κλιμάκωσηΕφαρμόστε κλιμάκωση και μετασχηματισμούς για σταθεροποίηση διακύμανσης και μείωση στρέβλωσης σε έσοδα και ποσότητα, χρησιμοποιώντας λογαριθμικούς μετασχηματισμούς, στιβαρή κλιμάκωση και μετασχηματισμούς ισχύος διατηρώντας την ερμηνευσιμότητα όπου απαιτείται.
Διάγνωση στρέβλωσης και βαριών ουρώνΛογαριθμικοί και μετασχηματισμοί ισχύοςΚανονική, min-max και στιβαρή κλιμάκωσηΑγωγοί κλιμάκωσης με sklearnΑντίστροφοι μετασχηματισμοί για ερμηνείαΜάθημα 2Μηχανική χαρακτηριστικών ημερομηνίας-ώρας: ημέρα εβδομάδας, ώρα, εποχικότητα, πρόσφατα και παλαιότητα από ημερομηνία παραγγελίας και ιστορικό πελάτηΣχεδιάστε χαρακτηριστικά βασισμένα σε χρόνο από ημερομηνίες παραγγελιών και ιστορικό πελάτη, συμπεριλαμβανομένων ημέρας εβδομάδας, ώρας, εποχικότητας, πρόσφατων και παλαιότητας, σεβόμενοι τη χρονική σειρά για αποφυγή διαρροής σε εργασίες πρόβλεψης και ταξινόμησης.
Εξαγωγή χαρακτηριστικών βασισμένων σε ημερολόγιοΚυκλική κωδικοποίηση χρονικών μεταβλητώνΕποχικότητα και δείκτες αργιώνΣχεδιασμός χαρακτηριστικών πρόσφατων και παλαιότηταςΠρόληψη διαρροής ευαισθητικής στον χρόνοΜάθημα 3Στρατηγικές ενσωμάτωσης για αριθμητικά (διάμεσος, KNN, βασισμένες σε μοντέλο) και κατηγορικά πεδία (τρόπος, 'άγνωστο')Συγκρίνετε στρατηγικές ενσωμάτωσης αριθμητικών και κατηγορικών, συμπεριλαμβανομένων διαμέσου, KNN, βασισμένων σε μοντέλο, τρόπου και ρητών κατηγοριών "άγνωστο", με διαγνώσεις για αξιολόγηση προκατάληψης, διακύμανσης και στιβαρότητας του συμπληρωμένου συνόλου δεδομένων.
Μηχανισμοί και πρότυπα ελλείψεωνΑπλές μέθοδοι ενσωμάτωσης αριθμητικώνΕνσωμάτωση KNN και βασισμένη σε μοντέλοΚατηγορικός τρόπος και κουβάδες "άγνωστο"Χρήση δεικτών ελλείψεωνΜάθημα 4Δημιουργία μεταβλητής στόχου για επιλεγμένη πρόβλεψη (διχοτόμητη επιστροφή, συνεχής έσοδα, ετικέτα καθυστερημένης παράδοσης)Ορίστε και κατασκευάστε μεταβλητές στόχου για βασικές επιχειρηματικές προβλέψεις, συμπεριλαμβανομένων δεικτών διχοτόμητης επιστροφής, συνεχών εσόδων και ετικετών καθυστερημένης παράδοσης, εξασφαλίζοντας σαφείς ορισμούς και ευθυγράμμιση με μετρήματα αξιολόγησης.
Επιλογή στόχου πρόβλεψηςΟρισμός ετικετών επιστροφής και φυγήςΣτόχοι παλινδρόμησης εσόδων και περιθωρίουΕτικέτες καθυστερημένης παράδοσης και παραβίασης SLAΕυθυγράμμιση στόχων με μετρήματαΜάθημα 5Τεχνικές κωδικοποίησης: one-hot, target encoding, frequency encoding, embeddings για χαρακτηριστικά υψηλής καρδιακότηταςΕξερευνήστε μεθόδους κωδικοποίησης για κατηγορικές μεταβλητές, από απλή one-hot σε target, frequency και βασισμένες σε embeddings κωδικοποιήσεις, με καθοδήγηση για πρόληψη διαρροής, τακτοποίηση και χειρισμό χαρακτηριστικών υψηλής καρδιακότητας.
Πότε να χρησιμοποιείτε one-hot κωδικοποίησηTarget encoding με έλεγχο διαρροήςFrequency και count κωδικοποιήσειςHashing και χειρισμός σπάνιων κατηγοριώνΜαθημένες embeddings για κατηγορίεςΜάθημα 6Εντοπισμός και χειρισμός ακραίων τιμών για τιμή, ποσότητα, delivery_time_days και έσοδαΜάθετε να εντοπίζετε, διαγιγνώσκετε και αντιμετωπίζετε ακραίες τιμές σε τιμή, ποσότητα, χρόνο παράδοσης και έσοδα χρησιμοποιώντας στατιστικούς κανόνες και επιχειρηματική λογική, ελαχιστοποιώντας απώλεια πληροφοριών ενώ προστατεύετε τα κάτωρροια μοντέλα από αστάθεια.
Κανόνες εντοπισμού μονοδιάστατων ακραίων τιμώνΠολυδιάστατες και συμφραζόμενες ακραίες τιμέςΠεριορισμός, περικοπή και winsorizationΣημαίες ακραίων τιμών βασισμένες σε επιχειρηματικούς κανόνεςΕπίπτωση ακραίων τιμών στην εκπαίδευση μοντέλουΜάθημα 7Συγκεντρώσεις και χαρακτηριστικά επιπέδου πελάτη: ιστορικό ποσοστό επιστροφών, μέση αξία παραγγελίας, συχνότητα, χρόνος από τελευταία παραγγελίαΔημιουργήστε συγκεντρώσεις επιπέδου πελάτη όπως ιστορικό ποσοστό επιστροφών, μέση αξία παραγγελίας, συχνότητα αγορών και πρόσφατα για να συλλάβετε συμπεριφορά ισόβιας διάρκειας πελάτη και να βελτιώσετε τμηματοποίηση και προγνωστική απόδοση.
Σχεδιασμός συγκέντρωσης επιπέδου πελάτηΙστορικά ποσοστά επιστροφών και καταγγελιώνΜέση αξία παραγγελίας και μέγεθος καλαθιούΣυχνότητα αγορών και πρόσφαταΠρόξενοι ισόβιας αξίας πελάτηΜάθημα 8Χαρακτηριστικά προώθησης και τιμολόγησης: effective_unit_price, discount_pct, discount_applied flagΔημιουργήστε χαρακτηριστικά προώθησης και τιμολόγησης όπως αποτελεσματική τιμή μονάδας, ποσοστό έκπτωσης και σημαίες έκπτωσης για να συλλάβετε ένταση προώθησης, επίπτωση περιθωρίου και ευαισθησία πελάτη σε αλλαγές τιμών με την πάροδο του χρόνου.
Υπολογισμός αποτελεσματικής τιμής μονάδαςΠοσοστό και βάθος έκπτωσηςΔιχοτόμητες και πολυεπίπεδες σημαίες promoΣυσσωρευμένες και επικαλυπτόμενες προωθήσειςΧαρακτηριστικά πρόξενοι ελαστικότητας τιμήςΜάθημα 9Στρατηγικές διαχωρισμού train/test για δεδομένα χρονοσειράς/παραγγελίας (χρονοβασικός διαχωρισμός, στρωματοποιημένος κατά στόχο, αποκλεισμός πελάτη)Σχεδιάστε στρατηγικές διαχωρισμού train και test για χρονοταξινομημένα συναλλακτικά δεδομένα, χρησιμοποιώντας χρονοβασικούς διαχωρισμούς, στρωματοποίηση κατά στόχο και σχήματα αποκλεισμού πελάτη για να λάβετε ρεαλιστικές και αμερόληπτες εκτιμήσεις απόδοσης.
Παγίδες τυχαίων διαχωρισμών σε χρονικά δεδομέναΧρονοβασικοί και κυλιόμενοι διαχωρισμοί παραθύρουΣτρωματοποιημένοι διαχωρισμοί για μη ισορροπημένους στόχουςΑποκλεισμοί επιπέδου πελάτη και καταστήματοςΔιασταυρούμενη επικύρωση για χρονικά δεδομέναΜάθημα 10Γεωγραφικά και λογιστικά χαρακτηριστικά: μετρήματα επιπέδου χώρας, ζώνες αποστολής, τυπική κατανομή delivery_timeΣχεδιάστε γεωγραφικά και λογιστικά χαρακτηριστικά χρησιμοποιώντας μετρήματα επιπέδου χώρας, ζώνες αποστολής και κατανομές χρόνου παράδοσης για να συλλάβετε λειτουργικούς περιορισμούς, περιφερειακή συμπεριφορά και μεταβλητότητα επιπέδου υπηρεσίας σε προγνωστικά μοντέλα.
Συγκεντρώσεις επιπέδου χώρας και περιοχήςΟρισμός ζωνών και διαδρομών αποστολήςΧαρακτηριστικά κατανομής χρόνου παράδοσηςΔείκτες απόστασης και διασυνοριακοίΧαρακτηριστικά επιπέδου υπηρεσίας και SLAΜάθημα 11Τυποποίηση και καθαρισμός κατηγορικών μεταβλητών: product_category, country, marketing_channel, device_typeΤυποποιήστε και καθαρίστε κατηγορικές μεταβλητές όπως κατηγορία προϊόντος, χώρα, κανάλι μάρκετινγκ και τύπο συσκευής, ομαλοποιώντας ετικέτες, συγχωνεύοντας σπάνια επίπεδα και επιβάλλοντας συνεπείς ταξινομήσεις σε σύνολα δεδομένων.
Εντοπισμός ασυνεπών ετικετών κατηγοριώνΟμαλοποίηση συμβολοσειρών και χαρτογράφησηΣυγχώνευση σπάνιων και θορυβωδών κατηγοριώνΔιατήρηση ταξινομήσεων κατηγοριώνΤεκμηρίωση καθαρισμού κατηγορικών