Somo la 1Upimaji na mabadiliko ya sifa: mabadiliko ya log kwa mapato/kiwango kilichopindika, upimaji thabitiTumia upimaji na mabadiliko ili kuthabiti tofauti na kupunguza kupindika katika mapato na kiwango, ukitumia mabadiliko ya log, upimaji thabiti, na mabadiliko ya nguvu huku ukidumisha uelewa mahali inahitajika.
Kutambua kupindika na mikia nzitoMabadiliko ya log na nguvuKawaida, min-max, na upimaji thabitiMifereji ya upimaji na sklearnMabadiliko ya kinyume kwa uelewaSomo la 2Uhandisi wa sifa za Datetime: siku ya wiki, saa, msimu, sifa za hivi karibuni na muda kutoka tarehe_ya_agizo na historia ya mtejaHandisi sifa zinazotegemea wakati kutoka tarehe za agizo na historia ya mteja, ikijumuisha siku ya wiki, saa, msimu, hivi karibuni, na muda, huku ukizingatia mpangilio wa wakati ili kuepuka uvujaji katika kazi za utabiri na uainishaji.
Kutoa sifa zinazotegemea kalendaMsimbo wa mzunguko wa anuwai za wakatiMsimu na viashiria vya likizoUundaji sifa za hivi karibuni na mudaKuzuia uvujaji unaofahamu wakatiSomo la 3Mkakati wa imputation kwa nambari (median, KNN, inayotegemea modeli) na nyanja za jamii (mode, 'isiyojulikana')Linganisha mkakati wa imputation ya nambari na jamii, ikijumuisha median, KNN, inayotegemea modeli, mode, na jamii za "isiyojulikana" wazi, na uchunguzi ili kutathmini upendeleo, tofauti, na thabiti ya seti iliyokamilishwa.
Mifumo na mifumo ya kukosekanaMbinu rahisi za imputation ya nambariImputation ya KNN na inayotegemea modeliMode ya jamii na vibanda vya "isiyojulikana"Kutumia alama za kiashiria cha kukosekanaSomo la 4Kuunda kigeuza lengo kwa utabiri uliochaguliwa (ilidorudiwa kibinadi, mapato ya kuendelea, lebo ya utoaji wa marehemu)Fafanua na jenga kigeuza malengo kwa utabiri muhimu wa biashara, ikijumuisha alama za kibinadi za kurudisha, mapato ya kuendelea, na lebo za utoaji wa marehemu, kuhakikisha ufafanuzi wazi na usawaziko na vipimo vya tathmini.
Kuchagua lengo la utabiriKufafanua lebo za kurudisha na churnMalengo ya uingiliaji wa mapato na kimaelezoLebo za utoaji wa marehemu na uvunjaji SLAKusawazisha malengo na vipimoSomo la 5Mbinu za kuweka alama: one-hot, target encoding, frequency encoding, embeddings kwa sifa za kiwango cha juuChunguza mbinu za kuweka alama kwa anuwai za jamii, kutoka one-hot rahisi hadi target, frequency, na encodings zinazotegemea embedding, na mwongozo wa kuzuia uvujaji, regularization, na kushughulikia sifa za kiwango cha juu.
Lini ya kutumia one-hot encodingTarget encoding na udhibiti wa uvujajiFrequency na encodings za hesabuHashing na kushughulikia jamii adimuEmbeddings zilizojifunza kwa jamiiSomo la 6Kutambua na kushughulikia nje kwa bei, kiwango, siku_za_wakati_utoaji, na mapatoJifunze kutambua, kutambua, na kutibu nje katika bei, kiwango, wakati wa utoaji, na mapato ukitumia sheria za takwimu na mantiki ya biashara, ukipunguza hasara ya taarifa huku ukilinda modeli za chini kutokana na kutokuwa thabiti.
Sheria za kutambua nje za univariateNje za multivariate na muktadhaKufunika, kupunguza, na winsorizationAlama za nje zinazotegemea sheria za biasharaAthari za nje kwenye mafunzo ya modeliSomo la 7Muunganisho na sifa za kiwango cha mteja: kiwango cha kurudisha cha kihistoria, thamani ya wastani ya agizo, mara kwa mara, wakati tangu agizo la mwishoJenga muunganisho wa kiwango cha mteja kama kiwango cha kurudisha cha kihistoria, thamani ya wastani ya agizo, mara kwa mara ya kununua, na hivi karibuni ili kukamata tabia ya maisha ya mteja na kuboresha mgawanyo na utendaji wa utabiri.
Uundaji wa muunganisho wa kiwango cha mtejaKiwango cha kurudisha na malalamiko ya kihistoriaThamani ya wastani ya agizo na ukubwa wa kikapuMara kwa mara ya kununua na hivi karibuniWakala wa thamani ya maisha ya mtejaSomo la 8Sifa za ofa na bei: bei_yenye_mbinu, pct_ya_dhamana, alama ya dhamana_imepitishwaUnda sifa za ofa na bei kama bei ya mbinu ya kitengo, asilimia ya dhamana, na alama za dhamana ili kukamata nguvu ya ofa, athari ya kimaelezo, na unyeti wa mteja kwa mabadiliko ya bei kwa wakati.
Kuhesabu bei ya mbinu ya kitengoAsilimia na kina cha dhamanaAlama za promo za kibinadi na ngazi nyingiOFA zilizopangwa na zinazopishanaSifa za wakala wa elasticity ya beiSomo la 9Mkakati wa kugawanya mafunzo/jaribio kwa data ya mfululizo/agizo (kugawanya kwa wakati, stratified kwa lengo, mteja holdout)Buni mkakati wa kugawanya mafunzo na jaribio kwa data ya shughuli iliyopangwa kwa wakati, ukitumia kugawanya kwa wakati, stratification kwa lengo, na mipango ya holdout ya mteja ili kupata makadirio ya utendaji halisi na yasiyo na upendeleo.
Makosa ya kugawanya nasibu katika data ya wakatiKugawanya kwa wakati na dirisha linalorukaKugawanya stratified kwa malengo yasiyolinganaHoldouts za kiwango cha mteja na dukaCross-validation kwa data ya wakatiSomo la 10Sifa za kijiografia na logistics: vipimo vya kiwango cha nchi, maeneo ya usafirishaji, usambazaji wa kawaida wa wakati wa utoajiBuni sifa za kijiografia na logistics ukitumia vipimo vya kiwango cha nchi, maeneo ya usafirishaji, na usambazaji wa wakati wa utoaji ili kukamata vikwazo vya kiutendaji, tabia ya kikanda, na tofauti ya kiwango cha huduma katika modeli za utabiri.
Muunganisho za kiwango cha nchi na kikandaKufafanua maeneo na njia za usafirishajiSifa za usambazaji wa wakati wa utoajiUmbo na viashiria vya kuvuka mipakaSifa za kiwango cha huduma na SLASomo la 11Kurekebisha na kusafisha anuwai za jamii: jamii_ya_bidhaa, nchi, kituo_cha_masoko, aina_ya_vifaaRekebisha na safisha anuwai za jamii kama jamii ya bidhaa, nchi, kituo cha masoko, na aina ya kifaa kwa kurekebisha lebo, kuunganisha viwango adimu, na kulazimisha taksonomia thabiti kwenye seti za data.
Kutambua lebo za jamii zisizolinganaKurekebisha na kupanga kambaKuunganisha jamii adimu na zenye keleleKudumisha taksonomia za jamiiKuandika kusafisha jamii