Somo 1Ugunduzi na matibabu ya vichukuzi kwa total_sessions na total_spentGundua na tibu vichukuzi katika total_sessions na total_spent kwa kutumia picha, takwimu thabiti, na mbinu zinazotegemea modeli, uamue wakati wa kufunga, kubadilisha, au kuweka vipekee kulingana na ishara ya kutoroka na athari ya biashara.
Uchambuzi wa mikia ya vikao na matumiziZ-nambari na z-nambari thabitiIQR na kufunga kulingana na asilimiaKubadilisha dhidi ya kupunguza vichukuziAthari kwa uthabiti wa modeli ya kutorokaSomo 2Ujenzi wa mifereji na uwezekano wa kurudiwa: mifereji ya sklearn, vibadilisha vya safu, toleo la seti za dataJenga uchanganuzi wa awali unaoweza kurudiwa kwa mifereji ya sklearn Pipelines na ColumnTransformers, simamia matawi ya vipengele, fuatilia toleo la seti za data, na uhakikishe mabadiliko thabiti kati ya mazingira ya mafunzo na uzalishaji.
Msingi wa mifereji ya sklearnKutumia ColumnTransformer kwa ufanisiVibadilisha vya kibinafsi kwa data ya kutorokaKuhifadhi na kupakia miferejiToleo la seti za data na vipengeleSomo 3Mikakati ya kujaza kwa uwanja wa nambari na jamii; mbinu zinazofaa kwa aina ya kukosekanaElewa taratibu za kukosekana, uchambuzi wa pengo la nambari na jamii, na tumia wastani, katikati, hali, MICE, na kujaza kinachotegemea modeli huku ukidumisha usambazaji na kuepuka uvujaji wa lengo katika seti za data za kutoroka.
Aina za kukosekana: MCAR, MAR, MNARMbinu rahisi za kujaza nambariMikakati ya kujaza jamiiKujaza kwa kiwango cha juu na kinachotegemea modeliKujaza na wasiwasi wa uvujajiSomo 4Mbinu za upunguzaji na usawazishaji: usawazishaji, upunguzaji thabiti, mabadiliko ya log kwa matumizi yaliyoelekezwaLinganisha usawazishaji, min-max, na upunguzaji thabiti, tumia mabadiliko ya log na Box-Cox kwa matumizi yaliyoelekezwa, na elewa jinsi upunguzaji unavyoingiliana na modeli za umbali, za mstari, na za mti za kutoroka.
Wakati upunguzaji ni muhimuStandardScaler dhidi ya MinMaxScalerUpunguzaji thabiti kwa mikia mirefuMabadiliko ya log kwa matumizi yaliyoelekezwaAthari za upunguzaji kwa algoritiSomo 5Kusimbua anuwai za jamii: moja-joto, kusimbua lengo, kusimbua ordinal na wakati wa kutumia kila mojaChunguza wakati wa kutumia moja-joto, ordinal, na kusimbua lengo, shughulikia vipengele vya kiwango cha juu, epuka uvujaji wa lengo katika kusimbua lengo, na tathmini athari ya kusimbua kwa modeli za mstari na za mti za kutoroka.
Kusimbua moja-joto na upungufuKusimbua ordinal kwa viwango vilivyopangwaKusimbua lengo na kunyonyaKushughulikia vipengele vya kiwango cha juuChaguzi za kusimbua kwa aina ya modeliSomo 6Hatari za uvujaji wa data: uvujaji wa muda, kutumia taarifa za baadaye, mgawanyo sahihi wa mafunzo-mtihaniTambua na uzuie uvujaji wa data kutoka kwa mpangilio wa muda, taarifa za baadaye, na vipengele vinavyotokana na lengo, unda mgawanyo sahihi wa mafunzo-mtihani, na thibitisha mifereji ili kuweka makadirio ya utendaji wa kutoroka yaaminifu.
Mifumo ya kawaida ya uvujaji katika kutorokaMpangilio wa muda na tarehe za kukataUundaji wa vipengele bila malengoMikakati salama ya kuthibitisha msalabaKukagua mifereji kwa uvujajiSomo 7Mabadiliko ya tarehe/muda: kuchukua muda, hivi karibuni, mzunguko, vipengele vya msimuHandisi vipengele vya tarehe na muda kama muda, hivi karibuni, mzunguko, na msimu, shughulikia maeneo ya muda na shughuli zisizo za kawaida, na andaa vipengele vya muda vinavyoshika mienendo ya hatari ya kutoroka kwa muda.
Kuchanganua na kusafisha alama za mudaVipengele vya muda na umri wa mtejaVipimo vya hivi karibuni na mzungukoMsimu na athari za kalendaMadirisha ya muda na muunganishoSomo 8Kushughulikia ukosefu wa usawa wa jamii kwa kutoroka: kupunguza sampuli, kuongeza sampuli, SMOTE, uzito wa jamiiJifunze jinsi ya kutambua ukosefu wa usawa wa jamii ya kutoroka, linganisha kupunguza sampuli, kuongeza sampuli, SMOTE, na uzito wa jamii, na tathmini athari zao kwa vipimo, uthabiti wa modeli, na tafsiri ya biashara katika modeli za kutoroka za uzalishaji.
Kupima ukosefu wa usawa wa jamii ya kutorokaKupunguza na kuongeza sampuli bila mpangilioSMOTE na anuwai za SMOTEKutumia uzito wa jamii katika modeliKutathmini mikakati ya ukosefu wa usawaSomo 9Uhandisi wa vipengele vya kitabia: mzunguko wa kikao, matumizi ya wastani kwa kikao, viwakilishi vya kotorokaBuni vipengele vya kitabia kutoka kwa vikao na matumizi, kama mzunguko, nguvu, na tetezi, jenga lebo za viwakilishi vya kotoroka, na geuza kumbukumbu mbichi kuwa vitabiri thabiti, vinavyoweza kufasiriwa kwa modeli za kotoroka.
Mzunguko na nguvu ya kikaoVipimo vya wastani na katikati ya matumiziVipengele vya tetezi na mwenendoIshara za ushirikiano na kutokuwa na shughuliKujenga lebo za viwakilishi vya kotorokaSomo 10Uchaguzi wa vipengele na kupunguza vipimo: angalia uhusiano, taarifa ya pamoja, msingi wa PCATumia angalia uhusiano, taarifa ya pamoja, na umuhimu unaotegemea modeli kuchagua vipengele, anza PCA kwa kupunguza vipimo, na usawazishe ufafanuzi na utendaji katika utabiri wa kotoroka.
Mbinu za kuchuja za kibinafsiAngalia uhusiano na upungufuTaarifa ya pamoja kwa kotorokaMbinu za kukunjwa na zilizochomekwaMsingi wa PCA na tafsiri