পাঠ 1ফিচার স্কেলিং এবং ট্রান্সফর্মেশন: স্কিউড রাজস্ব/পরিমাণের জন্য লগ ট্রান্সফর্ম, রবাস্ট স্কেলিংভ্যারিয়েন্স স্থিতিশীল করতে এবং রাজস্ব এবং পরিমাণে স্কিউনেস কমাতে স্কেলিং এবং ট্রান্সফর্মেশন প্রয়োগ করুন, লগ ট্রান্সফর্ম, রবাস্ট স্কেলিং এবং পাওয়ার ট্রান্সফর্ম ব্যবহার করে যেখানে প্রয়োজন তখন ব্যাখ্যাযোগ্যতা রক্ষা করুন।
Diagnosing skewness and heavy tailsLog and power transformationsStandard, min-max, and robust scalingScaling pipelines with sklearnInverse transforms for interpretationপাঠ 2ডেটটাইম ফিচার ইঞ্জিনিয়ারিং: সপ্তাহের দিন, ঘণ্টা, সিজনালিটি, অর্ডার_ডেট এবং গ্রাহক ইতিহাস থেকে রিসেন্সি এবং টেনিওর ফিচারঅর্ডার ডেট এবং গ্রাহক ইতিহাস থেকে সময়-ভিত্তিক ফিচার ইঞ্জিনিয়ার করুন, যার মধ্যে সপ্তাহের দিন, ঘণ্টা, সিজনালিটি, রিসেন্সি এবং টেনিওর অন্তর্ভুক্ত, ফরকাস্টিং এবং ক্লাসিফিকেশন টাস্কে লিকেজ এড়াতে টেম্পোরাল অর্ডার মেনে চলুন।
Extracting calendar-based featuresCyclic encoding of time variablesSeasonality and holiday indicatorsRecency and tenure feature designTime-aware leakage preventionপাঠ 3সংখ্যাতাত্ত্বিক (মিডিয়ান, KNN, মডেল-ভিত্তিক) এবং ক্যাটাগরিকাল ফিল্ডের (মোড, 'অজানা') ইমপুটেশন কৌশলমিডিয়ান, KNN, মডেল-ভিত্তিক সহ সংখ্যাতাত্ত্বিক এবং ক্যাটাগরিকাল ইমপুটেশন কৌশল তুলনা করুন, মোড এবং স্পষ্ট "অজানা" ক্যাটাগরি সহ, সম্পূর্ণ ডেটাসেটের বায়াস, ভ্যারিয়েন্স এবং রবাস্টনেস মূল্যায়নের জন্য ডায়াগনস্টিক্স সহ।
Missingness mechanisms and patternsSimple numeric imputation methodsKNN and model-based imputationCategorical mode and "unknown" binsUsing missingness indicator flagsপাঠ 4নির্বাচিত ভবিষ্যদ্বাণীর জন্য টার্গেট ভেরিয়েবল তৈরি (বাইনারি রিটার্নড, কন্টিনিউয়াস রাজস্ব, দেরি ডেলিভারি লেবেল)মূল ব্যবসায়িক ভবিষ্যদ্বাণীর জন্য টার্গেট ভেরিয়েবল নির্ধারণ এবং নির্মাণ করুন, যার মধ্যে বাইনারি রিটার্ন ফ্ল্যাগ, কন্টিনিউয়াস রাজস্ব এবং দেরি ডেলিভারি লেবেল অন্তর্ভুক্ত, স্পষ্ট সংজ্ঞা এবং মূল্যায়ন মেট্রিক্সের সাথে সামঞ্জস্য নিশ্চিত করে।
Choosing the prediction objectiveDefining return and churn labelsRevenue and margin regression targetsLate delivery and SLA breach labelsAligning targets with metricsপাঠ 5এনকোডিং কৌশল: ওয়ান-হট, টার্গেট এনকোডিং, ফ্রিকোয়েন্সি এনকোডিং, উচ্চ-কার্ডিনালিটি ফিচারের জন্য এম্বেডিংক্যাটাগরিকাল ভেরিয়েবলের জন্য এনকোডিং পদ্ধতি এক্সপ্লোর করুন, সরল ওয়ান-হট থেকে টার্গেট, ফ্রিকোয়েন্সি এবং এম্বেডিং-ভিত্তিক এনকোডিংয়ের মধ্যে, লিকেজ প্রতিরোধ, রেগুলারাইজেশন এবং উচ্চ-কার্ডিনালিটি ফিচার হ্যান্ডেলিংয়ের নির্দেশনা সহ।
When to use one-hot encodingTarget encoding with leakage controlFrequency and count encodingsHashing and rare category handlingLearned embeddings for categoriesপাঠ 6মূল্য, পরিমাণ, ডেলিভারি_টাইম_ডেজ এবং রাজস্বের জন্য আউটলায়ার শনাক্তকরণ এবং হ্যান্ডেলিংমূল্য, পরিমাণ, ডেলিভারি_টাইম_ডেজ এবং রাজস্বে পরিসংখ্যানগত নিয়ম এবং ব্যবসায়িক লজিক ব্যবহার করে আউটলায়ার শনাক্তকরণ, ডায়াগনোসিস এবং চিকিত্সা শিখুন, ডাউনস্ট্রিম মডেলগুলোকে অস্থিরতা থেকে রক্ষা করতে তথ্য হারানো কমিয়ে।
Univariate outlier detection rulesMultivariate and contextual outliersCapping, trimming, and winsorizationBusiness-rule based outlier flagsImpact of outliers on model trainingপাঠ 7অ্যাগ্রিগেশন এবং গ্রাহক-লেভেল ফিচার: ঐতিহাসিক রিটার্ন হার, গড় অর্ডার মূল্য, ফ্রিকোয়েন্সি, শেষ অর্ডার থেকে সময়গ্রাহক-লেভেল অ্যাগ্রিগেশন তৈরি করুন যেমন ঐতিহাসিক রিটার্ন হার, গড় অর্ডার মূল্য, ক্রয় ফ্রিকোয়েন্সি এবং শেষ অর্ডার থেকে সময় যাতে গ্রাহক লাইফটাইম আচরণ ক্যাপচার করা যায় এবং সেগমেন্টেশন এবং ভবিষ্যদ্বাণীমূলক পারফরম্যান্স উন্নত করা যায়।
Customer-level aggregation designHistorical return and complaint ratesAverage order value and basket sizePurchase frequency and recencyCustomer lifetime value proxiesপাঠ 8প্রমোশন এবং মূল্য নির্ধারণ ফিচার: ইফেক্টিভ_ইউনিট_প্রাইস, ডিসকাউন্ট_পিসিটি, ডিসকাউন্ট_অ্যাপ্লাইড ফ্ল্যাগপ্রমোশন এবং মূল্য নির্ধারণ ফিচার তৈরি করুন যেমন ইফেক্টিভ ইউনিট প্রাইস, ডিসকাউন্ট পার্সেন্ট, ডিসকাউন্ট অ্যাপ্লাইড ফ্ল্যাগ যাতে প্রমোশনাল ইনটেনসিটি, মার্জিন প্রভাব এবং সময়ের সাথে মূল্য পরিবর্তনের গ্রাহক সংবেদনশীলতা ক্যাপচার করা যায়।
Computing effective unit priceDiscount percentage and depthBinary and multi-level promo flagsStacked and overlapping promotionsPrice elasticity proxy featuresপাঠ 9টাইম-সিরিজ/অর্ডার ডেটার জন্য ট্রেন/টেস্ট স্প্লিট কৌশল (টাইম-ভিত্তিক স্প্লিট, টার্গেট অনুযায়ী স্ট্র্যাটিফাইড, গ্রাহক হোল্ডআউট)সময়-অর্ডার্ড ট্রানজ্যাকশনাল ডেটার জন্য ট্রেন/টেস্ট স্প্লিট কৌশল ডিজাইন করুন, টাইম-ভিত্তিক স্প্লিট, টার্গেট অনুযায়ী স্ট্র্যাটিফিকেশন এবং গ্রাহক হোল্ডআউট স্কিম ব্যবহার করে বাস্তবসম্মত এবং অবায়াসযুক্ত পারফরম্যান্স অনুমান পান।
Pitfalls of random splits in time dataTime-based and rolling window splitsStratified splits for imbalanced targetsCustomer and store level holdoutsCross-validation for temporal dataপাঠ 10ভৌগোলিক এবং লজিস্টিক্স ফিচার: দেশ-লেভেল মেট্রিক্স, শিপিং জোন, টিপিকাল ডেলিভারি_টাইম ডিস্ট্রিবিউশনদেশ-লেভেল মেট্রিক্স, শিপিং জোন এবং ডেলিভারি টাইম ডিস্ট্রিবিউশন ব্যবহার করে ভৌগোলিক এবং লজিস্টিক্স ফিচার ডিজাইন করুন যাতে অপারেশনাল সীমাবদ্ধতা, আঞ্চলিক আচরণ এবং ভবিষ্যদ্বাণীমূলক মডেলে সার্ভিস-লেভেল ভ্যারিয়েবিলিটি ক্যাপচার করা যায়।
Country and region level aggregationsDefining shipping zones and lanesDelivery time distribution featuresDistance and cross-border indicatorsService level and SLA featuresপাঠ 11ক্যাটাগরিকাল ভেরিয়েবল স্ট্যান্ডার্ডাইজ এবং ক্লিনিং: প্রোডাক্ট_ক্যাটাগরি, দেশ, মার্কেটিং_চ্যানেল, ডিভাইস_টাইপপ্রোডাক্ট_ক্যাটাগরি, দেশ, মার্কেটিং_চ্যানেল, ডিভাইস_টাইপের মতো ক্যাটাগরিকাল ভেরিয়েবল স্ট্যান্ডার্ডাইজ এবং ক্লিন করুন লেবেল নরমালাইজ করে, রেয়ার লেভেল মার্জ করে এবং ডেটাসেট জুড়ে সামঞ্জস্যপূর্ণ ট্যাক্সোনমি জোর করে।
Detecting inconsistent category labelsString normalization and mappingMerging rare and noisy categoriesMaintaining category taxonomiesDocumenting categorical cleaning