পাঠ 1ফিচার স্কেলিং এবং ট্রান্সফরমেশন: স্কিউড আয়/পরিমাণের জন্য লগ ট্রান্সফর্ম, রোবাস্ট স্কেলিংভ্যারিয়েন্স স্থিতিশীল করতে এবং আয় এবং পরিমাণে স্কিউনেস কমাতে স্কেলিং এবং ট্রান্সফরমেশন প্রয়োগ করুন, লগ ট্রান্সফর্ম, রোবাস্ট স্কেলিং এবং পাওয়ার ট্রান্সফর্ম ব্যবহার করে প্রয়োজনে ইন্টারপ্রিটেবিলিটি সংরক্ষণ করুন।
স্কিউনেস এবং হেভি টেইল ডায়াগনোসিসলগ এবং পাওয়ার ট্রান্সফরমেশনস্ট্যান্ডার্ড, মিন-ম্যাক্স এবং রোবাস্ট স্কেলিংsklearn দিয়ে স্কেলিং পাইপলাইনইন্টারপ্রিটেশনের জন্য ইনভার্স ট্রান্সফর্মপাঠ 2ডেটটাইম ফিচার ইঞ্জিনিয়ারিং: সপ্তাহের দিন, ঘণ্টা, সিজনালিটি, অর্ডার_ডেট এবং গ্রাহক ইতিহাস থেকে রিসেন্সি এবং টেনিওর ফিচারঅর্ডার ডেট এবং গ্রাহক ইতিহাস থেকে টাইম-ভিত্তিক ফিচার ইঞ্জিনিয়ার করুন, যার মধ্যে সপ্তাহের দিন, ঘণ্টা, সিজনালিটি, রিসেন্সি এবং টেনিওর অন্তর্ভুক্ত, ফরকাস্টিং এবং ক্লাসিফিকেশন টাস্কে লিকেজ এড়াতে টেম্পোরাল অর্ডার মেনে চলুন।
ক্যালেন্ডার-ভিত্তিক ফিচার এক্সট্রাক্টটাইম ভ্যারিয়েবলের সাইক্লিক এনকোডিংসিজনালিটি এবং ছুটির ইন্ডিকেটররিসেন্সি এবং টেনিওর ফিচার ডিজাইনটাইম-অ্যাওয়ার লিকেজ প্রিভেনশনপাঠ 3নিউমেরিক (মিডিয়ান, KNN, মডেল-ভিত্তিক) এবং ক্যাটাগরিক্যাল ফিল্ডের (মোড, 'অজানা') জন্য ইমপুটেশন কৌশলমিডিয়ান, KNN, মডেল-ভিত্তিক, মোড এবং স্পষ্ট 'অজানা' ক্যাটাগরি সহ নিউমেরিক এবং ক্যাটাগরিক্যাল ইমপুটেশন কৌশল তুলনা করুন, সম্পূর্ণ ডেটাসেটের বায়াস, ভ্যারিয়েন্স এবং রোবাস্টনেস মূল্যায়নের জন্য ডায়াগনস্টিক্স সহ।
মিসিংনেস মেকানিজম এবং প্যাটার্নসিম্পল নিউমেরিক ইমপুটেশন পদ্ধতিKNN এবং মডেল-ভিত্তিক ইমপুটেশনক্যাটাগরিক্যাল মোড এবং 'অজানা' বিনমিসিংনেস ইন্ডিকেটর ফ্ল্যাগ ব্যবহারপাঠ 4নির্বাচিত প্রেডিকশনের জন্য টার্গেট ভ্যারিয়েবল তৈরি (বাইনারি রিটার্নড, কন্টিনিউয়াস আয়, লেট ডেলিভারি লেবেল)মূল বিজনেস প্রেডিকশনের জন্য টার্গেট ভ্যারিয়েবল নির্ধারণ এবং নির্মাণ করুন, যার মধ্যে বাইনারি রিটার্ন ফ্ল্যাগ, কন্টিনিউয়াস আয় এবং লেট ডেলিভারি লেবেল অন্তর্ভুক্ত, স্পষ্ট সংজ্ঞা এবং ইভালুয়েশন মেট্রিক্সের সাথে সামঞ্জস্য নিশ্চিত করে।
প্রেডিকশন উদ্দেশ্য নির্বাচনরিটার্ন এবং চার্ন লেবেল নির্ধারণআয় এবং মার্জিন রিগ্রেশন টার্গেটলেট ডেলিভারি এবং SLA ব্রিচ লেবেলমেট্রিক্সের সাথে টার্গেট সামঞ্জস্যপাঠ 5এনকোডিং কৌশল: ওয়ান-হট, টার্গেট এনকোডিং, ফ্রিকোয়েন্সি এনকোডিং, হাই-কার্ডিনালিটি ফিচারের জন্য এমবেডিংক্যাটাগরিক্যাল ভ্যারিয়েবলের জন্য এনকোডিং পদ্ধতি এক্সপ্লোর করুন, সিম্পল ওয়ান-হট থেকে টার্গেট, ফ্রিকোয়েন্সি এবং এমবেডিং-ভিত্তিক এনকোডিং পর্যন্ত, লিকেজ প্রিভেনশন, রেগুলারাইজেশন এবং হাই-কার্ডিনালিটি ফিচার হ্যান্ডলিংয়ের গাইডলাইন সহ।
ওয়ান-হট এনকোডিং কখন ব্যবহার করবেনলিকেজ কন্ট্রোল সহ টার্গেট এনকোডিংফ্রিকোয়েন্সি এবং কাউন্ট এনকোডিংহ্যাশিং এবং রেয়ার ক্যাটাগরি হ্যান্ডলিংক্যাটাগরির জন্য লার্নড এমবেডিংপাঠ 6প্রাইস, কোয়ান্টিটি, ডেলিভারি_টাইম_ডেজ এবং আয়ের জন্য আউটলায়ার ডিটেকশন এবং হ্যান্ডলিংপ্রাইস, কোয়ান্টিটি, ডেলিভারি টাইম এবং আয়ে আউটলায়ার শনাক্ত, ডায়াগনোস এবং ট্রিট করা শিখুন স্ট্যাটিস্টিক্যাল রুল এবং বিজনেস লজিক ব্যবহার করে, ডাউনস্ট্রিম মডেলকে অস্থিরতা থেকে রক্ষা করতে তথ্য হারানো কমিয়ে।
ইউনিভ্যারিয়েট আউটলায়ার ডিটেকশন রুলমাল্টিভ্যারিয়েট এবং কনটেক্সচুয়াল আউটলায়ারক্যাপিং, ট্রিমিং এবং উইনসোরাইজেশনবিজনেস-রুল ভিত্তিক আউটলায়ার ফ্ল্যাগমডেল ট্রেনিংয়ে আউটলায়ারের প্রভাবপাঠ 7অ্যাগ্রিগেশন এবং গ্রাহক-লেভেল ফিচার: ঐতিহাসিক রিটার্ন হার, গড় অর্ডার ভ্যালু, ফ্রিকোয়েন্সি, শেষ অর্ডার থেকে সময়গ্রাহক-লেভেল অ্যাগ্রিগেশন তৈরি করুন যেমন ঐতিহাসিক রিটার্ন হার, গড় অর্ডার ভ্যালু, ক্রয় ফ্রিকোয়েন্সি এবং রিসেন্সি যাতে গ্রাহক লাইফটাইম আচরণ ধরা পড়ে এবং সেগমেন্টেশন এবং প্রেডিকটিভ পারফরম্যান্স উন্নত হয়।
গ্রাহক-লেভেল অ্যাগ্রিগেশন ডিজাইনঐতিহাসিক রিটার্ন এবং অভিযোগ হারগড় অর্ডার ভ্যালু এবং বাস্কেট সাইজক্রয় ফ্রিকোয়েন্সি এবং রিসেন্সিগ্রাহক লাইফটাইম ভ্যালু প্রক্সিপাঠ 8প্রমোশন এবং প্রাইসিং ফিচার: ইফেক্টিভ_ইউনিট_প্রাইস, ডিসকাউন্ট_পার্সেন্ট, ডিসকাউন্ট_অ্যাপ্লাইড ফ্ল্যাগপ্রমোশনাল ইনটেনসিটি, মার্জিন প্রভাব এবং সময়ের সাথে প্রাইস পরিবর্তনের প্রতি গ্রাহক সেনসিটিভিটি ধরতে ইফেক্টিভ ইউনিট প্রাইস, ডিসকাউন্ট শতাংশ এবং ডিসকাউন্ট ফ্ল্যাগ সহ প্রমোশন এবং প্রাইসিং ফিচার তৈরি করুন।
ইফেক্টিভ ইউনিট প্রাইস কম্পিউটডিসকাউন্ট শতাংশ এবং গভীরতাবাইনারি এবং মাল্টি-লেভেল প্রমো ফ্ল্যাগস্ট্যাকড এবং ওভারল্যাপিং প্রমোশনপ্রাইস ইলাস্টিসিটি প্রক্সি ফিচারপাঠ 9টাইম-সিরিজ/অর্ডার ডেটার জন্য ট্রেন/টেস্ট স্প্লিট কৌশল (টাইম-ভিত্তিক স্প্লিট, টার্গেট অনুযায়ী স্ট্র্যাটিফাইড, গ্রাহক হোল্ডআউট)টাইম-অর্ডার্ড ট্রানজ্যাকশনাল ডেটার জন্য ট্রেন এবং টেস্ট স্প্লিট কৌশল ডিজাইন করুন, টাইম-ভিত্তিক স্প্লিট, টার্গেট অনুযায়ী স্ট্র্যাটিফিকেশন এবং গ্রাহক হোল্ডআউট স্কিম ব্যবহার করে বাস্তবসম্মত এবং নিরপেক্ষ পারফরম্যান্স অনুমান পান।
টাইম ডেটায় র্যান্ডম স্প্লিটের ফাঁদটাইম-ভিত্তিক এবং রোলিং উইন্ডো স্প্লিটইমব্যালান্সড টার্গেটের জন্য স্ট্র্যাটিফাইড স্প্লিটগ্রাহক এবং স্টোর লেভেল হোল্ডআউটটেম্পোরাল ডেটার জন্য ক্রস-ভ্যালিডেশনপাঠ 10ভৌগোলিক এবং লজিস্টিক্স ফিচার: দেশ-লেভেল মেট্রিক্স, শিপিং জোন, টিপিক্যাল ডেলিভারি_টাইম ডিস্ট্রিবিউশনকান্ট্রি-লেভেল মেট্রিক্স, শিপিং জোন এবং ডেলিভারি টাইম ডিস্ট্রিবিউশন ব্যবহার করে ভৌগোলিক এবং লজিস্টিক্স ফিচার ডিজাইন করুন যাতে প্রেডিকটিভ মডেলে অপারেশনাল কনস্ট্রেইন্ট, আঞ্চলিক আচরণ এবং সার্ভিস-লেভেল ভ্যারিয়েবিলিটি ধরা পড়ে।
দেশ এবং অঞ্চল লেভেল অ্যাগ্রিগেশনশিপিং জোন এবং লেন নির্ধারণডেলিভারি টাইম ডিস্ট্রিবিউশন ফিচারডিসট্যান্স এবং ক্রস-বর্ডার ইন্ডিকেটরসার্ভিস লেভেল এবং SLA ফিচারপাঠ 11ক্যাটাগরিক্যাল ভ্যারিয়েবল স্ট্যান্ডার্ডাইজ এবং ক্লিনিং: প্রোডাক্ট_ক্যাটাগরি, কান্ট্রি, মার্কেটিং_চ্যানেল, ডিভাইস_টাইপপ্রোডাক্ট ক্যাটাগরি, কান্ট্রি, মার্কেটিং চ্যানেল এবং ডিভাইস টাইপের মতো ক্যাটাগরিক্যাল ভ্যারিয়েবল স্ট্যান্ডার্ডাইজ এবং ক্লিন করুন লেবেল নরমালাইজ, রেয়ার লেভেল মার্জ এবং ডেটাসেট জুড়ে সামঞ্জস্যপূর্ণ ট্যাক্সোনমি জোর করে চালু করে।
অসামঞ্জস্যপূর্ণ ক্যাটাগরি লেবেল শনাক্তকরণস্ট্রিং নরমালাইজেশন এবং ম্যাপিংরেয়ার এবং নয়েজি ক্যাটাগরি মার্জক্যাটাগরি ট্যাক্সোনমি রক্ষাক্যাটাগরিক্যাল ক্লিনিং ডকুমেন্টেশন