บทเรียนที่ 1การลด dimensionality และการเลือก: mutual information, correlation filtering, recursive feature elimination, stability selectionเราจะตรวจสอบวิธีลด dimensionality ของ features และเลือกตัวทำนายที่แข็งแกร่ง โดยใช้ mutual information, correlation filtering, recursive feature elimination, และ stability selection ที่เหมาะกับ equity features ที่ noisy และ high-frequency
Mutual information สำหรับ feature rankingCorrelation และ redundancy filteringRecursive feature elimination workflowsStability selection ข้าม time splitsการสมดุล parsimony และ performanceบทเรียนที่ 2Cross-sectional และ universe features: z-scores, rank transforms, winsorization, normalization (demeaning vs scaling)เราออกแบบการแปลง cross-sectional และ universe-level รวมถึง z-scores, ranks, winsorization, และ normalization เพื่อให้ features เปรียบเทียบข้ามหุ้นและแข็งแกร่งต่อ outliers และความแตกต่างของ scale
Cross-sectional z-scoring ของ featuresRank transforms และ percentile scoresWinsorization และ outlier handlingDemeaning ตาม sector หรือ universeScaling สำหรับ price levels ที่แตกต่างบทเรียนที่ 3การตรวจสอบ sanity ในการสร้าง feature: การหลีกเลี่ยง leakage, lookahead prevention, timestamp hygieneส่วนนี้เน้นการตรวจสอบ sanity ที่ป้องกัน data leakage ในการสร้าง feature รวมถึง lagging ที่ถูกต้อง การป้องกัน lookahead การจัดแนว timestamp และการใช้เฉพาะข้อมูลที่มีในเวลาทำนาย
การระบุและป้องกัน label leakageLagging ที่ถูกต้องของ features และ targetsTimestamp alignment และ market calendarsการจัดการ corporate actions และ revisionsBacktest-time vs trade-time informationบทเรียนที่ 4สัญญาณ momentum และ mean-reversion: short-window momentum, RSI, และการตีความสำหรับ 1–10 วันส่วนนี้พัฒนาสัญญาณ momentum และ mean-reversion ระยะสั้น รวมถึง short-window momentum และ RSI และอธิบายวิธีตีความ normalize และรวมเข้าด้วยกันสำหรับการพยากรณ์หุ้น 1–10 วัน
การกำหนด short-window momentum signalsRSI settings สำหรับ 1–10 วัน tradingMean-reversion ใน intraday gapsการรวม momentum และ reversal cuesพฤติกรรมสัญญาณตาม regimeบทเรียนที่ 5ตัวชี้วัดทางเทคนิคจากราคา: simple และ exponential moving averages, MACD, Bollinger Bands — การเลือกพารามิเตอร์สำหรับระยะสั้นส่วนนี้ครอบคลุมตัวชี้วัดจากราคาระยะสั้น โดยเน้นการกำหนดพารามิเตอร์ moving averages, MACD, และ Bollinger Bands สำหรับการพยากรณ์ 1–10 วัน และการหลีกเลี่ยง overfitting เมื่อปรับ lookback windows และ thresholds
การเลือก SMA และ EMA lookback windowsShort-horizon MACD parameter settingsBollinger Bands สำหรับ 1–10 วัน signalsการรวม price indicators ที่ทับซ้อนการหลีกเลี่ยง overfitting ในการปรับ indicatorบทเรียนที่ 6Volume และ liquidity features: On-Balance Volume, volume-weighted average price (VWAP) approximations, turnover และ bid-ask spread proxiesส่วนนี้พัฒนา volume และ liquidity features เช่น OBV, VWAP approximations, turnover, และ bid–ask spread proxies อธิบายว่าสิ่งเหล่านี้จับ order flow, trading frictions, และ short-term price impact สำหรับการพยากรณ์หุ้นอย่างไร
On-Balance Volume สำหรับ short-term flowการประมาณ VWAP จาก daily dataTurnover และ dollar volume measuresBid–ask spread และ illiquidity proxiesการกรองหุ้น illiquid และ microcapบทเรียนที่ 7Market-relative features: stock minus SPY returns, beta estimation ด้วย rolling windows, residuals จาก market modelส่วนนี้สร้าง market-relative features เช่น excess returns เหนือ SPY, rolling beta estimates, และ residuals จาก market model ชี้แจงวิธีแยกสัญญาณ idiosyncratic จากการเคลื่อนไหวตลาดกว้าง
Stock minus index excess returnsการเลือก rolling beta estimationSingle-factor market model residualsการใช้ sector และ style factor controlsการป้องกัน market exposure ใน signalsบทเรียนที่ 8Volatility และ risk features: rolling realized volatility, GARCH basics สำหรับระยะสั้น, intraday volatility proxies จาก OHLC (range-based estimators)ที่นี่เราสร้าง volatility และ risk features ที่เหมาะกับ 1–10 วัน รวมถึง rolling realized volatility, GARCH-style measures ง่ายๆ, และ range-based estimators จาก OHLC data โดยเน้นความแข็งแกร่งและ microstructure noise
การสร้าง rolling realized volatilityGARCH-style short-horizon volatilityRange-based OHLC volatility estimatorsVolatility scaling ของ returns และ signalsการจัดการ jumps และ volatility clusteringบทเรียนที่ 9ความเสถียรของ feature: autocorrelation, information coefficient (IC) computation, decay ของ predictive power ตาม horizonเราวิเคราะห์ความเสถียรของ feature ตามเวลาด้วย autocorrelation, information coefficient (IC), และ decay curves เรียนรู้ว่า predictive power เปลี่ยนตาม horizon อย่างไรและการตรวจสอบ signal degradation ใน production
Autocorrelation ของ features และ signalsCross-sectional IC และ rank ICIC decay ข้าม forecast horizonsRolling IC และ t-stat monitoringการตรวจจับ regime shifts ใน featuresบทเรียนที่ 10Lagged returns และ cumulative returns: การสร้าง 1, 5, 10-day targets และ predictors, log vs arithmetic returnsเราสร้าง lagged และ cumulative return features และ targets สำหรับ 1, 5, 10 วัน เปรียบเทียบ log และ arithmetic returns, compounding conventions, และการจัดแนว predictors กับ forecast windows
การกำหนด 1, 5, 10 วัน return targetsLog vs arithmetic returns trade-offsRolling cumulative return featuresOverlapping vs non-overlapping windowsการปรับสำหรับ dividends และ splits