سبق 1ਨਿਯਮ-ਅਧਾਰਤ ਨਿਯੰਤਰਣ: ਹਾਈਸਟੀਰੇਸਿਸ, ਸਮੇਂ ਦੇ ਹਿਸਾਬ ਨਾਲ ਰੁਕਾਵਟਾਂ, ਭਾਵੁਕਤਾ-ਟ੍ਰਿਗਰਡ ਲਾਈਟਿੰਗ ਅਤੇ HVAC ਸੈੱਟਪਾਈੰਟ ਅਡਜਸਟਮੈਂਟਇਹ ਭਾਗ ਕਨੈਕਟਿਡ ਇਮਾਰਤਾਂ ਲਈ ਨਿਯਮ-ਅਧਾਰਤ ਨਿਯੰਤਰਣ ਦੀ ਵਿਆਖਿਆ ਕਰਦਾ ਹੈ, ਹਾਈਸਟੀਰੇਸਿਸ, ਸਮੇਂ ਦੇ ਹਿਸਾਬ ਨਾਲ ਸ਼ੈਡਿਊਲ ਅਤੇ ਭਾਵੁਕਤਾ ਟ੍ਰਿਗਰਾਂ ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਿਤ ਕਰਦਾ ਹੈ। ਵਿਦਿਆਰਥੀ ਲਾਈਟਿੰਗ ਅਤੇ HVAC ਸੈੱਟਪਾਈੰਟਸ ਲਈ ਮਜ਼ਬੂਤ ਨਿਯਮ ਡਿਜ਼ਾਈਨ ਕਰਨਗੇ ਜੋ ਘਸਾਈ ਘਟਾਉਣ, ਊਰਜਾ ਬਚਾਉਣ ਅਤੇ ਓਸੀਲੇਸ਼ਨ ਰੋਕਣ।
Designing hysteresis bands for thermostatsTime-of-day and calendar-based schedulesOccupancy-triggered lighting strategiesHVAC setpoint shifts based on presenceConflict resolution between overlapping rulesسبق 2ਸੁਰੱਖਿਆ ਅਤੇ ਗਾਰਡਰੇਲ: ਰੁਕਾਵਟ ਲਾਗੂ ਕਰਨਾ, ਐਕਸ਼ਨ ਹੱਦਾਂ, ਫਾਲਬੈਕ ਨਿਯਮ, ਸਿਮੂਲੇਟਿਡ ਟੈਸਟਿੰਗ ਅਤੇ ਸ਼ੈਡੋ ਮੋਡਇਹ ਭਾਗ ਆਟੋਮੇਟਿਕ ਨਿਯੰਤਰਣ ਵਿੱਚ ਸੁਰੱਖਿਆ ਅਤੇ ਗਾਰਡਰੇਲ ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਿਤ ਕਰਦਾ ਹੈ। ਇਹ ਸਖ਼ਤ ਰੁਕਾਵਟਾਂ, ਐਕਸ਼ਨ ਹੱਦਾਂ, ਫਾਲਬੈਕ ਨਿਯਮ ਸੈੱਟਾਂ, ਸਿਮੂਲੇਟਿਡ ਟੈਸਟਿੰਗ ਅਤੇ ਸ਼ੈਡੋ ਮੋਡ ਡਿਪਲਾਇਮੈਂਟ ਕਵਰ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਅਸਲ ਵਾਤਾਵਰਣ ਵਿੱਚ ਅਸੁਰੱਖਿਅਤ ਜਾਂ ਅਸਹਿਜ ਵਿਵਹਾਰ ਰੋਕਿਆ ਜਾ ਸਕੇ।
Hard constraints and action limit designFail-safe default and fallback rule setsSimulation-based safety testingShadow mode and A/B rollout plansMonitoring for unsafe model behaviorسبق 3ਨਿਯੰਤਰਣ ਲੂਪਸ ਲਈ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਓਵਰਵਿਊ: ਸਟੇਟ, ਐਕਸ਼ਨ, ਰਿਵਾਰਡ ਡਿਜ਼ਾਈਨ, ਸੈਂਪਲ ਕੁਸ਼ਲਤਾ ਅਤੇ ਸੁਰੱਖਿਆ ਰੁਕਾਵਟਾਂਇਹ ਭਾਗ ਕਨੈਕਟਿਡ ਆਬਜੈਕਟਸ ਵਿੱਚ ਨਿਯੰਤਰਣ ਲੂਪਸ ਲਈ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਸਟੇਟਸ, ਐਕਸ਼ਨਾਂ ਅਤੇ ਰਿਵਾਰਡ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ, ਅਤੇ ਸੈਂਪਲ ਕੁਸ਼ਲਤਾ, ਐਕਸਪਲੋਰੇਸ਼ਨ ਰਣਨੀਤੀਆਂ ਅਤੇ ਅਸਲ ਇਮਾਰਤਾਂ ਲਈ ਢੁਕਵੀਂ ਸੁਰੱਖਿਆ ਰੁਕਾਵਟਾਂ ਬਾਰੇ ਚਰਚਾ ਕਰਦਾ ਹੈ।
Defining state spaces from sensor signalsAction spaces for HVAC and lighting controlReward design balancing comfort and energySafe exploration and constraint handlingSample efficiency and offline RL methodsسبق 4ਮੁਲਾਂਕਣ ਮਾਪਦੰਡ ਅਤੇ ਵੈਲੀਡੇਸ਼ਨ: ਤਾਪਮਾਨ ਟਾਰਗੇਟਸ ਲਈ RMSE, ਊਰਜਾ ਮਾਪਦੰਡ, ਭਾਵੁਕ ਸਹਿਜਤਾ ਸੂਚਕ, ਕਰਾਸ-ਵੈਲੀਡੇਸ਼ਨ ਪਹੁੰਚਇਹ ਭਾਗ ਨਿਯੰਤਰਣ ਮਾਡਲਾਂ ਲਈ ਮੁਲਾਂਕਣ ਮਾਪਦੰਡ ਅਤੇ ਵੈਲੀਡੇਸ਼ਨ ਵਿਧੀਆਂ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਵਿਦਿਆਰਥੀ ਤਾਪਮਾਨ ਟਰੈਕਿੰਗ ਲਈ RMSE, ਊਰਜਾ ਅਤੇ ਸਹਿਜਤਾ ਸੂਚਕਾਂ, ਅਤੇ ਕਰਾਸ-ਵੈਲੀਡੇਸ਼ਨ ਜਾਂ ਸਮੇਂ-ਅਧਾਰਤ ਵੰਡ ਨਾਲ ਮਜ਼ਬੂਤੀ ਮੁਲਾਂਕਣ ਕਰਨਗੇ ਡਿਪਲਾਇਮੈਂਟ ਤੋਂ ਪਹਿਲਾਂ।
RMSE and MAE for temperature targetsEnergy use and peak demand indicatorsOccupant comfort and satisfaction indicesTrain–test splits and cross-validationBacktesting on historical building dataسبق 5ਹਾਈਬ੍ਰਿਡ ਰਣਨੀਤੀਆਂ: ਸੁਰੱਖਿਆ ਲਈ ਨਿਯਮ-ਸੈੱਟ ML ਨਾਲ ਅਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਨਿੱਜੀਕਰਨ ਲਈਇਹ ਭਾਗ ਹਾਈਬ੍ਰਿਡ ਨਿਯੰਤਰਣ ਰਣਨੀਤੀਆਂ ਵਿਆਖਿਆ ਕਰਦਾ ਹੈ ਜੋ ਨਿਰਧਾਰਿਤ ਸੁਰੱਖਿਆ ਨਿਯਮਾਂ ਨੂੰ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਨਾਲ ਜੋੜਦੀਆਂ ਹਨ। ਵਿਦਿਆਰਥੀ ਆਰਕੀਟੈਕਚਰ ਡਿਜ਼ਾਈਨ ਕਰਨਗੇ ਜਿੱਥੇ ਨਿਯਮ ਹੱਦਾਂ ਲਾਗੂ ਕਰਦੇ ਹਨ ਜਦੋਂ ਕਿ ML ਸਹਿਜਤਾ ਨੂੰ ਨਿੱਜੀ ਬਣਾਉਂਦਾ ਹੈ ਅਤੇ ਊਰਜਾ ਪਰਫਾਰਮੈਂਸ ਟਿਊਨ ਕਰਦਾ ਹੈ।
Layered control: rules first, ML secondNon-negotiable safety and compliance rulesML for comfort personalization and habitsML for energy and demand response tuningArbitration when ML suggests unsafe actionsسبق 6ਸੁਪਰਵਾਈਜ਼ਡ ਲਰਨਿੰਗ ਵਿਕਲਪ: ਤਾਪਮਾਨ ਨਿਯੰਤਰਣ ਲਈ ਰੀਗ੍ਰੈਸ਼ਨ, ਭਾਵੁਕਤਾ/ਸਹਿਜਤਾ ਪੂਰਵਾਗਣਨਾ ਲਈ ਕਲਾਸੀਫਿਕੇਸ਼ਨ — ਫੀਚਰ ਇੰਜੀਨੀਅਰਿੰਗ ਅਤੇ ਲੇਬਲਇਹ ਭਾਗ ਕਨੈਕਟਿਡ ਆਬਜੈਕਟਸ ਲਈ ਸੁਪਰਵਾਈਜ਼ਡ ਲਰਨਿੰਗ ਵਿਕਲਪ ਕਵਰ ਕਰਦਾ ਹੈ। ਇਹ ਲਗਾਤਾਰ ਨਿਯੰਤਰਣ ਲਈ ਰੀਗ੍ਰੈਸ਼ਨ, ਭਾਵੁਕਤਾ ਜਾਂ ਸਹਿਜਤਾ ਸਟੇਟਸ ਲਈ ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਦੀ ਤੁਲਨਾ ਕਰਦਾ ਹੈ, ਅਤੇ ਵਿਖਾਉਂਦਾ ਹੈ ਕਿ ਫੀਚਰ ਇੰਜੀਨੀਅਰਿੰਗ ਅਤੇ ਲੇਬਲ ਪਰਫਾਰਮੈਂਸ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ।
Regression for temperature and power controlClassification for occupancy detectionComfort state prediction modelsFeature engineering from raw sensorsLabel generation from historical logsسبق 7ਮਾਡਲ ਚੋਣ ਗਾਈਡੈਂਸ: ਲੀਨੀਅਰ ਰੀਗ੍ਰੈਸ਼ਨ, ਡਿਸੀਜ਼ਨ ਟ੍ਰੀਆਂ, ਰੈਂਡਮ ਫਾਰੈਸਟ, ਹਲਕੇ ਨਿਊਰਲ ਨੈੱਟਸ, ਅਤੇ ਮਾਡਲ ਜਟਿਲਤਾ vs ਵਿਆਖਿਆਤਮਤਾਇਹ ਭਾਗ ਕਨੈਕਟਿਡ ਆਬਜੈਕਟ ਨਿਯੰਤਰਣ ਲਈ ਮਾਡਲ ਚੋਣ ਲਈ ਗਾਈਡ ਕਰਦਾ ਹੈ। ਇਹ ਲੀਨੀਅਰ ਮਾਡਲਾਂ, ਟ੍ਰੀਆਂ, ਐਂਸੈਂਬਲਾਂ ਅਤੇ ਹਲਕੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਦੀ ਤੁਲਨਾ ਕਰਦਾ ਹੈ, ਜਟਿਲਤਾ, ਲੇਟੈਂਸੀ, ਵਿਆਖਿਆਤਮਤਾ ਅਤੇ ਡਿਪਲਾਇਮੈਂਟ ਰੁਕਾਵਟਾਂ ਵਿਚਕਾਰ ਟ੍ਰੇਡਆਫ਼ ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ।
When to use linear regression modelsDecision trees for interpretable rulesRandom forests and gradient boostingLightweight neural nets for edge devicesBalancing accuracy and explainabilityسبق 8ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਲੋੜਾਂ: ਸੈਂਸਰਾਂ ਤੋਂ ਫੀਚਰਾਂ, ਕੰਟੈਕਸਟੂਅਲ ਡਾਟਾ (ਕੈਲੰਡਰ, ਸ਼ੈਡਿਊਲ, ਬਾਹਰੀ ਮੌਸਮ), ਲੇਬਲਿੰਗ ਰਣਨੀਤੀਆਂਇਹ ਭਾਗ ਕਨੈਕਟਿਡ ਆਬਜੈਕਟ ਮਾਡਲਾਂ ਲਈ ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਲੋੜਾਂ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ। ਇਹ ਸੈਂਸਰ ਫੀਚਰਾਂ, ਮੌਸਮ ਅਤੇ ਸ਼ੈਡਿਊਲ ਵਰਗੇ ਕੰਟੈਕਸਟੂਅਲ ਇਨਪੁਟਸ, ਲੇਬਲਿੰਗ ਰਣਨੀਤੀਆਂ ਅਤੇ ਭਰੋਸੇਯੋਗ ਨਿਯੰਤਰਣ ਤੇ ਡਾਟਾ ਕੁਆਲਿਟੀ ਚੈੱਕ ਕਵਰ ਕਰਦਾ ਹੈ।
Selecting core sensor and actuator featuresAdding weather and external context dataUsing calendar and occupancy schedulesLabeling strategies for comfort outcomesData cleaning and missing value handlingسبق 9ਰੀਟ੍ਰੇਨਿੰਗ ਰਣਨੀਤੀ: ਫ੍ਰੀਕੁਐਂਸੀ, ਲਗਾਤਾਰ ਸਿੱਖਣ vs ਪੀਰੀਯਡਿਕ ਰੀਟ੍ਰੇਨ, ਕੰਪੈਕਟ ਡ੍ਰਿਫਟ ਪਤਾ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਲਈ ਡਾਟਾ ਰਿਟੇਨਸ਼ਨਇਹ ਭਾਗ ਕਨੈਕਟਿਡ ਆਬਜੈਕਟ ਨਿਯੰਤਰਣ ਲਈ ਲਗਾਤਾਰ ਅਤੇ ਪੀਰੀਯਡਿਕ ਰੀਟ੍ਰੇਨਿੰਗ ਦੀ ਤੁਲਨਾ ਕਰਦਾ ਹੈ। ਇਹ ਕੰਪੈਕਟ ਡ੍ਰਿਫਟ ਪਤਾ, ਡਾਟਾ ਰਿਟੇਨਸ਼ਨ ਪਾਲਿਸੀਆਂ ਅਤੇ ਅਪਡੇਟ ਸ਼ੈਡਿਊਲ ਕਵਰ ਕਰਦਾ ਹੈ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਸਹੀ ਰੱਖਦੇ ਹਨ ਬਿਨਾਂ ਲਾਈਵ ਆਪ੍ਰੇਸ਼ਨ ਵਿਘਨ ਪਾਏ।
Continuous vs periodic retraining plansOnline learning for streaming sensor dataConcept drift detection in building systemsData retention windows and refresh cyclesRollback and model versioning policies