Summary
Keywords
Full Transcript
En este live vamos a explorar técnicas muy importantes para transformar variables y mejorar el rendimiento de modelos de regresión. Muchas veces los datos no vienen en la forma ideal para que un modelo aprenda bien, especialmente cuando tenemos distribuciones con colas pesadas o múltiples picos (multimodales). Durante la sesión veremos: 📊 Bucketizing: cómo dividir una variable en intervalos (buckets) para manejar distribuciones complejas. 📈 Heavy-tailed distributions: por qué algunas variables necesitan transformaciones antes de entrenar un modelo. 🏷 Codificación de buckets como categorías usando técnicas como One-Hot Encoding. 🧠 Radial Basis Functions (RBF): cómo crear nuevas features basadas en similitud con valores específicos. 📉 Transformación del target (por ejemplo con log o escalado) para mejorar el entrenamiento del modelo. ⚙️ Uso de Scikit-Learn para implementar estas transformaciones de forma correcta. 🤖 TransformedTargetRegressor: una forma más segura y limpia de entrenar modelos cuando transformamos la variable objetivo. También veremos ejemplos prácticos en Python con Scikit-Learn para entender cómo aplicar estas técnicas en problemas reales de Machine Learning. Material de apoyo: Leer los siguientes temas del capitulo 2 del libro Hands-On Machine Learning with Scikit-Learn and PyTorch - Aurélien Géron * Prepare the Data for Machine Learning Algorithms - Feature Scaling and Transformation 🔗 Suscripciones 👉 https://www.youtube.com/channel/UCpqqJGMaVEmyinn1J-DhnYg/join 💬 Discord 👉 https://discord.com/users/pildorasdeprogramacion 📸 Instagram 👉 https://www.instagram.com/pildoras_de_programacion/ 🎵 TikTok 👉 https://www.tiktok.com/@pil_programacion?lang=en 📘 Facebook 👉 https://www.facebook.com/pilprogramacion 📺 YouTube 👉 https://www.youtube.com/@pildorasdeprogramacion 🔔 ¡Suscríbete y activa la campanita para no perderte futuros lives! 🔴 ¡Nos vemos en el live! 🚀🐳
