Actividad 2 M3

Ejercicio de Técnicas Avanzadas de Aprendizaje Supervisado

Realiza un ejercicio práctico sencillo para aplicar técnicas de aprendizaje supervisado utilizando un modelo de regresión lineal. Utiliza un pequeño conjunto de datos ficticio que crearás en Python para entrenar y evaluar un modelo de regresión lineal utilizando scikit-learn.

Ejercicio Práctico:

Utiliza Python para crear un pequeño conjunto de datos con dos características y un objetivo.

Este código proporciona una base sólida para comenzar a trabajar con regresión lineal en Python.

🌟 Prueba este código en Google Colab

import pandas as pd
from sklearn.linear_model import LinearRegression

# 1. Crear el conjunto de datos
data = {
    'horas_estudio': [2, 3, 5, 7, 8],
    'examen_practico': [50, 60, 75, 80, 85],
    'nota_final': [58, 65, 72, 78, 83]
}
df = pd.DataFrame(data)

# 2. Entrenar un modelo de regresión lineal
X = df[['horas_estudio', 'examen_practico']]  # Características (variables independientes)
y = df['nota_final']  # Variable objetivo (a predecir)

model = LinearRegression()
model.fit(X, y)

# 3. Predecir con nuevos datos
nuevos_datos = [[6, 70]]  # Un nuevo estudiante con 6 horas de estudio y 70 en el examen práctico
prediccion = model.predict(nuevos_datos)
print("Predicción de la Nota Final:", prediccion)

Explicación del código:

  1. Importar librerías: Se importan las librerías necesarias: pandas para manejar los datos y sklearn.linear_model para utilizar el modelo de regresión lineal.
  2. Crear el conjunto de datos: Se crea un DataFrame de pandas con las características (horas de estudio y examen práctico) y la variable objetivo (nota final).
  3. Dividir los datos:
    • X: Contiene las características que se utilizarán para hacer las predicciones.
    • y: Contiene la variable objetivo que queremos predecir.
  4. Crear el modelo: Se crea una instancia del modelo de regresión lineal.
  5. Entrenar el modelo: Se ajusta el modelo a los datos de entrenamiento utilizando el método fit.
  6. Hacer predicciones: Se utiliza el modelo entrenado para predecir la nota final de un nuevo estudiante con las características especificadas en nuevos_datos.

Consideraciones adicionales:

  • Visualización: Para una mejor comprensión de los datos y del modelo, se puede utilizar librerías como matplotlib o seaborn para crear gráficos.
  • Evaluación del modelo: Se pueden utilizar métricas como el coeficiente de determinación (R²) o el error cuadrático medio (MSE) para evaluar el rendimiento del modelo.
  • Validación cruzada: Para obtener una estimación más robusta del rendimiento del modelo, se puede utilizar la validación cruzada.

Ejercicios propuestos (opcionales)

  • Agregar más características: Incluye otras características relevantes, como el número de horas de sueño o el nivel de estrés.
  • Experimentar con diferentes modelos: Prueba otros modelos de regresión, como la regresión polinomial o la regresión Ridge.
  • Analizar los coeficientes: Interpreta los coeficientes del modelo para entender la importancia de cada característica en la predicción de la nota final.