Aprendizaje automático: supervisado, no supervisado y algoritmos clave

El aprendizaje automático es una forma de usar datos para hacer predicciones o detectar patrones sin escribir cada regla a mano. En el aprendizaje supervisado, los datos de entrenamiento incluyen la respuesta correcta. En el aprendizaje no supervisado, no la incluyen, así que el objetivo es encontrar estructura, como grupos o direcciones principales de variación.

Esa es la idea central detrás de los conceptos básicos del aprendizaje automático. Se empieza con datos, se elige un modelo, se entrena con ejemplos y luego se comprueba si funciona con datos nuevos, en lugar de solo con los datos que ya vio.

Qué hace el aprendizaje automático

Un modelo de aprendizaje automático relaciona entradas con salidas o patrones. La entrada puede ser el tamaño de una vivienda, notas de examen, actividad de clientes o valores de píxeles en una imagen. La salida depende de la tarea:

predecir un número, como un precio
predecir una etiqueta, como spam o no spam
agrupar elementos similares sin etiquetas
ordenar o recomendar opciones probables

Lo que hace que esto sea “aprendizaje” es que los parámetros del modelo se ajustan a partir de los datos, en lugar de quedar fijados por completo por un programador.

Aprendizaje supervisado vs. aprendizaje no supervisado

Aprendizaje supervisado: predecir un objetivo conocido

El aprendizaje supervisado usa ejemplos de la forma $(x, y)$ , donde $x$ es la entrada e $y$ es el objetivo conocido.

Si $y$ es numérico, la tarea suele llamarse regresión. Si $y$ es una categoría, la tarea suele llamarse clasificación.

Entre los algoritmos supervisados más comunes están la regresión lineal, la regresión logística, los árboles de decisión, los bosques aleatorios, las máquinas de vectores de soporte y las redes neuronales. Ningún método es el mejor en todos los casos. La elección correcta depende del tamaño de los datos, del nivel de ruido, del tipo de variables y de cuánta interpretabilidad necesites.

Aprendizaje no supervisado: encontrar estructura sin etiquetas

El aprendizaje no supervisado usa entradas $x$ sin etiquetas objetivo.

Aquí el objetivo suele ser descubrir estructura que ya está presente en los datos. Un método de agrupamiento como k-means intenta reunir observaciones similares. Un método de reducción de dimensionalidad como el análisis de componentes principales intenta resumir la variación con menos direcciones.

El aprendizaje no supervisado puede ser útil para exploración, compresión, detección de anomalías o preprocesamiento. Sus resultados dependen mucho de cómo se representan los datos y de qué noción de similitud incorpora el método.

Un modelo mental sencillo

Piensa en el aprendizaje automático como un ajuste de curvas o de patrones bajo incertidumbre.

Eliges una familia de modelos, como líneas rectas, árboles de decisión o redes neuronales por capas. Después, el entrenamiento ajusta el modelo para que sus predicciones coincidan lo mejor posible con los datos de entrenamiento según una función de pérdida. Si el modelo generaliza bien, también funciona bien con datos nuevos que no ha visto antes.

Esa última condición importa. Un modelo que solo memoriza el conjunto de entrenamiento normalmente no es útil.

Ejemplo resuelto: predecir el alquiler con regresión lineal

Supón que quieres predecir el alquiler de un apartamento a partir de su superficie. Un modelo supervisado sencillo es

\hat{y} = b_0 + b_1x

donde $x$ es la superficie, $\hat{y}$ es el alquiler predicho, $b_0$ es la ordenada al origen y $b_1$ es la pendiente.

Supón que un modelo ajustado da

\hat{y} = 500 + 2x

con el alquiler medido en dólares y la superficie medida en pies cuadrados.

Si un apartamento tiene $x = 700$ , la predicción es

\hat{y} = 500 + 2(700) = 1900

Así que el modelo predice un alquiler de $1900$ .

Aquí importan tres detalles. El modelo aprendió a partir de ejemplos etiquetados de superficie y alquiler. La predicción es una estimación, no una garantía. La fórmula solo tiene sentido si una relación aproximadamente lineal es una aproximación razonable en el rango que te interesa.

Este ejemplo es deliberadamente simple, pero recoge el ciclo principal del aprendizaje supervisado: usar datos etiquetados, ajustar parámetros y predecir un objetivo para una nueva entrada.

Algoritmos clave de aprendizaje automático y cuándo usarlos

Regresión lineal

Úsala cuando el objetivo sea predecir un valor numérico y una aproximación en línea recta sea un primer modelo razonable.

Regresión logística

Úsala para clasificación cuando quieras una referencia relativamente simple e interpretable para predecir categorías como sí o no.

Árboles de decisión y bosques aleatorios

Úsalos cuando las relaciones sean no lineales o incluyan interacciones, especialmente en datos tabulares. Los bosques aleatorios suelen sacrificar algo de interpretabilidad a cambio de una mayor estabilidad predictiva.

Agrupamiento k-means

Úsalo en aprendizaje no supervisado para agrupar observaciones en $k$ clústeres. Funciona mejor cuando la idea de un centro de clúster tiene sentido para las variables que usas.

Redes neuronales

Úsalas cuando la relación entre entradas y salidas sea muy compleja, especialmente en tareas de imagen, voz y lenguaje. A menudo necesitan más datos y ajuste que los modelos más simples.

Errores comunes en los conceptos básicos del aprendizaje automático

Confundir predicción con explicación

Un modelo puede predecir bien y aun así no explicar la causa real del patrón.

Ignorar la diferencia entre entrenamiento y prueba

Una alta precisión en entrenamiento no significa que el modelo vaya a rendir bien con datos nuevos. La generalización debe comprobarse con datos separados.

Usar la métrica equivocada

La exactitud puede ser engañosa en problemas de clasificación desbalanceada. En algunas tareas, la precisión, la exhaustividad, el error absoluto medio u otra métrica pueden importar más.

Tratar los nombres de algoritmos como garantías

“Red neuronal” o “bosque aleatorio” no es una promesa de calidad. La calidad de los datos, el diseño de variables, la evaluación y el planteamiento del problema importan al menos tanto como la etiqueta del algoritmo.

Cuándo es útil el aprendizaje automático

El aprendizaje automático es útil cuando el patrón es demasiado complicado para un pequeño conjunto fijo de reglas, pero hay suficientes datos para aprender a partir de ejemplos. Algunos usos comunes incluyen sistemas de recomendación, detección de fraude, herramientas de apoyo para imágenes médicas, ranking, pronóstico y clasificación de documentos.

No siempre es la herramienta adecuada. Si la regla es simple, estable y se conoce por completo, una fórmula ordinaria o un programa determinista puede ser mejor.

Prueba un problema similar

Toma un conjunto de datos pequeño y hazte dos preguntas: “¿Cuál es la entrada?” y “¿Cuál es el objetivo?”. Si puedes responder ambas, prueba un modelo supervisado como regresión lineal o clasificación. Si no puedes, explora si los datos forman grupos de manera natural con un método no supervisado.

Si quieres ir un paso más allá, resuelve primero un problema parecido con un modelo simple y luego compáralo con uno más flexible. Normalmente, esa es una mejor forma de aprender que ir directamente al algoritmo más avanzado.

Preguntas frecuentes

¿El aprendizaje automático es lo mismo que la inteligencia artificial?: No exactamente. El aprendizaje automático es una parte importante de la IA moderna, pero la IA es más amplia e incluye también sistemas basados en reglas, búsqueda, planificación y otros enfoques.
¿El aprendizaje automático siempre necesita enormes cantidades de datos?: No. Algunos modelos funcionan bien con conjuntos de datos modestos, pero la cantidad de datos necesaria depende del problema, del nivel de ruido y de la complejidad del modelo.
¿Un modelo de aprendizaje automático explica por qué ocurre algo?: No por sí solo. Un modelo puede captar patrones que ayudan a predecir, pero predecir no es lo mismo que demostrar causalidad.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →