El artículo titulado "10 Machine Learning Algorithms Explained Using Real-World Analogies" por Kanwal Mehreen, publicado el 3 de septiembre de 2024, utiliza analogías del mundo real para explicar diez algoritmos comunes de machine learning (aprendizaje automático). Esta metodología hace que la comprensión de conceptos complejos sea más accesible para los principiantes, relacionando la teoría abstracta con situaciones cotidianas. Mehreen reconoce que cuando las matemáticas o el machine learning se presentan sin un contexto claro o aplicabilidad, pueden parecer abstractos y difíciles de aprender. A través de su enfoque, busca facilitar el proceso de aprendizaje de estos algoritmos.
A continuación, se exponen los algoritmos discutidos en el artículo, junto con las analogías que los hacen más comprensibles.
1. Regresión lineal
La regresión lineal es un algoritmo de aprendizaje supervisado que busca encontrar la mejor línea recta que se ajuste a los datos. Este ajuste pretende minimizar la diferencia entre los valores reales y los valores predichos.
Analogía: La analogía propuesta es la de un jardinero que quiere descubrir la cantidad óptima de fertilizante para maximizar el crecimiento de las plantas. El jardinero registra la cantidad de fertilizante aplicada (variable independiente) y mide el crecimiento de las plantas (variable dependiente). Al representar estos datos en un gráfico de dispersión, el jardinero trata de encontrar la línea recta que mejor se ajuste a estos puntos, minimizando la desviación. Una vez que tiene esta línea, puede predecir el crecimiento futuro de las plantas con base en la cantidad de fertilizante aplicada.
2. Regresión logística
Este algoritmo es similar a la regresión lineal, pero en lugar de predecir variables continuas, la regresión logística se utiliza para problemas de clasificación binaria, es decir, donde el resultado es una de dos opciones (sí/no, verdadero/falso).
Analogía: Mehreen usa el ejemplo de "America's Got Talent", un programa en el que los concursantes tienen dos posibles resultados: avanzar o no a la siguiente ronda. Los jueces, basándose en varios factores como el desempeño y la experiencia previa, toman decisiones (sí o no), similar a cómo funciona la regresión logística para predecir la probabilidad de un resultado binario.
3. Árbol de decisión
El árbol de decisión es un algoritmo de aprendizaje supervisado que divide los datos en subconjuntos basados en los valores de las características, tomando decisiones en cada nodo hasta llegar a una conclusión.
Analogía: Se compara con el juego "20 preguntas", en el que un jugador intenta adivinar en qué está pensando su oponente haciendo preguntas de sí o no. Cada respuesta permite tomar una decisión y eliminar opciones, reduciendo el número de posibles respuestas hasta que se llega a la correcta. De la misma manera, los árboles de decisión dividen los datos en ramas más pequeñas basadas en decisiones hasta llegar a una predicción.
4. Bosques aleatorios (Random Forest)
Este es un algoritmo de aprendizaje de conjunto que combina múltiples árboles de decisión entrenados en diferentes partes de los datos. Las predicciones de todos los árboles se combinan para generar una decisión final.
Analogía: El autor compara este algoritmo con un comité de inversores que toman decisiones sobre un nuevo proyecto. Cada miembro del comité aporta su juicio basado en sus experiencias y análisis. Al final, se combinan todas las opiniones para tomar una decisión colectiva, lo que refleja cómo funciona el bosque aleatorio.
5. Máquinas de vectores de soporte (SVM)
El SVM es un algoritmo de aprendizaje supervisado que separa los datos en clases utilizando una línea recta (hiperplano), maximizando la distancia entre los puntos de cada clase. Esto facilita la asignación de nuevas observaciones a una clase específica.
Analogía: Mehreen ofrece una comparación con la separación de aficionados de equipos rivales en un evento deportivo. Para evitar conflictos, se puede imaginar una cinta roja que separa a los fanáticos de cada equipo. Cuando un nuevo aficionado llega, dependiendo de características como la camiseta que lleva o el equipo que apoya, se le asigna un lugar en una de las dos áreas, similar a cómo el SVM clasifica nuevos datos en una clase u otra.
6. Naive Bayes
Este algoritmo de aprendizaje supervisado se basa en el teorema de Bayes y asume que todas las características son independientes entre sí. Calcula la probabilidad de cada clase basándose en información previa y selecciona la clase con la mayor probabilidad.
Analogía: Se usa el ejemplo de los correos electrónicos de spam. Los filtros de spam buscan palabras clave como "gratis", "descuento" o "haz clic aquí" sin considerar el contexto, lo que puede ocasionar errores, pero permite clasificar grandes cantidades de correos de manera eficiente. El algoritmo considera estas palabras como características independientes y calcula la probabilidad de que un correo sea spam en función de la presencia de estas palabras.
7. K-Nearest Neighbors (KNN)
Este algoritmo de aprendizaje supervisado predice la etiqueta de un punto de datos desconocido utilizando sus K vecinos más cercanos, donde K es un parámetro que representa el número de vecinos a considerar.
Analogía: El autor usa el ejemplo de elegir un restaurante nuevo. Supongamos que preguntas a varios amigos por recomendaciones (vecinos en KNN) y cada uno te sugiere su restaurante favorito. El restaurante que reciba más votos es el que eliges para visitar, de manera similar a cómo KNN toma la decisión basada en la mayoría de los vecinos cercanos.
8. K-means
K-means es un algoritmo de aprendizaje no supervisado que agrupa los puntos de datos en clústeres en función de su posición. El algoritmo inicializa centroides aleatoriamente y luego asigna cada punto de datos al clúster más cercano. Posteriormente, ajusta los centroides en función del promedio de los puntos en cada clúster, repitiendo el proceso hasta que los centroides no cambian más.
Analogía: Se ilustra con un ejemplo de una comunidad de lectura que tiene que formar tres grupos de 18 estudiantes. Inicialmente, los estudiantes se asignan aleatoriamente a tres grupos. En la segunda iteración, los estudiantes se reasignan en función de sus intereses, y después de varias rondas de reajuste, se forman finalmente los grupos con personas de intereses similares.
9. Análisis de componentes principales (PCA)
El PCA es un algoritmo de aprendizaje no supervisado que reduce la dimensionalidad de los datos al identificar las características más importantes y mapear los datos a un espacio de menor dimensión.
Analogía: Se compara con el proceso de hacer una maleta para viajar. Si tienes solo una maleta y muchos artículos, comienzas por empacar los artículos más importantes y luego tratas de comprimir o eliminar los menos importantes para que quepan. De manera similar, PCA identifica las características más relevantes de los datos y comprime o elimina las menos importantes.
10. Gradient Boosting
Gradient Boosting es un algoritmo de aprendizaje de conjunto que combina varios modelos débiles para crear un modelo fuerte. Funciona de manera iterativa, donde cada modelo nuevo trata de corregir los errores del modelo anterior, mejorando así el rendimiento general.
Analogía: El autor lo compara con el proceso de mejorar en una materia académica. Al principio, puedes tener dificultades en un examen, pero con cada nueva prueba, trabajas en tus errores y en las áreas en las que no tienes un buen entendimiento. Este proceso iterativo mejora tu desempeño general en la materia, de manera similar a cómo el Gradient Boosting refina el modelo con cada iteración.
Mehreen cierra su artículo expresando su aprecio por el uso de analogías para explicar conceptos complejos y esperando que los lectores encuentren útil este enfoque. Las analogías presentadas hacen que los algoritmos de machine learning sean más fáciles de entender, especialmente para quienes se inician en este campo. Al vincular situaciones cotidianas con algoritmos complejos, se elimina parte de la abstracción y se fomenta una mayor comprensión y curiosidad para aplicarlos a problemas del mundo real.