El aprendizaje de las matemáticas esenciales para el Machine Learning (ML) puede parecer intimidante, especialmente para quienes no tienen un sólido trasfondo académico en la materia. Marina Wyss, autora del artículo "How To Learn Math for Machine Learning, Fast", comparte su experiencia personal de cómo pasó de no saber lo que era una derivada a convertirse en Applied Scientist en Amazon. Este recorrido se basa en la autoaprendizaje y el uso de recursos gratuitos que ella misma recomienda.
¿Es Necesario Saber Matemáticas para Trabajar en Machine Learning?
La respuesta a esta pregunta depende del rol que se quiera desempeñar. Para puestos orientados a la investigación, como la creación de nuevos algoritmos, el conocimiento profundo de las matemáticas es imprescindible. Sin embargo, para la mayoría de los practicantes de ML que trabajan en la industria, no es esencial conocer todos los detalles matemáticos al principio. Herramientas y bibliotecas como numpy, scikit-learn y TensorFlow permiten implementar modelos sin necesidad de entender completamente conceptos como el descenso de gradiente.
Aunque es posible iniciarse en ML sin un profundo conocimiento matemático, Wyss subraya que este conocimiento resulta útil para diagnosticar problemas o interpretar resultados. Por ejemplo, entender gradientes y funciones de optimización es crucial cuando un modelo no converge. Asimismo, comprender la regresión lineal y problemas como la multicolinealidad evita errores graves al tomar decisiones basadas en datos.
Wyss aconseja empezar practicando y construyendo proyectos prácticos. A medida que surjan problemas en el camino, el aprendizaje matemático se convertirá en una necesidad natural que facilitará la resolución de estos desafíos.
Áreas Matemáticas Fundamentales para Machine Learning
El artículo destaca tres áreas esenciales que todo practicante de ML debería abordar eventualmente:
1. Álgebra Lineal
El álgebra lineal es la base de muchos modelos de ML, especialmente en aprendizaje profundo. Algunos conceptos clave incluyen:
- Matrices y Vectores: Estos son fundamentales para representar datos y operaciones como suma, multiplicación y productos punto.
- Determinantes e Inversas: Útiles en problemas de optimización y para resolver sistemas de ecuaciones.
- Valores y Vectores Propios: Esenciales para entender la varianza en datos y técnicas como el Análisis de Componentes Principales (PCA).
- Descomposición Matricial: Métodos como la Descomposición en Valores Singulares (SVD) tienen aplicaciones en sistemas de recomendación, reducción de dimensionalidad y compresión de datos.
2. Cálculo
El cálculo es esencial para comprender cómo los modelos aprenden de los datos. Los conceptos clave incluyen:
- Derivadas y Gradientes: Las derivadas miden cómo cambian las funciones, mientras que los gradientes, como derivadas multidimensionales, impulsan algoritmos de optimización.
- Regla de la Cadena: Fundamental en redes neuronales, ya que explica cómo funciona la retropropagación.
- Optimización Básica: La comprensión de conceptos como mínimos locales, mínimos globales y convexidad ayuda a entender por qué algunos modelos encuentran soluciones óptimas mientras otros no.
3. Estadística y Probabilidad
Estas disciplinas son esenciales para analizar y entender datos. Entre los conceptos destacados están:
- Distribuciones: Familiarizarse con distribuciones como la normal, binomial y uniforme.
- Varianza y Covarianza: La varianza mide la dispersión de los datos, mientras que la covarianza evalúa la relación entre dos variables.
- Teorema de Bayes: Este es crucial para algoritmos como Naive Bayes y para la optimización bayesiana.
- Estimación de Máxima Verosimilitud (MLE): Permite estimar parámetros del modelo maximizando la probabilidad de los datos.
- Muestreo y Probabilidad Condicional: Técnicas útiles para trabajar con subconjuntos de datos y para comprender relaciones entre eventos.
Recursos Recomendados
Wyss recomienda comenzar con recursos visuales e intuitivos antes de abordar libros más avanzados. Entre sus sugerencias destacan:
- Canales de YouTube:
- 3blue1brown: Series como "Essence of Linear Algebra" y "Essence of Calculus" ofrecen explicaciones visuales de alta calidad.
- StatQuest: Explicaciones claras y entretenidas sobre estadística y probabilidad.
- Cursos en Línea:
- Mathematics for Machine Learning (Coursera): Ofrecido por Imperial College London, este curso abarca álgebra lineal, cálculo multivariable y PCA.
- Math for ML Specialization (Coursera): De DeepLearning.AI, este curso incluye álgebra lineal, cálculo y estadística.
- Libros:
- The Mathematics for Machine Learning (Deisenroth et al.): Un recurso integral que conecta conceptos matemáticos con algoritmos de ML.
- Practical Statistics for Data Scientists: Incluye ejemplos de código en Python y R.
- The Manga Guides: Series como The Manga Guide to Calculus o The Manga Guide to Linear Algebra son opciones divertidas para aprender conceptos básicos.
Estrategias de Estudio
Wyss enfatiza la importancia de tener una motivación clara al estudiar matemáticas. Conectar el aprendizaje a metas personales facilita la retención y el compromiso. Entre las estrategias que recomienda están:
- Tomar Notas Personales: Escribir conceptos en palabras propias ayuda a procesar activamente la información.
- Traducir Fórmulas: Explicar fórmulas en lenguaje cotidiano facilita su comprensión.
- Crear un Blog: Resumir conceptos aprendidos en publicaciones ayuda a consolidar el conocimiento y construir un portafolio profesional.
- Usar Múltiples Recursos: Estudiar desde varias fuentes y sintetizar notas mejora la retención.
- Codificar Conceptos: Implementar desde cero algoritmos como descenso de gradiente o regresión logística utilizando numpy es una excelente forma de aplicar los conceptos aprendidos.
El Rol de las Matemáticas en la Búsqueda de Empleo
Finalmente, Wyss aclara que, aunque las matemáticas son importantes, probablemente no serán el factor decisivo para conseguir el primer empleo en ML. En lugar de centrarse exclusivamente en adquirir habilidades matemáticas, recomienda priorizar la construcción de proyectos prácticos que demuestren habilidades técnicas y la capacidad de aplicar conocimientos a problemas del mundo real. A medida que se enfrenten desafíos en el trabajo, el aprendizaje matemático se volverá una necesidad natural, pero no debería ser una barrera para empezar.