¿Qué matemáticas se usan en Deep Learning?

Diariamente me contactan personas que comparten su entusiasmo por sumergirse en el mundo de la ciencia de datos y utilizar técnicas de Machine Learning (Ver explicación simple) para investigar patrones estadísticos y crear productos basados ​​en datos.

Sin embargo, he notado que algunos realmente carecen de la base matemática y la estructura necesaria para obtener resultados útiles.

Álgebra lineal

El álgebra lineal aparece en todas partes, desde transformación de coordenadas, reducción de dimensionalidad, algoritmos de regresión lineal, resolución de sistemas de ecuaciones lineales, entre muchos otros. Aquí los datos se representan mediante ecuaciones lineales, las cuales se presentan en forma de matrices y vectores, por lo que estas representaciones son las que más se trabajan dentro de esta área. Comprender el álgebra lineal lo ayudará a tomar mejores decisiones al desarrollar modelos de aprendizaje automático.

El aprendizaje automático y las estadísticas no son campos muy diferentes, mientras que la teoría de la probabilidad es un marco matemático para representar declaraciones inciertas, proporciona un medio para cuantificar la incertidumbre, así como axiomas para derivar nuevas declaraciones de incertidumbre. Algunas de las teorías estadísticas y probabilísticas fundamentales para Machine Learning son: teorema de Bayes, variables aleatorias, varianza y expectativa, distribuciones estándar, incluyendo Bernoulli, binomial, multinomial, entre otras.

¿Qué es un científico de datos?

Un científico de datos es una persona con formación en matemáticas, estadística y métodos de optimización, con conocimientos en lenguajes de programación y que además tiene experiencia práctica en el análisis de datos reales y el desarrollo de modelos predictivos.

Es importante aclarar que no es necesario tener una especialización en matemáticas puras para hacer proyectos de ciencia de datos. Se puede decir que la ciencia de datos se divide en dos grandes campos de trabajo: investigación y producción.

¿Por qué las matemáticas son tan importantes en el aprendizaje automático?

El aprendizaje automático es un campo que combina varias disciplinas, incluidas la programación, la estadística y la probabilidad, y las matemáticas.

Aunque es posible crear modelos de aprendizaje automático sin conocer sus fundamentos matemáticos y que también sirven para nuestro problema, no cabe duda de que tener un nivel mínimo de matemáticas es muy importante para poder entender cómo funciona el algoritmos que implementamos funcionan y así poder tomar mejores decisiones.