¿Cuál es el algoritmo más simple de machine learning?

Los algoritmos de aprendizaje automático se pueden dividir en tres grandes categorías: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo. El aprendizaje supervisado es útil en los casos en que una propiedad (etiqueta) está disponible para un determinado conjunto de datos (conjunto de entrenamiento) pero debe predecirse para otras instancias. El aprendizaje no supervisado es útil en los casos en que el desafío es descubrir relaciones implícitas en un conjunto de datos sin etiquetar (los elementos no están preasignados). El aprendizaje por refuerzo se encuentra entre estos dos extremos: hay alguna forma de retroalimentación disponible para cada paso o acción predictiva, pero no hay una etiqueta precisa o un mensaje de error.

APRENDIZAJE SUPERVISADO

Aprendizaje supervisado

El aprendizaje supervisado se puede utilizar cuando hay conjuntos de datos etiquetados, es decir, se basa en un conocimiento a priori. Por ejemplo, una tienda de ropa tiene registros diarios de datos sobre productos vendidos en los últimos años y también datos meteorológicos diarios para ese período. En este caso seguro que nos interesa entrenar un modelo que, en base a los datos meteorológicos de un día determinado, nos diga cuántas prendas se venderán ese día. Es decir, a través de estos datos históricos (datos de entrenamiento), obtengo una función de mapeo entre las entradas y la salida.

Dentro del aprendizaje supervisado, dependiendo de si la variable a predecir es cuantitativa o cualitativa, existen dos tipos de modelos: de regresión o de clasificación, respectivamente.

Algoritmos de árbol de decisión

Árbol de decisión. Buscará el mejor árbol, equilibrando la posibilidad de ocurrencia y su importancia en cada rama y parte para clasificar un resultado

Modelan la toma de decisiones en base a los valores actuales (reales) de los atributos que nuestros datos tienen. Se utilizan principalmente para clasificar información, ramificar y modelar los posibles caminos tomados y su probabilidad de ocurrencia para mejorar su precisión. Una vez creados, los árboles de decisión se ejecutan muy rápidamente para obtener resultados. Los algoritmos de árbol de decisiones más utilizados son:

Aprendizaje por refuerzo

El aprendizaje por refuerzo se centra en procesos de aprendizaje reglamentados en los que los algoritmos de aprendizaje automático cuentan con un conjunto de acciones, parámetros y valores finales.

A la hora de definir las reglas, el algoritmo de aprendizaje automático intenta explorar diferentes opciones y posibilidades, monitorizando y evaluando cada resultado para determinar cuál es el óptimo.

Algoritmos de regresión

Los algoritmos de regresión se aplican en modelos de aprendizaje automático que buscan estimar y determinar la existencia de relaciones entre variables que forman parte del objeto de estudio.

El análisis de regresión se centra en fijar una variable como dependiente y ver su comportamiento con otra serie de variables y/o variables independientes. Con estos modelos podemos construir un proceso de aprendizaje automático que facilite la predicción de resultados y predicciones.