¿Cuántos modelos de machine learning existen?

Los algoritmos de aprendizaje automático se pueden dividir en tres grandes categorías: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo. El aprendizaje supervisado es útil en los casos en que una propiedad (etiqueta) está disponible para un determinado conjunto de datos (conjunto de entrenamiento) pero debe predecirse para otras instancias. El aprendizaje no supervisado es útil en los casos en que el desafío es descubrir relaciones implícitas en un conjunto de datos sin etiquetar (los elementos no están preasignados). El aprendizaje por refuerzo se encuentra entre estos dos extremos: hay alguna forma de retroalimentación disponible para cada paso o acción predictiva, pero no hay una etiqueta precisa o un mensaje de error.

APRENDIZAJE SUPERVISADO

Algoritmos de aprendizaje automático

Para ejecutar tipos o modelos de aprendizaje supervisado, no supervisado o de refuerzo, necesitamos implementar algunos algoritmos.

Aprendizaje no supervisado

A diferencia del aprendizaje supervisado, en el aprendizaje no supervisado tenemos datos que no han sido etiquetados, es decir, no hay un conocimiento a priori, ni una etiqueta para predecir. Este tipo de modelos se basan en grandes cantidades de datos, analizando su estructura y distribución para extraer nuevo conocimiento y agrupar entidades por afinidad (detectando patrones). También se pueden utilizar para reducir la dimensionalidad y simplificar conjuntos de datos.

Los algoritmos de agrupamiento definen una métrica de similitud o distancia que se usa para comparar datos. Se utilizan, por ejemplo, para encontrar clientes con comportamientos similares a los que vender determinados productos o servicios, o para identificar sospechas de acciones fraudulentas.

Aprendizaje supervisado

En el aprendizaje supervisado, la máquina se enseña con el ejemplo. Por lo tanto, el operador proporciona al algoritmo de aprendizaje automático un conjunto de datos conocido que incluye las entradas y salidas deseadas, y el algoritmo debe encontrar un método para determinar cómo llegar a estas entradas y salidas.

Mientras que el operador sabe las respuestas correctas al problema, el algoritmo identifica patrones en los datos, aprende de las observaciones y hace predicciones. El algoritmo hace predicciones y el operador lo corrige, y este proceso continúa hasta que el algoritmo alcanza un alto nivel de precisión y rendimiento.

Aprendizaje automático supervisado y no supervisado

El aprendizaje automático se divide en dos áreas principales: aprendizaje supervisado y aprendizaje no supervisado. Si bien puede parecer que el primero se trata de la predicción asistida por humanos y el segundo no, estos dos conceptos tienen más que ver con lo que queremos hacer con los datos.

Uno de los usos más extendidos del aprendizaje supervisado es hacer predicciones futuras basadas en comportamientos o características que se han visto en datos ya almacenados (datos históricos). El aprendizaje supervisado le permite buscar patrones en datos históricos al relacionar todos los campos con un campo especial llamado campo de destino. Por ejemplo, los correos electrónicos son etiquetados como «spam» o «legítimos» por los usuarios. El proceso de predicción comienza con un análisis de qué características o patrones tienen los correos electrónicos ya etiquetados con las dos etiquetas. Uno podría determinar, por ejemplo, que un correo electrónico no deseado es aquel que proviene de ciertas direcciones IP, y también tiene una cierta proporción de texto/imagen, y también contiene ciertas palabras, y tampoco tiene a nadie en el campo «Para». :» , y más allá (muchos más allá)… Ese sería solo uno de los patrones. Una vez que se determinan todos los patrones (esta fase se denomina “aprendizaje”), los correos electrónicos nuevos que nunca se han marcado como spam o legítimos se comparan con los patrones y se clasifican (predicen) como “spam” o “legítimos” según sus características. .