K-nearest neighbors

Los k-nearest neighbors o simplemente el algoritmo KNN representa una herramienta de machine learning supervisado fácil de usar que puede ayudarlo a resolver problemas de clasificación y regresión.

Entonces, ¿qué significa realmente un algoritmo KNN? Bueno, un algoritmo de machine learning supervisado representa una herramienta que depende de los datos de entrada etiquetados para aprender una función que conduce a una salida precisa cuando se le ofrecen nuevos datos.

Clasificación

Los problemas de clasificación tienen un cierto valor como salida. Como ejemplo, he likes cheese on his sandwich contra he does not like cheese on his sandwich son valores discretos. Considera lo siguiente:

A la edad le gusta el queso en un sándwich

32 1
12 0
27 1
68 1
76 1
20 0

Entonces, con este ejemplo en mente, imagínelo como un ejemplo simple de cómo se ven los datos de clasificación.

Así, tenemos un predictor, la edad y una etiqueta. Con estos datos podemos establecer si a alguien le gusta o no el queso en función de su edad.

Regresión

En otras palabras, hacemos uso del predictor para predecir una etiqueta.

Por otro lado, un problema de regresión se refiere a un número real como salida. Toma en cuenta este ejemplo:

Altura (pulgadas) Peso (libras)

65.78 112.99
69.80 141.49
71.52 136.49

Los datos que necesitará para un análisis de regresión serán similares a los del ejemplo anterior. Por lo tanto, un análisis de regresión utilizará una variable independiente y una variable dependiente. Para nuestro ejemplo, la variable independiente es la altura, mientras que la variable dependiente es el peso.

El machine learning supervisado intenta reconocer una función que nos permitirá hacer predicciones con la ayuda de nuevos datos no etiquetados, mientras que el aprendizaje no supervisado intenta obtener una comprensión básica de la estructura de los datos para proporcionar más información sobre los datos mencionados.

K-nearest neighbors

El principio básico sobre el que funciona el algoritmo KNN es el hecho de que supone que existen cosas similares muy próximas entre sí.

La idea de similitud también se conoce como distancia o proximidad, se puede establecer haciendo uso de matemáticas básicas para calcular la distancia entre puntos. Pero tenga en cuenta que hay una variedad de formas en las que se puede establecer la distancia, mientras que la más popular es la distancia euclidiana.

¿Cómo funciona el algoritmo KNN?

  • Los datos se cargan
  • Comience K a su número preferido de vecinos
  • Para cada ejemplo en sus datos:
    • Establecer la distancia entre el ejemplo de consulta y el ejemplo disponible de los datos
    • Proporcionar la distancia y el índice de ejemplo a una colección.
    • Ordenar los datos en orden ascendente según las distancias
    • Seleccione la entrada K principal de la colección organizada
    • Si se produce una regresión, devuelva la media de las etiquetas K
    • Si la clasificación, devuelve el modo de las etiquetas K

Una gran desventaja de este algoritmo es el hecho de que si el volumen de datos aumenta, el algoritmo se vuelve significativamente más lento, lo que lo hace inadecuado para situaciones en las que las predicciones deben realizarse a una velocidad mayor. Sin embargo, KNN es útil para resolver problemas que tienen soluciones que se basan en descubrir objetos similares.

Aquí tienes mas publicaciones sobre Machine Learning:

El aprendizaje automático o aprendizaje automático es uno de los campos que participan en el desarrollo de la inteligencia artificial ...
Los clasificadores de machine learning se pueden usar para predecir. Dados datos de ejemplo (medidas), el algoritmo puede predecir la ...
Las diferencias entre Estadística y Machine Learning. Las cosas pueden tener similitudes y diferencias cuando no son iguales. Eso es ...
Dados los documentos de texto, podemos agruparlos automáticamente: agrupación de texto. Usaremos KMeans, que es un algoritmo de machine learning ...
Quería comparar el rendimiento de una CPU y una GPU que se venden en el mercado. Para realizar esta comparación, ...
Cuando se trata de machine learning, debe considerar y comprender las diferencias entre los dos métodos principales utilizados: machine learning ...

¿ Te pareció de utilidad este articulo K-nearest neighbors?
⬇️ Tu apoyo compartiendo me ayuda bastante.⬇️