Algoritmo de k-nearest neighbor versus agrupamiento de k-means

La ciencia de datos se considera uno de los campos más emocionantes en los que podría trabajar debido al hecho de que combina habilidades estadísticas y cuantitativas avanzadas con la capacidad de programación del mundo real.

Hay una multitud de algoritmos disponibles que tenen la capacidad de ayudar a los científicos de datos en sus investigaciones y evaluaciones. Si bien al principio todo puede parecer complicado, comprender mejor los dos algoritmos más utilizados hará que su enfoque del machine learning sea más fluido.

K-means de agrupamiento frente a k-nearest neighbor

Los dos algoritmos más utilizados en el machine learning son el agrupamiento de k-means y el algoritmo de k-nearest neighbor.

A menudo, esos dos se confunden entre sí debido a la presencia del k carta, pero en realidad, esos algoritmos son ligeramente diferentes entre sí.

Por lo tanto, el agrupamiento de K-means representa un algoritmo no supervisado, utilizado principalmente para el agrupamiento, mientras que k-nearest neighbor es un algoritmo de aprendizaje supervisado utilizado para la clasificación.

K-nearest neighbor

Ser un algoritmo de clasificación supervisada, K-nearest neighbor necesitan datos etiquetados para entrenar.

Con los datos proporcionados, k-nearest neighbor puede clasificar datos nuevos y no etiquetados mediante el análisis de los k número de los puntos de datos más cercanos. Así, la variable k se considera un parámetro que establecerá el ingeniero de machine learning.

Por lo tanto, k-means necesita datos de entrenamiento para hacer predicciones.

K-means

Por otro lado, el agrupamiento de K-means representa un algoritmo de agrupamiento no supervisado que necesita datos sin etiquetar para entrenar.

El agrupamiento de K-means es capaz de aprender gradualmente cómo agrupar los puntos no etiquetados en grupos mediante el análisis de la distancia media de dichos puntos. En este caso, la variable k representa el número de conglomerados o grupos diferentes en los que se recopilarán los datos. El algoritmo funciona moviendo los datos de tal manera que se minimiza la función de error.

Diferencias

El algoritmo del vecino más cercano se utiliza principalmente para clasificación y regresión de datos dados cuando el atributo ya se conoce.

Esto representa una gran diferencia entre los dos algoritmos debido al hecho de que el algoritmo de agrupación en clústeres K-means se usa popularmente para escenarios como obtener una comprensión más profunda de la demografía, las tendencias de las redes sociales, la evolución de las estrategias de marketing, etc.

Por lo tanto, la agrupación en clústeres k-nearest neighbor y k-means son algoritmos importantes cuando se trata de machine learning.

Pero cada algoritmo está destinado a tratar con diferentes problemas y proporciona un significado diferente de lo que la variable k representa.

  • k-nearest neighbor representa un algoritmo de clasificación supervisado que dará nuevos puntos de datos de acuerdo con el k número o los puntos de datos más cercanos,
  • mientras que el agrupamiento k-means es un algoritmo de agrupamiento no supervisado que recopila y agrupa datos en k número de agrupaciones.

De todos modos, hay un aspecto común que se puede encontrar en ambos algoritmos: k-nearest neighbor y k-means clustering representan algoritmos basados ​​en la distancia que se basan en una métrica.

También te puede interesar estos artículos sobre Machine Learning:

La neuroevolución es una estrategia para modificar cargas, topologías o conjuntos de sistemas neuronales para familiarizarse con una tarea en ...
Todos los algoritmos de Machine Learning toman datos como entrada, pero lo que quieren lograr es diferente. Recomendado: frameworks de ...
El algoritmo de agrupación en clústeres de KMeans se puede utilizar para agrupar automáticamente los datos observados. Todos sus clustering ...
La pregunta no es fácil de responder, existen herramientas que te permiten crear inteligencia artificial casi sin conocimiento, como Cloud ...
Machine Learning: Máquinas que Aprenden a Aprender. Actualmente, el Machine Learning es una disciplina que tiene innumerables usos y posibilidades ...
¿No estás cansado de pasar páginas y quedarte dormido? Los libros de texto y otros materiales de estudio te proporcionarán ...

¿ Te pareció de utilidad este articulo Algoritmo de k-nearest neighbor versus agrupamiento de k-means?
⬇️ Me ayudarías mucho si compartes esta entrada.⬇️