Gradient Boosting Machine en python

Uno de los más apreciados es Gradient Boosting Machine. El algoritmo de aumento de gradiente o GBM se puede explicar en relación con el algoritmo AdaBoost.

El impulso se explica como una forma de convertir a los alumnos débiles en alumnos fuertes.

AdaBoost frente a aumento de gradiente

El algoritmo AdaBoost comienza con el entrenamiento de un árbol de decisión para el cual cada observación tiene el mismo peso. Después de analizar y evaluar el primer árbol, aumentamos el peso de aquellas observaciones que son difíciles de clasificar y disminuimos el peso de aquellas que son fáciles de clasificar.

El segundo árbol se establece sobre estos datos ponderados. La idea central es impulsar las predicciones del primer árbol.

Gradient Boosting simplemente enseña varios modelos de forma gradual y secuencial. La principal diferencia entre AdaBoost y Gradient Boosting Algorithm radica en la forma en que los dos algoritmos señalan las deficiencias de los árboles de decisión.

AdaBoost usa un punto de datos de alto peso, mientras que el aumento de gradiente emplea gradientes en la función de pérdida. La función de pérdida se suele encontrar en este tipo de machine learning y se refiere al hecho de que identifica qué tan adecuados son los coeficientes de un modelo que se ajusta a ciertos datos.

Entonces, si desea entrenar un modelo GBM en R, deberá utilizar una biblioteca GBM. El primer paso es mencionar la fórmula, que incluirá su respuesta y las variables predictoras. Tenga en cuenta que si no se especifica ningún dato, el GBM intentará adivinar. Finalmente, mencionará los datos y el argumento n.trees, que llevará al modelo GBM a asumir 100 árboles, una estimación adecuada del rendimiento de GBM.

El modelo GBM le indicará cuántos árboles o iteraciones se utilizaron en la ejecución que ha iniciado. Además, dependiendo de la importancia de la variable, el GBM subrayará si alguna de las variables predictoras tuvo o no una influencia nula en el patrón.

Al final, la función predict.gbm() permitirá la generación de predicciones fuera de los datos. Para esta parte, deberá especificar el número de árboles debido a que, de lo contrario, la predicción no funcionará.

En pocas palabras, el propósito de cualquier tipo de ejercicio de machine learning es evaluar las predicciones y medir el rendimiento del modelo.

Un algoritmo de aumento de gradiente involucra tres elementos principales: una función de pérdida que se optimizará, un alumno débil para hacer predicciones y un modelo aditivo para que los alumnos débiles minimicen la función de pérdida. Este es un algoritmo útil que puede sobreajustar un conjunto de datos de entrenamiento rápidamente.

Te recomiendo mas entradas sobre Machine Learning:

El árbol de decisión es uno de los algoritmos de clasificación más simples y populares para aprender, comprender e interpretar ...
Los k-nearest neighbors o simplemente el algoritmo KNN representa una herramienta de machine learning supervisado fácil de usar que puede ...
Queremos compartir contigo algunos datos para que puedas aprender más sobre la Inteligencia Artificial. Te explicamos en detalle la diferencia ...
Podemos hacer que la computadora hable con Python. Dada una cadena de texto, pronunciará las palabras escritas en inglés. Este ...
Una red profunda utiliza una serie de capas de unidades de procesamiento que extraen y transforman recursos. Pongamos un ejemplo ...
¿Qué es el machine learning? La palabra 'Máquina' en Machine Learning significa computadora, como era de esperar. Entonces, ¿cómo aprende ...

¿ Te pareció de utilidad este articulo Aumento de gradiente?
⬇️ Tu ayuda compartiendo es invaluable.⬇️