Datos de entrenamiento y prueba

Los datos de entrenamiento y prueba son comunes para los algoritmos de aprendizaje supervisado. Dado un conjunto de datos, se divide en conjunto de entrenamiento y conjunto de prueba.

En Machine Learning, esto se aplica a los algoritmos de aprendizaje supervisado.

Datos de entrenamiento y prueba

En el mundo real, tenemos todo tipo de datos, como datos financieros o datos de clientes.

Un algoritmo debe hacer nuevas predicciones basadas en nuevos datos.

Puede simular esto dividiendo el conjunto de datos en datos de entrenamiento y prueba.

Ejemplo de código datos de entrenamiento

El módulo sklearn viene con algunos conjuntos de datos. Uno de estos conjuntos de datos es el conjunto de datos del iris.
Cargamos estos datos usando el método load_iris() y luego obtenemos los datos y las etiquetas (clase de flor).

Luego, los datos se dividen aleatoriamente utilizando el método train_test_split.
Como parámetros especificamos train_size y test_size, ambos al 50%.

 
from sklearn.datasets import load_iris
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split


iris = load_iris()
X, y = iris.data, iris.target


train_X, test_X, train_y, test_y = train_test_split(X, y, 
                                                    train_size=0.5,
                                                    test_size=0.5,
                                                    random_state=123)
print("Labels for training and testing data")
print(train_y)
print(test_y)

También te puede interesar estos artículos sobre Machine Learning:

Con la pandemia, la importancia de la experiencia del usuario ha aumentado exponencialmente. Lo que antes se reducía a dar ...
Este es el top 10 de empresas internacionales que utilizaron la combinación de estas dos tecnologías para mejorar su gestión ...
La Inteligencia Artificial es una herramienta que está cobrando cada vez más importancia en nuestros procesos y desarrollo de estrategias ...
La visión artificial está en constante evolución, en parte impulsada por los avances en Inteligencia Artificial (IA) y la optimización ...
Establecer una lista de los principales algoritmos de minería de datos no es fácil debido al hecho de que todos ...
En este articulo te mostrare las Bibliotecas python machine learning que debes conocer. Debido a su simplicidad, Python se considera ...

¿ Te ayudo esta publicación Datos de entrenamiento y prueba?
⬇️ Tu ayuda compartiendo es invaluable.⬇️

9 comentarios en «Datos de entrenamiento y prueba»

  1. ¡Interesante discusión sobre la importancia de separar los datos de entrenamiento y prueba! ¿Qué opinan? 🤔

  2. ¿Qué opinan de la eficacia de los datos de entrenamiento y prueba en el ejemplo de código?

  3. ¿Por qué no usar datos de entrenamiento y prueba diferentes para evitar el sobreajuste?

  4. ¿Y si intercambiamos los datos de entrenamiento y prueba? ¿Cambiaría el resultado? 🤔

  5. ¿Y si mezclamos datos de entrenamiento y prueba para un modelo más robusto? 🤔

  6. ¿Por qué no usar datos de entrenamiento y prueba reales en lugar de ejemplos? 🤔🤓

  7. ¡Interesante artículo! ¿Alguien más cree que los datos de entrenamiento pueden ser engañosos?

    • ¡Totalmente de acuerdo! Los datos de entrenamiento pueden ser sesgados y no siempre representan la realidad. Es crucial cuestionar su validez y buscar fuentes alternativas para obtener una visión más objetiva. ¡Excelente punto de discusión!

  8. ¿Por qué no usar datos de entrenamiento y prueba para mejorar algoritmos? 🤔

Los comentarios están cerrados.