Tu Primer Modelo de IA

Entrenemos un modelo simple de clasificación de texto que puede detectar sentimiento positivo vs negativo en texto. Este tutorial toma aproximadamente 10 minutos y funciona en cualquier computadora.

¿Nuevo en AI Training? Consulta la Guía del Asistente Interactivo para un tutorial más detallado, incluyendo cómo elegir modelos, entender tamaños de datasets y usar comandos del asistente.

Antes de Comenzar

Asegúrate de haber instalado AI Training. Deberías poder ejecutar:

aitraining --version

Si aún no lo has instalado, la forma más rápida es:

# Instala uv si no lo tienes
curl -LsSf https://astral.sh/uv/install.sh | sh  # Mac/Linux
# o
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"  # Windows

# Luego instala AI Training
uv pip install aitraining torch torchvision torchaudio

Elige Tu Camino

Mostraremos la misma tarea de dos formas. Elige la que te resulte más cómoda:

Asistente Interactivo
Línea de Comandos
API de Python

Usando el Asistente Interactivo

1. Inicia el Asistente

Abre tu terminal y ejecuta:

aitraining

El asistente interactivo te guía a través de la configuración.

2. Selecciona el Tipo de Tarea

Elige Text Classification del menú.

3. Prepara Tus Datos

Crea un archivo CSV simple llamado reviews.csv:

text,label
"This product is amazing! Best purchase ever.",positive
"Terrible quality. Complete waste of money.",negative
"Great service and fast delivery.",positive
"Broken on arrival. Very disappointed.",negative
"Exceeded my expectations!",positive
"Would not recommend to anyone.",negative

4. Sigue las Indicaciones

El asistente preguntará por:

Data path: Ingresa ./reviews.csv
Model: Elige bert-base-uncased (o elige de los modelos populares)
Text column: Ingresa text
Label column: Ingresa label
Output directory: Ingresa ./my-sentiment-model

Comandos del Asistente:

:help - Obtén ayuda para el paso actual
:back - Regresa al paso anterior
:exit - Cancela y sale
:search <query> - Busca modelos/datasets
:sort <option> - Ordena por trending, downloads, likes

5. Inicia el Entrenamiento

Confirma tus configuraciones y el entrenamiento comienza. Observa el progreso en la terminal.

6. Prueba con Chat

Después del entrenamiento, prueba tu modelo:

aitraining chat

Abre tu navegador en localhost:7860 y prueba tu modelo.

Usando la CLI

1. Prepara Tus Datos

Crea un archivo llamado train.csv:

text,label
"This product is amazing! Best purchase ever.",positive
"Terrible quality. Complete waste of money.",negative
"Great service and fast delivery.",positive
"Broken on arrival. Very disappointed.",negative
"Exceeded my expectations!",positive
"Would not recommend to anyone.",negative

2. Entrena el Modelo

Ejecuta este comando:

aitraining text-classification \
  --model bert-base-uncased \
  --data-path train.csv \
  --text-column text \
  --target-column label \
  --output-dir ./my-sentiment-model \
  --epochs 3

Qué significa cada parte:

text-classification: El tipo de tarea
--model: Qué modelo pre-entrenado usar como punto de partida
--data-path: Tu archivo de datos de entrenamiento
--text-column: Qué columna tiene el texto
--target-column: Qué columna tiene las etiquetas
--output-dir: Dónde guardar el modelo entrenado
--epochs: Cuántas rondas de entrenamiento

3. Observa el Entrenamiento

Verás una salida como:

Loading model bert-base-uncased...
Processing data...
Training started...
Epoch 1/3: loss=0.65, accuracy=0.67
Epoch 2/3: loss=0.42, accuracy=0.83
Epoch 3/3: loss=0.31, accuracy=0.92
Model saved to ./my-sentiment-model

4. Prueba Tu Modelo

aitraining predict \
  --model-path ./my-sentiment-model \
  --text "This is absolutely fantastic!"

Salida:

Prediction: positive (confidence: 0.94)

Usando Python

1. Crea un Script de Python

Crea un archivo llamado train_sentiment.py:

from aitraining import TextClassification
import pandas as pd

# Create training data
data = {
    'text': [
        "This product is amazing! Best purchase ever.",
        "Terrible quality. Complete waste of money.",
        "Great service and fast delivery.",
        "Broken on arrival. Very disappointed.",
        "Exceeded my expectations!",
        "Would not recommend to anyone."
    ],
    'label': [
        'positive', 'negative', 'positive',
        'negative', 'positive', 'negative'
    ]
}

# Save as CSV
df = pd.DataFrame(data)
df.to_csv('train.csv', index=False)

# Configure training
trainer = TextClassification(
    model="bert-base-uncased",
    data_path="train.csv",
    text_column="text",
    target_column="label",
    output_dir="./my-sentiment-model",
    epochs=3,
    batch_size=8
)

# Start training
print("Starting training...")
trainer.train()

# Test the model
test_texts = [
    "This is absolutely fantastic!",
    "Complete waste of time and money."
]

predictions = trainer.predict(test_texts)
for text, pred in zip(test_texts, predictions):
    print(f"Text: {text}")
    print(f"Prediction: {pred['label']} (confidence: {pred['score']:.2f})\n")

2. Ejecuta el Script

python train_sentiment.py

3. Usa Tu Modelo Más Tarde

from aitraining import load_model

# Load your trained model
model = load_model("./my-sentiment-model")

# Make predictions
result = model.predict("Best product ever!")
print(result)  # {'label': 'positive', 'score': 0.95}

¿Qué Acaba de Pasar?

Has completado exitosamente:

Preparaste datos - Creaste ejemplos para que la IA aprenda
Configuraste el entrenamiento - Seleccionaste un modelo y configuraciones
Entrenaste un modelo - La IA aprendió patrones de tus ejemplos
Probaste predicciones - Verificaste que el modelo funciona en texto nuevo
Guardaste el modelo - Puedes usarlo en cualquier momento sin reentrenar

Entendiendo los Resultados

Tu modelo aprendió a:

Reconocer palabras y frases positivas
Identificar patrones de sentimiento negativo
Hacer predicciones en texto que no ha visto antes

Con solo 6 ejemplos, obtuviste un modelo funcional. Con más datos (cientos o miles de ejemplos), la precisión mejora significativamente.

Próximos Pasos Comunes

Agrega Más Datos

Más ejemplos = mejor precisión. Intenta agregar 50-100 ejemplos por categoría.

Prueba Diferentes Modelos

Experimenta con diferentes modelos base como distilbert-base-uncased (más rápido) o roberta-base (más preciso).

Ajusta Configuraciones

Ajusta epochs, learning rate y batch size para mejores resultados.

Despliega Tu Modelo

Aprende cómo servir tu modelo como API o integrarlo en aplicaciones.

Prueba Otras Tareas

Ahora que entiendes lo básico, prueba estas:

Language Generation - Entrena un chatbot con ejemplos de conversación
Image Classification - Clasifica imágenes en categorías
Named Entity Recognition - Extrae nombres, lugares, fechas del texto
Translation - Convierte entre idiomas

Solución de Problemas

El entrenamiento es muy lento

Reduce batch size a 4 o 2
Usa un modelo más pequeño como distilbert
Asegúrate de usar GPU si está disponible

Las predicciones del modelo son incorrectas

Agrega más ejemplos de entrenamiento
Asegúrate de que las etiquetas sean consistentes
Intenta entrenar por más epochs
Verifica si tus datos están balanceados

Errores de memoria agotada

Reduce batch size
Usa un modelo más pequeño
Habilita gradient checkpointing
Usa LoRA para entrenamiento eficiente

¿Qué Sigue?

Entendiendo AI Training - Aprende cómo funciona el entrenamiento
Eligiendo Tu Interfaz - Comparación detallada de UI, CLI y API
Tipos de Modelos - Explora diferentes arquitecturas de modelos
Técnicas Avanzadas - Aprende sobre DPO, ORPO y más

Consejo Pro: Comienza con el asistente interactivo (aitraining) para entender los conceptos, luego pasa a CLI para automatización, y prueba tus modelos con la interfaz de Chat (aitraining chat).

Comenzando

Fundamentos de Entrenamiento IA

Conceptos Básicos

Selección de Interfaz

Inicio Rápido

Tu Primer Modelo de IA

Antes de Comenzar

Elige Tu Camino

Usando el Asistente Interactivo

1. Inicia el Asistente

2. Selecciona el Tipo de Tarea

3. Prepara Tus Datos

4. Sigue las Indicaciones

5. Inicia el Entrenamiento

6. Prueba con Chat

Usando la CLI

1. Prepara Tus Datos

2. Entrena el Modelo

3. Observa el Entrenamiento

4. Prueba Tu Modelo

Usando Python

1. Crea un Script de Python

2. Ejecuta el Script

3. Usa Tu Modelo Más Tarde

¿Qué Acaba de Pasar?

Entendiendo los Resultados

Próximos Pasos Comunes

Agrega Más Datos

Prueba Diferentes Modelos

Ajusta Configuraciones

Despliega Tu Modelo

Prueba Otras Tareas

Solución de Problemas

¿Qué Sigue?

Comenzando

Fundamentos de Entrenamiento IA

Conceptos Básicos

Selección de Interfaz

​Tu Primer Modelo de IA

​Antes de Comenzar

​Elige Tu Camino

​Usando el Asistente Interactivo

​1. Inicia el Asistente

​2. Selecciona el Tipo de Tarea

​3. Prepara Tus Datos

​4. Sigue las Indicaciones

​5. Inicia el Entrenamiento

​6. Prueba con Chat

​Usando la CLI

​1. Prepara Tus Datos

​2. Entrena el Modelo

​3. Observa el Entrenamiento

​4. Prueba Tu Modelo

​Usando Python

​1. Crea un Script de Python

​2. Ejecuta el Script

​3. Usa Tu Modelo Más Tarde

​¿Qué Acaba de Pasar?

​Entendiendo los Resultados

​Próximos Pasos Comunes

Agrega Más Datos

Prueba Diferentes Modelos

Ajusta Configuraciones

Despliega Tu Modelo

​Prueba Otras Tareas

​Solución de Problemas

​¿Qué Sigue?

Tu Primer Modelo de IA

Antes de Comenzar

Elige Tu Camino

Usando el Asistente Interactivo

1. Inicia el Asistente

2. Selecciona el Tipo de Tarea

3. Prepara Tus Datos

4. Sigue las Indicaciones

5. Inicia el Entrenamiento

6. Prueba con Chat

Usando la CLI

1. Prepara Tus Datos

2. Entrena el Modelo

3. Observa el Entrenamiento

4. Prueba Tu Modelo

Usando Python

1. Crea un Script de Python

2. Ejecuta el Script

3. Usa Tu Modelo Más Tarde

¿Qué Acaba de Pasar?

Entendiendo los Resultados

Próximos Pasos Comunes

Prueba Otras Tareas

Solución de Problemas

¿Qué Sigue?