Pular para o conteúdo principal

Tipos de Tarefas de Treinamento

O AI Training suporta muitas tarefas diferentes. Cada tarefa é otimizada para tipos específicos de problemas que você quer resolver.

Tarefas de Texto

Text Classification

O que faz: Classifica texto em categorias que você define. Exemplos do mundo real:
  • Detecção de spam em email
  • Sentimento de feedback do cliente (feliz/infeliz)
  • Roteamento de tickets de suporte
  • Moderação de conteúdo
  • Detecção de idioma
O que você precisa:
  • Amostras de texto
  • Rótulos de categoria para cada amostra
  • Pelo menos 50 exemplos por categoria (mais é melhor)
Formato de dados de exemplo:
text,label
"Great product, highly recommend!",positive
"Terrible experience, waste of money",negative
"The item arrived damaged",negative
"Excellent customer service",positive

Token Classification (NER)

O que faz: Rotula palavras ou frases específicas em texto. Exemplos do mundo real:
  • Extrair nomes, datas, localizações de documentos
  • Identificar menções de produtos em avaliações
  • Encontrar termos médicos em notas clínicas
  • Destacar cláusulas importantes de contratos
  • Marcar partes do discurso
O que você precisa:
  • Texto com entidades marcadas
  • Rótulos em formato BIO (Beginning, Inside, Outside)
  • Centenas de exemplos anotados
Example data format:
John B-PERSON
Smith I-PERSON
visited O
New B-LOCATION
York I-LOCATION
yesterday B-DATE

Sequence to Sequence

O que faz: Transforma um texto em outro. Exemplos do mundo real:
  • Tradução de idiomas
  • Resumo de texto
  • Resposta a perguntas
  • Correção de texto
  • Paráfrase
O que você precisa:
  • Texto de entrada
  • Texto de saída desejado
  • Pares de exemplos entrada-saída
Example data format:
input_text,target_text
"The quick brown fox jumps over the lazy dog","Le renard brun rapide saute par-dessus le chien paresseux"
"Hello, how are you?","Bonjour, comment allez-vous?"

Text Generation (LLM Fine-tuning)

O que faz: Ensina modelos de linguagem novos conhecimentos ou comportamentos. Exemplos do mundo real:
  • Chatbots personalizados
  • Assistentes específicos de domínio
  • Geração de código
  • Escrita criativa
  • Documentação técnica
O que você precisa:
  • Exemplos de conversação ou pares instrução-resposta
  • Opcional: Dados de preferência para RLHF
  • Pode funcionar com apenas 100 exemplos
Formato de conversa de exemplo:
{
  "messages": [
    {"role": "user", "content": "What is photosynthesis?"},
    {"role": "assistant", "content": "Photosynthesis is the process plants use to convert sunlight into energy..."}
  ]
}

Tarefas de Imagem

Image Classification

O que faz: Identifica o que há em uma imagem. Exemplos do mundo real:
  • Inspeção de qualidade de produtos
  • Diagnóstico de imagens médicas
  • Identificação de vida selvagem
  • Classificação de tipo de documento
  • Reconhecimento de expressão facial
O que você precisa:
  • Imagens (JPG, PNG)
  • Rótulo de categoria para cada imagem
  • Pelo menos 100 imagens por categoria
Folder structure:
data/
  cats/
    cat1.jpg
    cat2.jpg
  dogs/
    dog1.jpg
    dog2.jpg

Object Detection

O que faz: Encontra e localiza múltiplos objetos em imagens. Exemplos do mundo real:
  • Contagem de inventário
  • Monitoramento de segurança
  • Condução autônoma
  • Detecção de defeitos
  • Contagem de pessoas
O que você precisa:
  • Imagens com caixas delimitadoras
  • Rótulos para cada caixa
  • Anotações em formato COCO ou YOLO

Tarefas de Dados Estruturados

Tabular Classification

O que faz: Prevê categorias de dados tipo planilha. Exemplos do mundo real:
  • Previsão de churn de clientes
  • Detecção de fraude
  • Diagnóstico de doenças
  • Aprovação de crédito
  • Previsão de falha de equipamento
O que você precisa:
  • CSV com features e rótulos
  • Colunas numéricas e categóricas
  • Dados limpos e pré-processados
Example data:
age,income,credit_score,approved
25,45000,720,yes
35,65000,650,no
42,85000,780,yes

Tabular Regression

O que faz: Prevê valores contínuos de dados estruturados. Exemplos do mundo real:
  • Previsão de preço de casas
  • Previsão de vendas
  • Estimativa de consumo de energia
  • Previsão de preço de ações
  • Estimativa de tempo de entrega
O que você precisa:
  • CSV com features e valores alvo
  • Coluna alvo numérica
  • Dados históricos

Métodos Avançados de Treinamento

Supervised Fine-Tuning (SFT)

Treinamento padrão com exemplos e respostas corretas. Use quando: Você tem dados rotulados de boa qualidade.

DPO (Direct Preference Optimization)

Treine modelos usando comparações de preferência. Use quando: Você tem exemplos de saídas boas vs ruins. Data format:
{
  "prompt": "Write a greeting",
  "chosen": "Hello! How can I help you today?",
  "rejected": "sup"
}

ORPO (Odds Ratio Preference Optimization)

Similar ao DPO mas com treinamento mais estável. Use quando: Treinamento DPO está instável ou com overfitting.

Reward Modeling

Treine um modelo para pontuar saídas. Use quando: Construindo um modelo de recompensa para RLHF.

PPO (Proximal Policy Optimization)

Aprendizado por reforço a partir de feedback. Use quando: Você tem um modelo de recompensa e quer otimizar contra ele.

Guia de Seleção de Tarefa

Com Base em Seus Dados

Se você tem…Escolha esta tarefa
Texto + categoriasText Classification
Texto com rótulos de entidadesToken Classification
Pares texto entrada/saídaSequence to Sequence
ConversasLLM Fine-tuning
Imagens + rótulosImage Classification
Dados de planilhaTabular Classification/Regression

Com Base em Seu Objetivo

Se você quer…Escolha esta tarefa
Classificar coisas em categoriasClassification
Extrair informaçõesToken Classification
Transformar textoSequence to Sequence
Criar um chatbotLLM Fine-tuning
Prever númerosRegression
Encontrar objetosObject Detection

Com Base em Dificuldade

Mais fácil para começar:
  1. Text Classification
  2. Image Classification
  3. Tabular Classification
Dificuldade média:
  1. Token Classification
  2. Sequence to Sequence
  3. LLM Fine-tuning (SFT)
Avançado:
  1. Treinamento DPO/ORPO
  2. Object Detection
  3. PPO/RLHF

Requisitos de Dados

Dados Mínimos Necessários

TarefaMínimo AbsolutoBom Ponto de PartidaQualidade de Produção
Text Classification50 por classe500 por classe5.000+ por classe
Token Classification100 documentos1.000 documentos10.000+ documentos
Seq2Seq100 pares1.000 pares10.000+ pares
LLM Fine-tuning50 exemplos500 exemplos5.000+ exemplos
Image Classification100 por classe1.000 por classe10.000+ por classe
Tabular500 linhas5.000 linhas50.000+ linhas

Qualidade dos Dados Importa

Melhor ter 100 exemplos de alta qualidade que 1.000 ruins:
  • Rótulos precisos
  • Formatação consistente
  • Representativo do uso do mundo real
  • Balanceado entre categorias

Treinamento Multi-Tarefa

Você pode treinar modelos para múltiplas tarefas simultaneamente:

Benefícios

  • Compartilhar conhecimento entre tarefas
  • Uso mais eficiente de dados
  • Implantação de modelo único

Exemplo

Treine um modelo para:
  • Classificar sentimento
  • Extrair entidades
  • Resumir texto
Tudo com o mesmo modelo base.

Configurações Específicas por Tarefa

Tarefas de Texto

  • Max sequence length: Quanto texto processar
  • Tokenizer: Como dividir texto em tokens
  • Special tokens: Marcadores específicos da tarefa

Tarefas de Imagem

  • Image size: Resolução a usar
  • Augmentation: Rotação, inversão, corte
  • Normalization: Escala de valores de pixel

Tarefas Tabulares

  • Feature engineering: Criar novas colunas
  • Scaling: Normalizar valores numéricos
  • Encoding: Lidar com variáveis categóricas

Métricas de Avaliação

Diferentes tarefas usam diferentes métricas:
TarefaMétricas Comuns
ClassificationAccuracy, F1, Precision, Recall
Token ClassificationF1 em nível de entidade, Accuracy de token
Seq2SeqBLEU, ROUGE, BERTScore
GenerationPerplexity, Avaliação humana
RegressionMSE, MAE, R²
Object DetectionmAP, IoU

Combinando Tarefas

Abordagem de Pipeline

Encadeie tarefas:
  1. Classification → Roteie para modelo especializado
  2. NER → Extraia entidades → Gere resposta
  3. Traduza → Resuma → Classifique sentimento

Tarefas Multi-Modais

Combine diferentes tipos de dados:
  • Imagem + Texto → Visual QA
  • Áudio + Texto → Reconhecimento de fala
  • Vídeo + Texto → Entendimento de vídeo

Próximos Passos

Pronto para mergulhar mais fundo?