Pular para o conteúdo principal

Tendo Conversas

Uma vez que um modelo está carregado, você pode começar a conversar.

Enviando Mensagens

  1. Digite sua mensagem na caixa de entrada
  2. Pressione Enter ou clique em Enviar
  3. Aguarde o modelo responder
  4. Continue a conversa

Contexto da Conversa

O chat mantém o histórico de conversa:
  • Cada mensagem que você envia inclui o contexto anterior
  • O modelo “lembra” do que você discutiu
  • Conversas mais longas usam mais memória

Janela de Contexto

Os modelos têm um comprimento máximo de contexto:
ModeloComprimento de Contexto
Llama 3.2 (1B/3B)128K tokens
Llama 3.1128K tokens
Mistral 7B v0.332K tokens
Gemma 28K tokens
Qwen 2.5128K tokens
Os comprimentos de contexto variam conforme a versão do modelo. Verifique o card do modelo no Hugging Face para especificações exatas.
Quando o contexto se enche, as mensagens mais antigas podem ser descartadas.

Dicas de Conversa

Para Testar Modelos Fine-tuned

Teste com prompts semelhantes aos seus dados de treinamento:
Training data: Customer support conversations
Test prompt: "I can't log into my account"

Training data: Code generation
Test prompt: "Write a Python function to sort a list"

Para Avaliar Qualidade

Faça perguntas que revelem as capacidades do modelo:
  • Factual: “What is the capital of France?”
  • Raciocínio: “If A > B and B > C, is A > C?”
  • Criativo: “Write a haiku about programming”
  • Específico do domínio: Perguntas do seu domínio de fine-tuning

Para Encontrar Problemas

Teste casos extremos:
  • Entradas muito curtas (“Hi”)
  • Entradas muito longas
  • Caracteres ou formatação incomuns
  • Perguntas fora do domínio de treinamento
  • Tentativas de confundir o modelo

Limpando o Histórico

Para começar do zero:
  • Procure o botão “Clear” ou “New Chat”
  • Ou recarregue a página
Isso é útil quando:
  • Testando cenários diferentes
  • O contexto fica muito longo
  • Iniciando uma nova demonstração

Conversas Multi-turno

O modelo vê a conversa completa:
User: What's 2 + 2?
Assistant: 4

User: And if we add 3 more?
Assistant: That would be 7 (4 + 3 = 7)
A segunda resposta usa o contexto da primeira troca.

Padrões Comuns

Teste de Pergunta-Resposta

User: [Question]
Assistant: [Answer]
User: Can you explain that differently?
Assistant: [Reformulated answer]

Seguimento de Instruções

User: Write a poem about cats. Make it exactly 4 lines.
Assistant: [Poem]
User: Now make it about dogs instead
Assistant: [Modified poem]

Interpretação de Papéis

User: You are a helpful customer service agent. A customer says: "My order is late"
Assistant: [Response in character]

Próximos Passos