Tendo Conversas
Uma vez que um modelo está carregado, você pode começar a conversar.Enviando Mensagens
- Digite sua mensagem na caixa de entrada
- Pressione Enter ou clique em Enviar
- Aguarde o modelo responder
- Continue a conversa
Contexto da Conversa
O chat mantém o histórico de conversa:- Cada mensagem que você envia inclui o contexto anterior
- O modelo “lembra” do que você discutiu
- Conversas mais longas usam mais memória
Janela de Contexto
Os modelos têm um comprimento máximo de contexto:| Modelo | Comprimento de Contexto |
|---|---|
| Llama 3.2 (1B/3B) | 128K tokens |
| Llama 3.1 | 128K tokens |
| Mistral 7B v0.3 | 32K tokens |
| Gemma 2 | 8K tokens |
| Qwen 2.5 | 128K tokens |
Os comprimentos de contexto variam conforme a versão do modelo. Verifique o card do modelo no Hugging Face para especificações exatas.
Dicas de Conversa
Para Testar Modelos Fine-tuned
Teste com prompts semelhantes aos seus dados de treinamento:Para Avaliar Qualidade
Faça perguntas que revelem as capacidades do modelo:- Factual: “What is the capital of France?”
- Raciocínio: “If A > B and B > C, is A > C?”
- Criativo: “Write a haiku about programming”
- Específico do domínio: Perguntas do seu domínio de fine-tuning
Para Encontrar Problemas
Teste casos extremos:- Entradas muito curtas (“Hi”)
- Entradas muito longas
- Caracteres ou formatação incomuns
- Perguntas fora do domínio de treinamento
- Tentativas de confundir o modelo
Limpando o Histórico
Para começar do zero:- Procure o botão “Clear” ou “New Chat”
- Ou recarregue a página
- Testando cenários diferentes
- O contexto fica muito longo
- Iniciando uma nova demonstração