ZippyVendas automaticamente calcula custos para todas as execuções de workflow, fornecendo preços transparentes baseado em uso de modelo de IA e charges de execução. Entender estes custos ajuda você a otimizar workflows e gerenciar seu orçamento efetivamente.
Como os Custos São Calculados
Cada execução de workflow inclui dois componentes de custo:
Taxa Base de Execução: $0.001 por execução
Uso de Modelo de IA: Custo variável baseado no consumo de tokens
modelCost = (inputTokens × inputPrice + outputTokens × outputPrice) / 1,000,000
totalCost = baseExecutionCharge + modelCostPreços de modelos de IA são por milhão de tokens. O cálculo divide por 1,000,000 para obter o custo real. Workflows sem blocos de IA apenas incorrem na taxa base de execução.
Breakdown de Modelo em Logs
Para workflows usando blocos de IA, você pode ver informações de custo detalhadas nos logs:

O breakdown de modelo mostra:
- Uso de Tokens: Contagem de tokens de entrada e saída para cada modelo
- Breakdown de Custo: Custos individuais por modelo e operação
- Distribuição de Modelo: Quais modelos foram usados e quantas vezes
- Custo Total: Custo agregado para toda a execução de workflow
Opções de Preço
Modelos Hospedados - ZippyVendas fornece chaves de API gerenciadas:
OpenAI
| Model | Base Price (Input/Output) | Hosted Price (Input/Output) |
|---|---|---|
| GPT-5.1 | $1.25 / $10.00 | $3.13 / $25.00 |
| GPT-5 | $1.25 / $10.00 | $3.13 / $25.00 |
| GPT-5 Mini | $0.25 / $2.00 | $0.63 / $5.00 |
| GPT-5 Nano | $0.05 / $0.40 | $0.13 / $1.00 |
| GPT-4o | $2.50 / $10.00 | $6.25 / $25.00 |
| GPT-4.1 | $2.00 / $8.00 | $5.00 / $20.00 |
| GPT-4.1 Mini | $0.40 / $1.60 | $1.00 / $4.00 |
| GPT-4.1 Nano | $0.10 / $0.40 | $0.25 / $1.00 |
| o1 | $15.00 / $60.00 | $37.50 / $150.00 |
| o3 | $2.00 / $8.00 | $5.00 / $20.00 |
| o4 Mini | $1.10 / $4.40 | $2.75 / $11.00 |
Anthropic
| Model | Base Price (Input/Output) | Hosted Price (Input/Output) |
|---|---|---|
| Claude Opus 4.5 | $5.00 / $25.00 | $12.50 / $62.50 |
| Claude Opus 4.1 | $15.00 / $75.00 | $37.50 / $187.50 |
| Claude Sonnet 4.5 | $3.00 / $15.00 | $7.50 / $37.50 |
| Claude Sonnet 4.0 | $3.00 / $15.00 | $7.50 / $37.50 |
| Claude Haiku 4.5 | $1.00 / $5.00 | $2.50 / $12.50 |
| Model | Base Price (Input/Output) | Hosted Price (Input/Output) |
|---|---|---|
| Gemini 3 Pro Preview | $2.00 / $12.00 | $5.00 / $30.00 |
| Gemini 2.5 Pro | $0.15 / $0.60 | $0.38 / $1.50 |
| Gemini 2.5 Flash | $0.15 / $0.60 | $0.38 / $1.50 |
Os preços incluem custos de infraestrutura e gerenciamento de API.
Suas Próprias Chaves de API - Use qualquer modelo com preço base:
| Provider | Example Models | Input / Output |
|---|---|---|
| Deepseek | V3, R1 | $0.75 / $1.00 |
| xAI | Grok 4 Latest, Grok 3 | $3.00 / $15.00 |
| Groq | Llama 4 Scout, Llama 3.3 70B | $0.11 / $0.34 |
| Cerebras | Llama 4 Scout, Llama 3.3 70B | $0.11 / $0.34 |
| Ollama | Local models | Free |
| VLLM | Local models | Free |
Pague provedores diretamente sem markup
Preços mostrados refletem taxas a partir de 10 de setembro de 2025. Verifique documentação de provedores para preços atuais.
Estratégias de Otimização de Custo
- Seleção de Modelo: Escolha modelos baseado na complexidade da tarefa. Tarefas simples podem usar GPT-4.1-nano enquanto raciocínio complexo pode precisar de o1 ou Claude Opus.
- Engenharia de Prompt: Prompts bem estruturados e concisos reduzem uso de tokens sem sacrificar qualidade.
- Modelos Locais: Use Ollama ou VLLM para tarefas não-críticas para eliminar custos de API completamente.
- Caching e Reuso: Armazene resultados frequentemente usados em variáveis ou arquivos para evitar chamadas repetidas de modelo de IA.
- Processamento em Batch: Processe múltiplos itens em uma única requisição de IA em vez de fazer chamadas individuais.
Monitoramento de Uso
Monitore seu uso e faturamento em Configurações → Assinatura:
- Uso Atual: Uso em tempo real e custos para o período atual
- Limites de Uso: Limites de plano com indicadores de progresso visual
- Detalhes de Faturamento: Charges projetadas e compromissos mínimos
- Gerenciamento de Plano: Opções de upgrade e histórico de faturamento
Rastreamento de Uso Programático
Você pode consultar seu uso atual e limites programaticamente usando a API:
Endpoint:
GET /api/users/me/usage-limitsAutenticação:
- Inclua sua chave de API no header
X-API-Key
Exemplo de Requisição:
curl -X GET -H "X-API-Key: YOUR_API_KEY" -H "Content-Type: application/json" https://zippyvendas.com/api/users/me/usage-limitsExemplo de Resposta:
{
"success": true,
"rateLimit": {
"sync": { "isLimited": false, "limit": 10, "remaining": 10, "resetAt": "2025-09-08T22:51:55.999Z" },
"async": { "isLimited": false, "limit": 50, "remaining": 50, "resetAt": "2025-09-08T22:51:56.155Z" },
"authType": "api"
},
"usage": {
"currentPeriodCost": 12.34,
"limit": 100,
"plan": "pro"
}
}Campos de Resposta:
currentPeriodCostreflete o uso no período de faturamento atuallimité derivado de limites individuais (Free/Pro) ou limites de organização agrupados (Team/Enterprise)plané o plano ativo de maior prioridade associado ao seu usuário
Limites de Plano
Diferentes planos de assinatura têm diferentes limites de uso:
| Plan | Monthly Usage Limit | Rate Limits (per minute) |
|---|---|---|
| Free | $10 | 5 sync, 10 async |
| Pro | $100 | 10 sync, 50 async |
| Team | $500 (pooled) | 50 sync, 100 async |
| Enterprise | Custom | Custom |
Modelo de Faturamento
ZippyVendas usa um modelo de faturamento assinatura base + overage:
Como Funciona
Plano Pro ($20/mês):
- Assinatura mensal inclui $20 de uso
- Uso abaixo de $20 → Sem charges adicionais
- Uso acima de $20 → Pague o overage no final do mês
- Exemplo: $35 de uso = $20 (assinatura) + $15 (overage)
Plano Team ($40/seat/mês):
- Uso agrupado entre todos os membros do time
- Overage calculado a partir do uso total do time
- Dono da organização recebe uma fatura
Planos Enterprise:
- Preço mensal fixo, sem overages
- Limites de uso customizados por acordo
Faturamento de Threshold
Quando overage não faturado atinge $50, ZippyVendas automaticamente faturas o valor total não faturado.
Exemplo:
- Dia 10: $70 overage → Fatura $70 imediatamente
- Dia 15: Uso adicional de $35 ($105 total) → Já faturado, sem ação
- Dia 20: Outro $50 de uso ($155 total, $85 não faturado) → Fatura $85 imediatamente
Isto espalha charges grandes de overage ao longo do mês em vez de uma grande fatura no final do período.
Melhores Práticas de Gerenciamento de Custo
- Monitore Regularmente: Verifique seu dashboard de uso frequentemente para evitar surpresas
- Defina Orçamentos: Use limites de plano como guardrails para seu gasto
- Otimize Workflows: Revise execuções de alto custo e otimize prompts ou seleção de modelo
- Use Modelos Apropriados: Corresponda complexidade de modelo aos requisitos de tarefa
- Faça Batch de Tarefas Similares: Combine múltiplas requisições quando possível para reduzir overhead
Próximos Passos
- Revise seu uso atual em Configurações → Assinatura
- Aprenda sobre Logging para rastrear detalhes de execução
- Explore a API Externa para monitoramento de custo programático
- Veja técnicas de otimização de workflow para reduzir custos