Cálculo de Custo

ZippyVendas automaticamente calcula custos para todas as execuções de workflow, fornecendo preços transparentes baseado em uso de modelo de IA e charges de execução. Entender estes custos ajuda você a otimizar workflows e gerenciar seu orçamento efetivamente.

Como os Custos São Calculados

Cada execução de workflow inclui dois componentes de custo:

Taxa Base de Execução: $0.001 por execução

Uso de Modelo de IA: Custo variável baseado no consumo de tokens

modelCost = (inputTokens × inputPrice + outputTokens × outputPrice) / 1,000,000
totalCost = baseExecutionCharge + modelCost

Preços de modelos de IA são por milhão de tokens. O cálculo divide por 1,000,000 para obter o custo real. Workflows sem blocos de IA apenas incorrem na taxa base de execução.

Breakdown de Modelo em Logs

Para workflows usando blocos de IA, você pode ver informações de custo detalhadas nos logs:

O breakdown de modelo mostra:

Uso de Tokens: Contagem de tokens de entrada e saída para cada modelo
Breakdown de Custo: Custos individuais por modelo e operação
Distribuição de Modelo: Quais modelos foram usados e quantas vezes
Custo Total: Custo agregado para toda a execução de workflow

Opções de Preço

Modelos Hospedados - ZippyVendas fornece chaves de API gerenciadas:

OpenAI

Model	Base Price (Input/Output)	Hosted Price (Input/Output)
GPT-5.1	$1.25 / $10.00	$3.13 / $25.00
GPT-5	$1.25 / $10.00	$3.13 / $25.00
GPT-5 Mini	$0.25 / $2.00	$0.63 / $5.00
GPT-5 Nano	$0.05 / $0.40	$0.13 / $1.00
GPT-4o	$2.50 / $10.00	$6.25 / $25.00
GPT-4.1	$2.00 / $8.00	$5.00 / $20.00
GPT-4.1 Mini	$0.40 / $1.60	$1.00 / $4.00
GPT-4.1 Nano	$0.10 / $0.40	$0.25 / $1.00
o1	$15.00 / $60.00	$37.50 / $150.00
o3	$2.00 / $8.00	$5.00 / $20.00
o4 Mini	$1.10 / $4.40	$2.75 / $11.00

Anthropic

Model	Base Price (Input/Output)	Hosted Price (Input/Output)
Claude Opus 4.5	$5.00 / $25.00	$12.50 / $62.50
Claude Opus 4.1	$15.00 / $75.00	$37.50 / $187.50
Claude Sonnet 4.5	$3.00 / $15.00	$7.50 / $37.50
Claude Sonnet 4.0	$3.00 / $15.00	$7.50 / $37.50
Claude Haiku 4.5	$1.00 / $5.00	$2.50 / $12.50

Google

Model	Base Price (Input/Output)	Hosted Price (Input/Output)
Gemini 3 Pro Preview	$2.00 / $12.00	$5.00 / $30.00
Gemini 2.5 Pro	$0.15 / $0.60	$0.38 / $1.50
Gemini 2.5 Flash	$0.15 / $0.60	$0.38 / $1.50

Os preços incluem custos de infraestrutura e gerenciamento de API.

Suas Próprias Chaves de API - Use qualquer modelo com preço base:

Provider	Example Models	Input / Output
Deepseek	V3, R1	$0.75 / $1.00
xAI	Grok 4 Latest, Grok 3	$3.00 / $15.00
Groq	Llama 4 Scout, Llama 3.3 70B	$0.11 / $0.34
Cerebras	Llama 4 Scout, Llama 3.3 70B	$0.11 / $0.34
Ollama	Local models	Free
VLLM	Local models	Free

Pague provedores diretamente sem markup

Preços mostrados refletem taxas a partir de 10 de setembro de 2025. Verifique documentação de provedores para preços atuais.

Estratégias de Otimização de Custo

Seleção de Modelo: Escolha modelos baseado na complexidade da tarefa. Tarefas simples podem usar GPT-4.1-nano enquanto raciocínio complexo pode precisar de o1 ou Claude Opus.
Engenharia de Prompt: Prompts bem estruturados e concisos reduzem uso de tokens sem sacrificar qualidade.
Modelos Locais: Use Ollama ou VLLM para tarefas não-críticas para eliminar custos de API completamente.
Caching e Reuso: Armazene resultados frequentemente usados em variáveis ou arquivos para evitar chamadas repetidas de modelo de IA.
Processamento em Batch: Processe múltiplos itens em uma única requisição de IA em vez de fazer chamadas individuais.

Monitoramento de Uso

Monitore seu uso e faturamento em Configurações → Assinatura:

Uso Atual: Uso em tempo real e custos para o período atual
Limites de Uso: Limites de plano com indicadores de progresso visual
Detalhes de Faturamento: Charges projetadas e compromissos mínimos
Gerenciamento de Plano: Opções de upgrade e histórico de faturamento

Rastreamento de Uso Programático

Você pode consultar seu uso atual e limites programaticamente usando a API:

Endpoint:

GET /api/users/me/usage-limits

Autenticação:

Inclua sua chave de API no header X-API-Key

Exemplo de Requisição:

curl -X GET -H "X-API-Key: YOUR_API_KEY" -H "Content-Type: application/json" https://zippyvendas.com/api/users/me/usage-limits

Exemplo de Resposta:

{
  "success": true,
  "rateLimit": {
    "sync": { "isLimited": false, "limit": 10, "remaining": 10, "resetAt": "2025-09-08T22:51:55.999Z" },
    "async": { "isLimited": false, "limit": 50, "remaining": 50, "resetAt": "2025-09-08T22:51:56.155Z" },
    "authType": "api"
  },
  "usage": {
    "currentPeriodCost": 12.34,
    "limit": 100,
    "plan": "pro"
  }
}

Campos de Resposta:

currentPeriodCost reflete o uso no período de faturamento atual
limit é derivado de limites individuais (Free/Pro) ou limites de organização agrupados (Team/Enterprise)
plan é o plano ativo de maior prioridade associado ao seu usuário

Limites de Plano

Diferentes planos de assinatura têm diferentes limites de uso:

Plan	Monthly Usage Limit	Rate Limits (per minute)
Free	$10	5 sync, 10 async
Pro	$100	10 sync, 50 async
Team	$500 (pooled)	50 sync, 100 async
Enterprise	Custom	Custom

Modelo de Faturamento

ZippyVendas usa um modelo de faturamento assinatura base + overage:

Como Funciona

Plano Pro ($20/mês):

Assinatura mensal inclui $20 de uso
Uso abaixo de $20 → Sem charges adicionais
Uso acima de $20 → Pague o overage no final do mês
Exemplo: $35 de uso = $20 (assinatura) + $15 (overage)

Plano Team ($40/seat/mês):

Uso agrupado entre todos os membros do time
Overage calculado a partir do uso total do time
Dono da organização recebe uma fatura

Planos Enterprise:

Preço mensal fixo, sem overages
Limites de uso customizados por acordo

Faturamento de Threshold

Quando overage não faturado atinge $50, ZippyVendas automaticamente faturas o valor total não faturado.

Exemplo:

Dia 10: $70 overage → Fatura $70 imediatamente
Dia 15: Uso adicional de $35 ($105 total) → Já faturado, sem ação
Dia 20: Outro $50 de uso ($155 total, $85 não faturado) → Fatura $85 imediatamente

Isto espalha charges grandes de overage ao longo do mês em vez de uma grande fatura no final do período.

Melhores Práticas de Gerenciamento de Custo

Monitore Regularmente: Verifique seu dashboard de uso frequentemente para evitar surpresas
Defina Orçamentos: Use limites de plano como guardrails para seu gasto
Otimize Workflows: Revise execuções de alto custo e otimize prompts ou seleção de modelo
Use Modelos Apropriados: Corresponda complexidade de modelo aos requisitos de tarefa
Faça Batch de Tarefas Similares: Combine múltiplas requisições quando possível para reduzir overhead

Próximos Passos

Revise seu uso atual em Configurações → Assinatura
Aprenda sobre Logging para rastrear detalhes de execução
Explore a API Externa para monitoramento de custo programático
Veja técnicas de otimização de workflow para reduzir custos

Cálculo de Custo

On this page