Um cliente me ligou às 23h em uma segunda-feira. O atendimento pelo WhatsApp estava represado: 47 mensagens sem resposta, três leads quentes sem contato há mais de seis horas. A equipe dele tinha duas pessoas. O problema não era esforço — era escala.

Em dois anos construindo automações, aprendi uma coisa: o problema raramente é falta de tecnologia. É falta de entendimento do processo antes de automatizar. A maioria começa pelo lado errado.

O diagnóstico que ninguém faz

Antes de escrever uma linha de código, passei três dias mapeando o fluxo de atendimento desse cliente. Gravei as conversas reais (com permissão), cataloguei os padrões de perguntas, identifiquei onde o processo quebrava.

O resultado foi simples e brutal: 73% das mensagens eram variações de seis perguntas. A equipe estava respondendo manualmente o que poderia ser automatizado com precisão maior do que a resposta humana — porque humano cansa, esquece e varia. Um agente bem treinado não.

"Automatizar sem mapear o processo é colocar um motor de Fórmula 1 em um carro com rodas quadradas. Vai rápido e quebra logo."

A arquitetura que funcionou

Construí o agente em três camadas. Cada uma com responsabilidade clara:

  1. Recepcionista — classifica a intenção da mensagem (dúvida, interesse, reclamação, fora do escopo)
  2. Qualificador — coleta informações estruturadas antes de escalar para humano
  3. Escalador — decide quando e como transferir para o time (com contexto completo)

A camada de escalação foi a mais crítica. Um agente que nunca escala é um agente que vai frustrar clientes. Um agente que escala tudo é inútil. O equilíbrio é definido por dados — não por intuição.

A lógica de decisão de escalar

function shouldEscalate(context: ConversationContext): boolean {
  const signals = [
    context.sentiment === 'frustrated',
    context.intentConfidence < 0.7,
    context.isHighValueLead,
    context.hasOpenComplaint,
    context.messageCount > 5 && !context.isResolved
  ];

  // Escala se dois ou mais sinais ativos
  return signals.filter(Boolean).length >= 2;
}

Simples. Mas levou duas semanas de ajuste fino para calibrar os thresholds com dados reais. Não existe atalho para isso.

O que funcionou — e o que não funcionou

Depois de 30 dias rodando em produção, os números eram claros:

  • Tempo médio de resposta: de 4h para 3 minutos
  • Taxa de resolução sem humano: 68%
  • Leads qualificados entregues ao time: +210%
  • Satisfação medida por NPS: subiu 18 pontos

O que não funcionou: a primeira versão do qualificador era genérica demais. Fazia perguntas que o contexto da conversa já tinha respondido. O cliente se sentia interrogado. Reescrevemos a lógica para usar o histórico da conversa como memória ativa.


O que eu faria diferente

Começaria pela coleta de dados mais cedo. As duas primeiras semanas foram de ajuste constante porque não tínhamos volume suficiente para calibrar bem os modelos de classificação.

Tecnologia de IA para negócios não é sobre impressionar. É sobre remover fricção de processos que importam. Esse cliente não precisa mais de duas pessoas respondendo WhatsApp às 23h. Precisa de duas pessoas fazendo o trabalho que só humano faz: vender, relacionar, decidir.