Existe um ponto em projetos de agentes de IA onde um único agente para de ser suficiente. Ele precisa fazer coisas demais, o contexto fica imenso, os erros em uma etapa se propagam para todas as outras, e o resultado final fica inconsistente.
É quando sistemas multi-agentes entram em cena.
A ideia é intuitiva: em vez de um generalista tentando fazer tudo, você tem especialistas colaborando. Um agente pesquisa, outro analisa, outro escreve, outro revisa. Cada um é excelente no que faz — e o sistema como um todo entrega resultado que nenhum agente individual entregaria.
Mas — e isso é importante — sistemas multi-agentes também têm custo maior, complexidade maior, e mais pontos de falha. Eles compensam quando o problema justifica essa complexidade. E nem sempre justifica.
O que é um sistema multi-agente
Um sistema multi-agente é uma arquitetura onde múltiplos agentes de IA cooperam para completar uma tarefa, cada um com responsabilidades específicas.
Existem dois padrões principais:
Padrão 1: Pipeline sequencial
Agentes trabalham em sequência. O output de um é o input do próximo.
Agente A (Pesquisa) → Agente B (Análise) → Agente C (Escrita) → Resultado
Quando usar: Quando o processo tem etapas distintas e bem-definidas que precisam acontecer em ordem.
Vantagem: Cada agente tem um contexto focado e bem-definido. Mais fácil de debugar.
Limitação: Erros no início da cadeia se propagam. Sem paralelismo.
Padrão 2: Hierárquico (Orquestrador + Workers)
Um agente orquestrador recebe a tarefa, decide a estratégia, delega subtarefas para agentes especializados, e consolida os resultados.
Orquestrador
├── Worker A (executa subtarefa 1)
├── Worker B (executa subtarefa 2, em paralelo com A)
└── Worker C (executa subtarefa 3 após A e B)
→ Orquestrador consolida
Quando usar: Quando o processo tem múltiplas subtarefas que podem ser paralelizadas ou quando a estratégia de execução não é determinística.
Vantagem: Paralelismo, flexibilidade, workers especializados.
Limitação: Orquestrador é um ponto crítico. Coordenação adiciona overhead.
Quando sistemas multi-agentes justificam a complexidade
Caso 1: Processos com especialidades genuinamente diferentes
Se diferentes partes do processo requerem conhecimento ou contexto fundamentalmente diferentes, um único agente vai ser mediocre em tudo.
Exemplo: Análise de due diligence de M&A.
- Agente Jurídico: Analisa contratos, identifica riscos legais, verifica compliance.
- Agente Financeiro: Analisa demonstrações financeiras, valuation, projeções.
- Agente de RH: Analisa estrutura organizacional, key persons, contratos de trabalho.
- Orquestrador: Consolida as análises em um relatório final com visão integrada de risco.
Cada agente tem um contexto especializado diferente. Um agente único tentando fazer tudo teria um prompt imenso, conflito de contextos, e resultado inferior.
Caso 2: Processos com paralelismo natural
Quando múltiplas subtarefas podem acontecer ao mesmo tempo, sistemas multi-agentes reduzem o tempo total de forma significativa.
Exemplo: Geração de proposta comercial completa.
Tarefas paralelas:
- Agente A: Pesquisa o cliente (histórico, setor, desafios públicos)
- Agente B: Busca casos similares no portfólio interno
- Agente C: Verifica disponibilidade da equipe e calcula custos
Com essas três pesquisas acontecendo em paralelo, o tempo total é o da mais demorada — não a soma das três.
Caso 3: Processos que precisam de revisão interna
Um agente que age e outro que revisa. O revisor não sabe como o executor chegou no resultado — ele avalia o resultado com olhar fresco.
Exemplo: Geração de relatórios de análise.
- Agente Analista: Gera o relatório com base nos dados.
- Agente Revisor: Verifica consistência dos números, clareza do texto, se as conclusões são suportadas pelos dados.
- Agente Formatador: Aplica o layout e a identidade visual final.
Essa separação de papéis melhora a qualidade do output — similar a ter um autor e um editor separados.
Caso 4: Processos de longa duração com checkpoints
Processos que duram horas ou dias, com múltiplos checkpoints onde o estado precisa ser salvo e a execução pode ser retomada.
Exemplo: Monitoramento contínuo de compliance regulatório.
- Agente Monitor: Escaneia continuamente fontes regulatórias.
- Agente Classificador: Classifica novidades por relevância e impacto.
- Agente Reporter: Gera o briefing quando há novidades relevantes.
- Agente Memória: Mantém o histórico do que já foi processado.
Quando NÃO usar sistemas multi-agentes
Quando um agente único resolve bem
Se o processo é relativamente simples e um único agente com as ferramentas certas o executa bem, adicionar múltiplos agentes é complexidade desnecessária.
Regra prática: comece com um agente único. Adicione complexidade quando o agente único mostrar limitações claras.
Quando o custo de coordenação supera o ganho
Cada handoff entre agentes tem overhead: o orquestrador precisa formular a delegação, o worker precisa entender o contexto, o resultado precisa ser integrado. Em processos curtos, esse overhead pode superar o benefício.
Quando a confiabilidade é crítica e o orçamento de erros é baixo
Sistemas multi-agentes têm mais pontos de falha. Se cada agente tem 95% de precisão, um pipeline de 5 agentes em série tem 77% de precisão no final (0.95^5 = 0.77). Para processos onde 77% não é suficiente, ou você precisa de agentes muito mais precisos, ou de mais supervisão humana nos handoffs.
Quando a latência é crítica
Múltiplos agentes em sequência = múltiplas chamadas ao LLM = latência multiplicada. Para respostas que precisam acontecer em menos de 2-3 segundos, sistemas multi-agentes em série provavelmente não são adequados.
Ferramentas para sistemas multi-agentes
LangGraph
O mais usado para sistemas multi-agentes com estado complexo. Modela o sistema como um grafo com nós (agentes ou funções) e arestas (transições condicionais). Excelente para processos com lógica condicional e loops.
Bom para: Sistemas onde o fluxo não é completamente linear, onde há loops de revisão, onde o estado precisa ser persistido.
CrewAI
API de mais alto nível que abstrai muita da complexidade do LangGraph. Define “crews” com agentes tendo papéis, objetivos e backstories definidos em linguagem natural.
Bom para: Times de agentes com papéis bem definidos. Prototipagem rápida. Menos controle sobre o fluxo exato.
AutoGen (Microsoft)
Foco em conversações entre agentes — agentes que dialogam entre si para resolver problemas. Bom para simulações e casos onde a interação entre agentes é o mecanismo central.
Bom para: Casos onde você quer que agentes “debatam” e cheguem a consenso.
Agno (antes phidata)
Framework mais leve que os anteriores. Fácil de começar, boa integração com ferramentas externas.
Bom para: MVPs e sistemas de complexidade moderada.
Arquitetura de exemplo: sistema de análise de proposta de fornecedor
Para concretizar, veja um sistema multi-agente para análise de propostas comerciais de fornecedores:
Agentes:
Agente de Extração:
- Recebe o PDF da proposta
- Extrai: escopo, preços, prazos, condições, cláusulas relevantes
- Output: JSON estruturado com os dados extraídos
Agente de Compliance:
- Recebe o JSON + as políticas de compras da empresa
- Verifica se a proposta atende aos requisitos obrigatórios
- Output: lista de conformidades e não-conformidades
Agente de Benchmarking:
- Recebe o JSON + histórico de propostas similares
- Compara preços e condições com o mercado e com negociações anteriores
- Output: análise comparativa com recomendações
Agente de Risco:
- Recebe o JSON + análise de compliance
- Identifica cláusulas de risco (responsabilidade, rescisão, SLA)
- Output: avaliação de risco com pontos de atenção
Orquestrador:
- Dispara os quatro agentes em paralelo
- Consolida os outputs em um relatório final
- Gera recomendação: aprovar, aprovar com ressalvas, ou rejeitar
Tempo de execução: 2-4 minutos para processar uma proposta completa. Tempo humano equivalente: 3-4 horas.
Monitoramento de sistemas multi-agentes
Sistemas multi-agentes sem observabilidade adequada são caixas-pretas que falham de forma misteriosa.
O que você precisa monitorar:
- Qual agente executou, em qual ordem
- Input e output de cada agente
- Tokens consumidos por agente (custo)
- Tempo de execução por agente (performance)
- Erros e retries por agente
- Qualidade do output final (humano avalia amostras)
Ferramentas como Langfuse, LangSmith, e Arize Phoenix oferecem tracing completo de sistemas multi-agentes, visualizando o grafo de execução de cada run.
Sem esse tipo de visibilidade, é impossível debugar falhas ou otimizar o sistema de forma sistemática.
Por onde começar
Se você está considerando um sistema multi-agente:
- Documente o processo que quer automatizar em detalhes
- Identifique as partes com especialidades genuinamente diferentes
- Identifique onde há paralelismo natural
- Comece com um agente único e veja onde ele falha
- Adicione um segundo agente para cobrir a falha mais crítica
- Expanda incrementalmente
Sistemas multi-agentes surgem da evolução de agentes simples, não são construídos do zero com máxima complexidade.
Se você quer explorar arquiteturas de agentes para um processo específico, podemos fazer uma sessão de design de arquitetura para mapear a abordagem mais adequada.
Sistemas multi-agentes não são uma solução em busca de problema. São a resposta certa para processos que genuinamente requerem especialização paralela. Comece simples. Adicione complexidade quando os resultados pedirem.