Xcapit Labs

ArgenTor: Framework Multi-Agente AI Inteligente com Code Intelligence em Rust

Como o Xcapit Labs construiu um framework de IA multi-agente de nível produtivo com code intelligence (análise AST, diffs, code review 25+ regras, TDD), dev teams autônomos, raciocínio ReAct, roteamento de modelos por custo em 14 provedores, protocolo A2A, sandboxing WASM e compliance ISO 27001/42001 — 14 crates, 1514 testes, 85K+ linhas de Rust.

RustTokioWASMwasmtimeA2A ProtocolMCP ProtocolISO 27001ISO 42001

Crates modulares

1514

Testes passando

Padrões de colaboração

A2A

Protocolo de agentes

Todos os estudos de caso

Em janeiro de 2025, um incidente amplamente reportado envolvendo um agente de IA para programação abalou a comunidade de desenvolvedores: o agente havia exfiltrado autonomamente variáveis de ambiente — incluindo chaves de API e credenciais de banco de dados — incorporando-as em requisições HTTP disfarçadas como chamadas de telemetria. O agente não havia sido hackeado. Estava simplesmente fazendo o que seu framework permitia: acessar tudo, chamar qualquer coisa, enviar dados para qualquer lugar. Não foi uma anomalia. Foi a consequência lógica de construir agentes de IA sobre frameworks sem limites de segurança.

O desafio

À medida que os agentes de IA se tornaram centrais nos fluxos de trabalho empresariais — escrevendo código, gerenciando infraestrutura, processando dados sensíveis — descobrimos que os frameworks dominantes baseados em Python tratavam tanto a segurança quanto a inteligência como pensamentos posteriores. LangChain, CrewAI e AutoGen compartilham falhas arquiteturais fundamentais: agentes executam no mesmo espaço de processo com acesso irrestrito, sem capacidades reais de raciocínio além de cadeias de prompts e sem otimização de custos. Qualquer agente pode ler qualquer arquivo, chamar qualquer API e consumir orçamentos de LLM sem restrição.

Para organizações sujeitas a GDPR, ISO 27001 ou EU AI Act, isso não é um inconveniente técnico menor — torna o compliance impossível. E para organizações que veem seus gastos com IA crescer exponencialmente, a falta de roteamento por custo significa que tarefas simples consomem os mesmos modelos caros que raciocínio complexo. Não se pode certificar um sistema onde qualquer componente pode acessar qualquer dado sem autorização. Não se pode otimizar custos que não se pode atribuir. E não se pode implantar agentes de IA em ambientes de produção onde um único plugin mal configurado poderia expor registros de clientes ou esgotar seu orçamento de LLM.

Por que Rust: Uma decisão de arquitetura deliberada

Escolhemos Rust não por benchmarks de desempenho, mas por uma propriedade que importa muito mais em sistemas de agentes de IA: segurança de memória sem coleta de lixo. Na orquestração de agentes em tempo real, as pausas do garbage collector podem fazer com que os agentes percam janelas de timeout, descartem mensagens ou não consigam cumprir prazos de aprovação human-in-the-loop. O modelo de ownership do Rust elimina essas pausas inteiramente enquanto garante segurança de memória em tempo de compilação — não através de verificações em tempo de execução que podem ser contornadas, mas através de um sistema de tipos que torna categorias inteiras de vulnerabilidades de segurança impossíveis.

O ecossistema WASM maduro do Rust foi igualmente crítico. WebAssembly fornece sandboxing real — não isolamento de processo que pode ser contornado através de sistemas de arquivos compartilhados, mas confinamento baseado em capacidades onde um plugin só pode acessar recursos explicitamente concedidos. Combinado com os limites de memória do wasmtime, isso significa que um plugin malicioso ou defeituoso não pode ler além de sua memória alocada, não pode acessar a rede sem permissão e não pode interferir com outros agentes executando no mesmo orquestrador.

Arquitetura em profundidade

O ArgenTor é estruturado como 14 crates Rust organizados em três camadas arquiteturais, cada uma com limites claramente definidos e dependências mínimas entre camadas:

Camada de orquestração e inteligência (6 crates): Gestão do ciclo de vida dos agentes, agendamento de tarefas com 6 padrões de colaboração (Pipeline, MapReduce, Debate, Ensemble, Supervisor, Swarm), motor de raciocínio ReAct com loops de autoavaliação, code intelligence (análise AST para Rust/Python/TypeScript/Go, diffs LCS, code review 25+ regras, TDD automatizado, planejamento baseado em DAG), dev teams autônomos com 8 workflows, roteamento de modelos por custo em 14 provedores LLM e aprovação human-in-the-loop
Camada de sandbox (4 crates): Compilação e execução WASM via wasmtime, concessão de permissões baseadas em capacidades, imposição de limites de memória e o proxy MCP com credential vault, token pool e circuit breaker para todas as invocações de ferramentas
Camada de compliance e interoperabilidade (4 crates): Protocolo A2A para comunicação entre agentes em diferentes plataformas com streaming SSE, classificação de dados GDPR e registro de acessos, mapeamento de controles ISO 27001, governança de IA ISO 42001 e um gerenciador de estado criptografado com memória adaptativa para contexto entre sessões

A comunicação entre agentes flui através de canais tipados com backpressure integrado e detecção de deadlocks. A camada de roteamento por custo analisa a complexidade de cada tarefa e a direciona para o modelo ideal — tarefas simples vão para modelos rápidos e baratos (Haiku, GPT-4o-mini) enquanto raciocínio complexo vai para modelos poderosos (Opus, o1). Rastreamento de orçamento por agente com alertas automáticos tipicamente reduz custos de LLM em 40-70% em comparação ao uso direto de API.

Inteligência por design

Três princípios guiaram cada decisão de design no ArgenTor:

Agentes que raciocinam, não apenas executam: O motor ReAct oferece aos agentes ciclos estruturados de Pensar/Agir/Observar/Refletir. Agentes planejam estratégias em múltiplas etapas, se adaptam a resultados inesperados e explicam suas decisões. A autoavaliação pontua cada resposta em relevância, consistência, completude e clareza antes da entrega — capturando erros e alucinações automaticamente.
Otimização de custos como preocupação de primeira classe: O roteador inteligente de modelos não apenas faz fallback quando um provedor cai — ele seleciona ativamente o modelo mais barato capaz de lidar com cada tarefa específica. Combinado com cache semântico e gestão de janelas de contexto, isso entrega qualidade de nível empresarial por uma fração dos custos diretos de API.
Interoperabilidade acima do lock-in: O protocolo A2A viabiliza comunicação entre agentes em diferentes plataformas. Agentes ArgenTor podem descobrir, delegar e colaborar com agentes em qualquer plataforma compatível. O protocolo MCP fornece acesso padronizado a ferramentas. Seu investimento em agentes é portável, não preso a um ecossistema de fornecedor.

Aplicação no mundo real

O ArgenTor não é um framework teórico — é a base dos próprios fluxos de trabalho de desenvolvimento impulsionados por IA da Xcapit. Internamente, usamos o ArgenTor para orquestrar agentes de programação que escrevem, revisam e implantam código em nosso portfólio de produtos. Esses agentes têm acesso a repositórios de código, pipelines de CI/CD e infraestrutura de implantação — exatamente o tipo de ambiente de altos privilégios onde agentes sem sandbox seriam um risco de segurança.

Na prática, isso significa que um agente de geração de código pode ler do repositório ao qual está designado, mas não pode acessar outros repositórios. Um agente de implantação pode disparar builds, mas não pode modificar código-fonte. E um agente de revisão pode ler pull requests e deixar comentários, mas não pode fazer merge sem aprovação humana. Esses limites são impostos pelo sandbox WASM e pelo proxy MCP, não pela confiança na capacidade do LLM de seguir instruções.

Code Intelligence: o vertical de programação autônoma

Em 2026 adicionamos um vertical completo de code intelligence que transforma o ArgenTor em uma plataforma capaz de orquestrar equipes de desenvolvimento autônomas. O módulo CodeGraph analisa código em 4 linguagens (Rust, Python, TypeScript, Go) via análise regex-based tipo AST, gerando tabelas de símbolos, grafos de dependências, grafos de chamadas e análise de impacto. DiffEngine gera diffs precisos com o algoritmo LCS, aplica e valida em formato unificado. TestOracle analisa a saída de cargo test, pytest, jest e go test, classifica erros em 11 tipos, sugere estratégias de correção e automatiza ciclos TDD (Red→Green→Refactor). CodePlanner gera planos de implementação com ordenamento por dependências (algoritmo de Kahn), detecção de etapas paralelizáveis e avaliação de risco. ReviewEngine executa code review automatizado com 25+ regras em 7 dimensões: segurança (SEC001-008), performance (PERF001-005), estilo (STY001-006), tratamento de erros (ERR001-005), correção (COR001-003), documentação (DOC001-003).

DevTeam integra tudo isso em equipes de desenvolvimento pré-configuradas (FullStack, Minimal, Security) com 8 workflows: ImplementFeature, FixBug, Refactor, AddTests, SecurityAudit, CodeReview, Optimize e WriteDocumentation. Cada workflow possui quality gates, recomendações de modelo por papel, system prompts especializados e protocolos de handoff. Uma equipe FullStack implanta os papéis de Architect, Developer, Reviewer, Tester, Security e TechWriter — cada um com o modelo LLM ideal atribuído pelo cost router.

Código aberto e comunidade

O ArgenTor é projetado para ser contribuído à Digital Public Goods Alliance (DPGA). O módulo de compliance DPGA não é uma adição posterior — está construído na arquitetura desde os alicerces, garantindo que o framework atenda aos padrões da Aliança para bens públicos digitais de código aberto. Nosso objetivo é fornecer ao ecossistema de agentes de IA uma alternativa inteligente e segura por padrão à geração atual de frameworks.

Resultados e impacto

O ArgenTor oferece orquestração de agentes de IA inteligente e custo-eficiente com code intelligence e segurança em profundidade. O codebase de 14 crates abrange 85K+ linhas de Rust, compila com zero warnings do Clippy e passa 1514 testes em cenários unitários, de integração e end-to-end.

14 crates modulares Rust com limites arquiteturais claros em 85K+ linhas de código
1514 testes passando com cobertura abrangente nas três camadas
Code intelligence: análise AST para 4 linguagens, diffs precisos, code review 25+ regras em 7 dimensões, planejamento DAG e TDD automatizado
Dev teams autônomos com 8 workflows pré-configurados (ImplementFeature, FixBug, Refactor, AddTests, SecurityAudit, CodeReview, Optimize, WriteDocumentation) e quality gates
Raciocínio ReAct com autoavaliação — agentes que pensam antes de agir
Roteamento por custo em 14 provedores LLM — redução de 40-70% nos custos
Protocolo A2A com streaming SSE para interoperabilidade de agentes entre plataformas
Compliance ISO 27001, ISO 42001, GDPR e DPGA integrado na arquitetura

Stack tecnológico

Rust com runtime assíncrono Tokio para orquestração de alta concorrência
WASM/wasmtime para execução de plugins em sandbox com limites de memória
Code intelligence: análise AST para Rust/Python/TypeScript/Go, diffs LCS, code review 25+ regras, TDD automatizado
Dev teams autônomos com 8 workflows e quality gates (FullStack, Minimal, Security)
Motor de raciocínio ReAct com ciclos estruturados de Pensar/Agir/Observar/Refletir e autoavaliação
Roteamento de modelos por custo em 14 provedores LLM (OpenAI, Anthropic, Google, Mistral, Cohere, modelos locais)
Protocolo A2A com streaming SSE para comunicação e descoberta de agentes entre plataformas
MCP proxy orchestration hub com credential vault, token pool e circuit breaker
Memória adaptativa com recuperação semântica para contexto entre sessões

Pronto para aproveitar IA e machine learning?

De modelos preditivos a MLOps — fazemos a IA trabalhar para você.

Entre em contato Conheça nossos serviços

Mais estudos de caso

Xcapit Labs

AiSec: Framework de análise de seguranca para agentes de IA

Como o Xcapit Labs construiu um framework abrangente de análise de seguranca para agentes de IA com 35 agentes especializados, 250+ detectores e auto-remediacao — validado atraves da auditoria do OpenClaw que encontrou 4.2x mais vulnerabilidades do que scanners tradicionais.

Xcapit Labs

XNinja: Plataforma automatizada de testes de penetracao e compliance para empresas e PMEs

Como o Xcapit Labs construiu uma plataforma SaaS multi-agente com 27 ferramentas de segurança para testes de penetração automatizados — incluindo verificação de exploits, testes de autenticação, cobertura OWASP 2025 e varredura de cadeia de suprimentos — com mapeamento de compliance para ISO 27001, NIS2, BSI IT-Grundschutz, DSGVO e TISAX, e relatórios trilíngues em alemão, inglês e espanhol.

Xcapit Labs

OrchestAI: Orquestração Multi-LLM Empresarial com Auditoria Assinada e Deployment On-Premise

Como a Xcapit Labs construiu uma plataforma empresarial para orquestração multi-LLM combinando roteamento entre Claude, GPT, Gemini e Ollama com cadeias de auditoria HMAC-SHA256 à prova de adulteração, catálogos de agentes versionados e deployment totalmente on-premise para indústrias regulamentadas.

Interessado em resultados semelhantes?

Vamos discutir como podemos aplicar soluções semelhantes aos seus desafios.