Inteligência artificial aplicada a contratos: como o Doczy.ai transforma documentos complexos em dados estratégicos usando a AWS
A inteligência artificial finalmente chegou onde ela faz mais diferença: naquele monte de documentos que ninguém quer ler, mas todo mundo precisa entender.
Se você já trabalhou em uma empresa que lida com contratos, sabe bem como é essa rotina. Pilhas de arquivos, PDFs fora de padrão, tabelas que parecem ter sido criadas para confundir, e no final do dia, alguém ainda precisa extrair manualmente cada informação relevante de cada cláusula.
É lento, é caro e, inevitavelmente, é cheio de erros.
Pois bem, foi exatamente esse problema que a consultoria global AArete, especializada em saúde e serviços financeiros, decidiu resolver. O resultado tem um nome: Doczy.ai. A solução roda em cima da infraestrutura da AWS e usa IA generativa para transformar contratos complexos em dados estruturados, prontos para alimentar decisões reais de negócio. E os números que essa plataforma apresentou nos últimos 22 meses deixam pouco espaço para ceticismo.
Estamos falando de 2,5 milhões de documentos processados, equivalentes a cerca de 50 milhões de páginas, mais de 330 milhões de dólares em economia acumulada para clientes e uma redução de 97% no tempo de processamento manual. Mas o que realmente chama atenção nessa história não é só a escala. É a jornada até chegar aqui, porque o Doczy.ai não nasceu pronto, e entender como ele evoluiu ajuda a compreender por que ele funciona tão bem hoje. 🚀
O problema real: dados valiosos presos dentro de documentos
Para organizações de saúde e serviços financeiros, gerenciar e interpretar contratos é um gargalo operacional gigantesco. Pense na quantidade de informações críticas que ficam trancadas dentro de acordos legais, arranjos com fornecedores, faturas e contratos com prestadores de serviço. Tudo em formato não estruturado, espalhado por pastas físicas e digitais, sem nenhum tipo de padronização que permita uma consulta rápida.
O processo tradicional de revisão exige que equipes inteiras sejam mobilizadas para extrair dados de milhares de documentos. Essa abordagem não é escalável, não é sustentável e é altamente propensa a erros. Para piorar, muitas organizações dependem de conhecimento institucional, ou seja, as informações mais importantes sobre os contratos estão na cabeça de alguns poucos profissionais. Isso cria silos de conhecimento e riscos sérios de continuidade quando essas pessoas saem da empresa.
Os sistemas tradicionais de gestão do ciclo de vida de contratos, conhecidos como CLM, também não resolvem completamente o problema. Eles conseguem configurar campos predefinidos, mas perdem o detalhe rico e a informação contextual que distingue cada contrato. Na prática, isso significa que cláusulas com nuances importantes acabam sendo tratadas de forma genérica, e o valor real do documento se perde no caminho.
No setor de saúde, esse impacto é ainda mais visível. Os termos de reembolso precisam ser manualmente traduzidos para os sistemas de sinistros, um processo lento e cheio de oportunidades para erros. Da mesma forma, verificar faturas de fornecedores contra os termos do contrato exige esforço manual constante, gerando atrasos nos pagamentos e oportunidades de economia desperdiçadas. São ineficiências que, somadas, deixam muito dinheiro na mesa.
De planilhas manuais a uma plataforma de IA generativa
A AArete começou a desenvolver o Doczy.ai a partir de uma dor real que ela mesma sentia no dia a dia das suas operações de consultoria. Antes da plataforma existir no formato atual, a empresa utilizava processos altamente manuais para fazer a revisão e extração de dados de contratos, dependendo de equipes inteiras para catalogar informações que poderiam perfeitamente ser automatizadas. O problema não era falta de talento humano, era a natureza repetitiva e volumosa do trabalho, que consumia horas preciosas de profissionais que poderiam estar focando em análises mais estratégicas.
A evolução do Doczy.ai reflete o avanço acelerado da própria inteligência artificial. Antes de 2020, o processamento de documentos era essencialmente manual, com profissionais conseguindo processar aproximadamente 100 documentos por semana. Entre 2020 e 2023, a empresa implementou processamento baseado em regras, alcançando cerca de 55% de precisão. O grande salto veio em 2024, quando o processamento baseado em IA generativa construído sobre a AWS atingiu 99% de precisão, uma melhoria dramática em relação aos 55% dos sistemas anteriores baseados em regras.
Com o tempo, a consultoria percebeu que os modelos de inteligência artificial disponíveis no mercado haviam amadurecido o suficiente para lidar com linguagem jurídica e corporativa de forma confiável. Foi aí que a parceria com a AWS ganhou relevância central no projeto. A Amazon Web Services não entrou nessa história apenas como fornecedora de infraestrutura de nuvem. Ela trouxe consigo um ecossistema completo de serviços de machine learning, processamento de linguagem natural e ferramentas de IA generativa que permitiram que o Doczy.ai escalasse com segurança e velocidade, sem comprometer a precisão que documentos jurídicos exigem.
Como o processamento de documentos funciona na prática
Quando um novo contrato entra no Doczy.ai, ele passa por uma pipeline de processamento de documentos que começa com a normalização do arquivo. Independente do formato original, o sistema converte o conteúdo para uma estrutura que os modelos de inteligência artificial conseguem processar de forma consistente. Esse passo pode parecer simples, mas é onde muitas soluções similares tropeçam, especialmente quando o documento tem tabelas embutidas, cabeçalhos em posições atípicas ou texto em imagens que precisam passar por OCR antes de qualquer análise.
A arquitetura por trás da mágica
O Doczy.ai é construído sobre uma arquitetura abrangente na AWS projetada para lidar com todo o ciclo de vida do processamento de documentos, desde o momento em que um arquivo entra no sistema até o momento em que ele gera inteligência de negócios acionável.
Usuários externos acessam a plataforma por meio de um frontend seguro em Next.js, com o Amazon Cognito gerenciando autenticação e autorização nos bastidores. Após a autenticação, os usuários fazem upload dos documentos diretamente para o Amazon S3, onde o armazenamento de objetos durável e escalável garante que nada se perca e tudo esteja acessível em escala. A partir daí, a inteligência real começa.
Uma função AWS Lambda aciona o Amazon Textract para extrair texto e metadados de documentos em diversos formatos. O que diferencia o Doczy.ai nesse estágio é o seu algoritmo patenteado de fragmentação inteligente, chamado de smart chunking. Essa abordagem proprietária vai muito além de simplesmente extrair palavras de uma página.
Smart chunking: fragmentação inteligente de documentos
Em vez de tratar um documento como uma sequência plana de texto, o smart chunking preserva a estrutura hierárquica e os relacionamentos de um-para-muitos dentro dos documentos. Ele usa uma combinação de busca semântica e por palavras-chave para decompor o texto em fragmentos significativos e conscientes de contexto, aplicando parâmetros dinâmicos para manter os relacionamentos lógicos ao longo de todo o processo. Identificadores sequenciais e agrupamentos baseados em metadados organizam esses fragmentos em grupos de campos, detectando sobreposições e removendo duplicações enquanto mantêm o fluxo natural do documento intacto.
O motor de clusterização dupla
Após a fragmentação, o documento entra no motor de clusterização dupla do Doczy.ai. Essa metodologia de duas perspectivas analisa cada contrato simultaneamente tanto do ponto de vista semântico quanto estrutural.
No lado semântico, o texto extraído é convertido em embeddings, representações numéricas de significado, e ideias similares são agrupadas mesmo quando expressas com palavras diferentes. No lado estrutural, algoritmos de reconhecimento de padrões identificam tipos de cláusulas, convenções de formatação, layouts de tabelas e organização hierárquica. Por exemplo, o sistema entende que um anexo com três níveis de aninhamento tem implicações fundamentalmente diferentes de uma simples programação anexada.
Essas duas análises não operam isoladamente. Algoritmos de projeção comparam os clusters semânticos e estruturais lado a lado, sintetizando-os em um modelo de documento unificado e enriquecido que captura tanto significado quanto contexto. É essa convergência que impulsiona a taxa de precisão de 99% do Doczy.ai. O sistema não apenas lê as palavras, ele entende o contrato.
Modelos de linguagem de grande escala, os famosos LLMs, então geram saídas estruturadas fundamentadas nessa inteligência de clusterização dupla. Antes de a saída ser finalizada, o sistema determina a classe do arquivo de cada documento e gera prompts adaptados ao texto extraído, à classificação dos clusters e ao contexto de domínio. Por meio de técnicas de few-shot e multi-shot prompting, a plataforma edita continuamente os prompts com base em exemplos específicos do domínio e em resultados reais, criando um ciclo de feedback que aprimora a precisão progressivamente ao longo do tempo. ⚙️
Armazenamento e monitoramento
Os dados estruturados resultantes fluem para o Snowflake, formando um repositório centralizado que alimenta dashboards inteligentes com insights acionáveis e visualizações. Ao longo de toda a pipeline, o Amazon CloudWatch monitora a performance em tempo real e identifica proativamente problemas antes que eles escalem, enquanto o AWS Secrets Manager protege informações sensíveis, garantindo que segurança não seja um pensamento posterior, mas uma camada fundamental integrada a cada estágio do sistema.
Os resultados que colocaram o Doczy.ai no radar do mercado
Quando uma plataforma de automação de contratos diz que gerou mais de 330 milhões de dólares em economia para seus clientes, a primeira reação natural é questionar como esse número foi calculado. No caso do Doczy.ai, a metodologia leva em conta tanto a redução de custos operacionais diretos, como horas de trabalho manual eliminadas, quanto ganhos indiretos como renegociações contratuais que só foram possíveis porque a plataforma identificou cláusulas desfavoráveis que passariam despercebidas em uma revisão humana convencional. Esse segundo tipo de ganho costuma ser o mais surpreendente para os clientes, porque representa valor que estava escondido dentro dos próprios contratos.
Em termos de escala operacional, os últimos 22 meses demonstram a maturidade e a prontidão para produção da plataforma. O Doczy.ai realizou 137 milhões de chamadas de API para o Amazon Bedrock e processou 442 bilhões de tokens, um nível de automação e precisão anteriormente inatingível por meio de abordagens manuais ou tradicionais de processamento de documentos.
A taxa de precisão de 99% representa uma melhoria significativa em relação aos aproximadamente 55% de precisão dos sistemas baseados em regras e supera em muito o processamento manual, que é tipicamente afetado por fadiga e erro humano. A redução de 97% no tempo de processamento manual se traduz diretamente em economia de custos e permite que as organizações realoquem recursos humanos para atividades de maior valor que exigem julgamento e pensamento estratégico.
Para setores como saúde, varejo e serviços financeiros, onde a gestão contratual é constante e estratégica, esse ganho de velocidade tem impacto direto na capacidade de resposta do negócio. Renegociações que dependiam de análises demoradas agora podem acontecer em tempo hábil, sem que o time jurídico precise paralisar outras atividades para viabilizá-las.
Além dos resultados financeiros e operacionais, o Doczy.ai também tem se destacado por reduzir significativamente os erros de interpretação que ocorrem em revisões manuais. A inteligência artificial não se cansa, não perde o foco depois de ler o décimo contrato do dia e não interpreta uma cláusula de forma diferente dependendo do revisor. Esse nível de consistência é especialmente valioso em auditorias e processos de due diligence, onde uma inconsistência na leitura de contratos pode ter consequências sérias. 📊
Caso de uso em ação: automação de processos para planos de saúde
Para planos de saúde, o Doczy.ai oferece uma solução poderosa para automatizar e melhorar a gestão contratual ao longo de todo o ciclo de vida. A plataforma ingere contratos existentes em formatos tanto físicos quanto digitais, integra-se com sistemas de gestão de contratos como Coupa e Icertis, e processa novos contratos e aditivos à medida que são executados. Em seguida, cria um repositório centralizado de metadados que alimenta diretamente sistemas downstream, possibilitando automação de processos de negócio de ponta a ponta.
Essa automação desbloqueia capacidades críticas:
- Análise contínua de termos contratuais: as organizações conseguem identificar oportunidades para melhorar a performance financeira e a eficiência operacional de forma constante.
- Alimentação automática de sistemas de sinistros: a arquitetura envia dados contratuais precisos e atualizados diretamente para os sistemas de claims, automatizando o processo de configuração que anteriormente exigia tradução manual dos termos de reembolso, eliminando entrada manual de dados, erros de configuração e atrasos.
- Verificação de pagamentos: a plataforma ajuda a manter a precisão dos pagamentos de sinistros avaliando pagamentos contra os termos do contrato, identificando discrepâncias e sinalizando potenciais pagamentos a mais ou a menos antes que eles ocorram.
Ao automatizar processos manuais, os planos de saúde conseguem se adaptar rapidamente a novos termos contratuais e requisitos regulatórios. Os dashboards inteligentes e insights acionáveis fornecidos pelo Doczy.ai permitem que tomadores de decisão compreendam a performance dos contratos, identifiquem tendências e tomem medidas proativas para otimizar resultados financeiros.
O papel estratégico da AWS nessa equação
A escolha da AWS como base tecnológica do Doczy.ai não foi por acaso. A Amazon Web Services oferece um conjunto de serviços que se encaixam de forma muito direta nas necessidades de uma plataforma de processamento de documentos em larga escala. Serviços como o Amazon Textract para extração de texto e dados, o Amazon Cognito para autenticação, o Amazon S3 para armazenamento, o AWS Lambda para processamento serverless, o Amazon ECS para containerização, e o Amazon Bedrock para acesso a modelos de IA generativa foram fundamentais para a construção da arquitetura atual.
Mais do que os serviços individuais, o que a parceria com a AWS trouxe foi a capacidade de combinar essas ferramentas em uma pipeline coesa, com governança de dados, segurança e conformidade regulatória embutidas. Para clientes corporativos, especialmente nos setores financeiro e de saúde, esse aspecto não é detalhe, é pré-requisito. Nenhuma empresa de grande porte vai colocar seus contratos em uma plataforma que não consiga demonstrar com clareza como os dados são tratados, armazenados e protegidos. A infraestrutura da AWS cobre exatamente esse requisito, e a AArete soube aproveitar isso na construção do produto.
Outro ponto relevante da parceria é o acesso a atualizações contínuas nos modelos de inteligência artificial disponíveis via AWS. O campo de IA generativa evolui em um ritmo acelerado, e uma plataforma que depende de modelos estáticos rapidamente fica defasada. Por rodar sobre o Amazon Bedrock, o Doczy.ai consegue incorporar modelos mais novos e mais precisos sem precisar refazer toda a arquitetura do zero. Isso garante que a plataforma continue competitiva sem os custos e riscos associados a uma migração tecnológica completa a cada ciclo de inovação do setor. 🔄
O modelo SaaS e a acessibilidade da plataforma
A AArete oferece o Doczy.ai como uma solução Software as a Service, o que significa que organizações interessadas podem adotar a plataforma sem a necessidade de investimentos significativos em infraestrutura. Esse modelo de distribuição permite implantação rápida, e a equipe de especialistas da AArete configura a solução de acordo com os tipos de documentos específicos do cliente, sua terminologia de domínio e seus processos de negócio. O objetivo é garantir que a plataforma entregue valor máximo desde o primeiro dia de operação.
Essa abordagem torna a tecnologia acessível não apenas para grandes corporações com orçamentos robustos de TI, mas também para organizações de médio porte que enfrentam os mesmos desafios de gestão contratual, porém com recursos mais limitados para investir em soluções customizadas. A capacidade de processar até 250 mil documentos contratuais por semana com 99% de precisão demonstra que a plataforma está preparada para atender demandas de qualquer escala.
O que isso significa para quem lida com contratos no dia a dia
Para equipes jurídicas, de procurement e de gestão de fornecedores, o Doczy.ai representa uma mudança de paradigma na forma como o trabalho com contratos é feito. Em vez de dedicar horas para localizar manualmente informações em documentos extensos, esses profissionais passam a trabalhar com dados já organizados e consultáveis, podendo focar sua energia em análise, estratégia e tomada de decisão. Isso não significa substituição de pessoas, significa que as mesmas pessoas conseguem fazer muito mais, com muito mais confiança nos dados que estão usando.
A automação de contratos também muda a dinâmica de como as empresas enxergam seu próprio portfólio contratual. Quando os dados estão estruturados e acessíveis, fica muito mais fácil identificar padrões, como fornecedores com cláusulas sistematicamente desfavoráveis, contratos próximos do vencimento que precisam de atenção, ou obrigações que estão sendo ignoradas por falta de visibilidade. Esse tipo de inteligência estratégica costumava ser privilégio de grandes empresas com equipes dedicadas exclusivamente à gestão contratual. Com plataformas como o Doczy.ai, ela começa a se tornar acessível para organizações de diferentes portes.
O que a trajetória do Doczy.ai mostra, acima de tudo, é que a inteligência artificial aplicada a problemas reais e específicos tende a gerar resultados muito mais concretos do que soluções genéricas. O sucesso da plataforma não veio de tentar resolver tudo de uma vez, mas de ir fundo em um problema bem delimitado, transformar contratos em um ativo estratégico de dados, com tecnologia robusta e os parceiros certos. Ao abraçar a inteligência documental na AWS, as organizações podem resolver esse desafio operacional de longa data e desbloquear uma nova fronteira de vantagem estratégica, transformando seus dados no seu ativo mais valioso. 💡
