Compartilhar:

Os Dados da Sua Empresa Falida São o Novo Combustível da Inteligência Artificial

A inteligência artificial está com fome de dados, e agora ela encontrou uma fonte bem inusitada para se alimentar.

Imagine que sua empresa fecha as portas depois de anos de operação. Os e-mails trocados às pressas antes de uma reunião importante, as mensagens de Slack cheias de piadas internas, os tickets de projetos que documentaram cada vitória e cada frustração da equipe — tudo isso some, certo?

Errado.

Esse rastro digital está ganhando um destino completamente novo: virar combustível para treinar a próxima geração de IAs. Foi exatamente isso que aconteceu com a cielo24, uma empresa de transcrição e legendagem que encerrou suas atividades recentemente. Shanna Johnson, CEO da companhia, descobriu ao trabalhar com a startup SimpleClosure — especializada em ajudar empresas a encerrar operações — que 13 anos de comunicações internas valiam centenas de milhares de dólares para laboratórios de inteligência artificial.

A SimpleClosure cuidou de toda a burocracia habitual do encerramento: folha de pagamento, impostos, consentimentos de investidores e documentação junto ao fisco americano. Mas depois veio a parte que nenhum manual de empreendedorismo ensina: vender toda a pegada digital da cielo24 — cada piada no Slack, cada ticket no Jira, e-mails documentando conquistas e frustrações guardados em drives de múltiplos terabytes — como dados de treinamento para a próxima geração de IA.

Johnson contou à Forbes que o dinheiro da venda a levou de um cenário onde não sabia como pagar as contas finais para uma situação onde conseguiu amarrar tudo direitinho e seguir em frente. Nas palavras dela, é emocionante pensar que os dados da empresa podem continuar sendo úteis e ajudando outras pessoas, mesmo depois do fechamento.

Esse caso não é um episódio isolado — é o sinal de um mercado completamente novo surgindo nas cinzas de empresas defuntas. 🚀 E ele levanta perguntas bem importantes sobre privacidade, anonimização e o que realmente acontece com tudo que você produz durante anos de trabalho.

Por Que a Internet Pública Já Não Basta Para Treinar IAs

Para entender por que dados internos de empresas se tornaram tão valiosos, é preciso olhar para o que aconteceu com as fontes tradicionais de treinamento. Os laboratórios de IA começaram treinando seus modelos com o conteúdo disponível na internet pública — threads do Reddit, artigos da Wikipédia, livros digitalizados. Mas esse material simplesmente acabou. Segundo o ex-cientista-chefe da OpenAI, Ilya Sutskever, todo esse acervo público foi esgotado até o final de 2024.

E tem mais: mesmo quando esse tipo de dado estava abundante, ele não era exatamente o ideal para construir o que o mercado chama de IA agêntica — modelos capazes de realmente executar tarefas no mundo real, e não apenas responder perguntas. Textos públicos são editados, revisados e pensados para audiências externas. O que acontece dentro de uma empresa é cru, direto e muito mais próximo de como as pessoas realmente pensam e se expressam no dia a dia profissional.

Um guia prático para avaliar, comparar e implementar inteligência artificial com clareza — sem desperdício de tempo ou dinheiro.

Pare de contratar ferramentas sem direção. Criamos um método estruturado para decidir qual IA realmente faz sentido para o seu negócio.

Entrega em PDF no seu e-mail · Sem spam · LGPD

🔒 Seus dados são protegidos conforme a LGPD. Você pode descadastrar a qualquer momento.

Ali Ansari, cuja empresa micro1 vende um produto chamado Roots para laboratórios de IA — basicamente uma empresa fictícia onde agentes de IA podem praticar tarefas como serviços financeiros e gestão de agendas complexas — resumiu bem a situação: as empresas que desenvolvem modelos estão percebendo que o ruído dos ambientes reais de trabalho é necessário para testar os modelos com precisão.

Em outras palavras, se você quer que uma IA saiba trabalhar num escritório, você precisa mostrar a ela como o trabalho realmente acontece — com todas as imperfeições, interrupções e contextos ambíguos que fazem parte da rotina corporativa. E esse tipo de dado simplesmente não existe na web aberta.

O Valor Escondido nas Ruínas Digitais

Quando uma empresa encerra as operações, o que sobra não é apenas dívida, mobília de escritório ou contratos vencidos. Existe um patrimônio invisível acumulado ao longo de anos: conversas, decisões, erros documentados, soluções criativas e toda a dinâmica humana que acontece dentro de uma organização funcionando. Esse tipo de dado é exatamente o que os laboratórios de inteligência artificial mais precisam para tornar seus modelos mais inteligentes, mais naturais e mais próximos da forma como os humanos realmente se comunicam no ambiente profissional.

A cielo24 acumulou mais de uma década de interações internas antes de fechar. São e-mails, threads de projetos, documentos de processos, conversas em ferramentas de colaboração — tudo isso representa uma camada de linguagem real, contextualizada e diversa que simplesmente não existe em fontes públicas como a internet aberta. Para os modelos de aprendizado, essa diferença é enorme.

O que surpreendeu a CEO da cielo24 foi a velocidade com que o mercado reagiu quando a notícia de que esses dados de trabalho estavam disponíveis começou a circular. Laboratórios de IA entraram em contato rapidamente, cientes de que esse tipo de conjunto de dados é raro e valioso. A oferta que chegou à mesa — na casa das centenas de milhares de dólares — transformou uma situação de desespero financeiro em um encerramento digno e organizado.

A Corrida do Ouro dos Dados Corporativos

O CEO da SimpleClosure, Dori Yona, descreveu o nível de interesse que sua empresa recebe de companhias de IA como algo insano. Segundo ele, existe uma sensação real de corrida do ouro entre essas empresas tentando colocar as mãos em dados do mundo real.

Para atender essa demanda crescente, a SimpleClosure está lançando o Asset Hub, uma plataforma onde empresas em processo de encerramento podem vender seu inventário de código, arquivos de Slack, e-mails e outros ativos digitais. Partes do Asset Hub ainda estão em beta, segundo Yona, porque a SimpleClosure remove todas as informações pessoalmente identificáveis dos dados internos das empresas — um processo sensível e tecnicamente difícil que eles querem garantir que esteja absolutamente sólido antes de expandir.

No último ano, a SimpleClosure processou cerca de 100 negociações em nome de empresas encerradas, recuperando mais de 1 milhão de dólares para fundadores. Os pagamentos variam tipicamente entre 10 mil e 100 mil dólares por empresa.

Uma concorrente, a Sunset, também compra dados de empresas defuntas a preços similares. Seu CEO, Brendan Mahony, explicou à Forbes que o preço depende do tamanho da empresa, sua idade e algo chamado de riqueza de dados — uma medida de rastreabilidade interna e conexões entre plataformas dentro do conjunto. Um ticket no Jira vinculado a um commit específico de código, por exemplo, vale muito mais do que um documento isolado. Setores como saúde e finanças também comandam preços premium, devido à complexidade e especificidade dos dados gerados.

Anonimização: A Linha Entre o Útil e o Problemático

Naturalmente, a primeira pergunta que vem à cabeça é: e os funcionários que produziram esses dados? Eles sabem que suas mensagens e e-mails podem estar sendo usados para treinar uma IA?

Marc Rotenberg, fundador do Center for AI and Digital Policy, é direto sobre o assunto. Segundo ele, mesmo que funcionários tenham assinado cláusulas cedendo direitos de propriedade intelectual sobre materiais de trabalho, isso não resolve a questão de se empregadores podem vender comunicações internas a terceiros — especialmente quando os funcionários jamais esperariam que suas mensagens de Slack pudessem ser reutilizadas dessa forma.

Rotenberg considera as questões de privacidade bastante substanciais. Ele destacou que a privacidade dos funcionários é uma preocupação central, especialmente porque as pessoas se tornaram muito dependentes dessas ferramentas internas de comunicação como o Slack. Para ele, esses não são dados genéricos — são pessoas identificáveis.

A organização de Rotenberg enviou uma carta ao Comitê de Comércio do Senado americano pedindo que a FTC examine com atenção as novas práticas de negócios envolvendo IA, citando preocupações sobre salvaguardas para proteção de dados pessoais.

O processo de anonimização em si não é simples nem barato. Exige tecnologia especializada, revisão humana em muitos casos e uma metodologia clara para garantir que nenhuma informação sensível escape. Bobby Samuels, cuja empresa Protege se especializa em navegar o cenário regulatório e legal de dados do mundo real, alerta que se a anonimização não for feita corretamente, existem riscos de que as empresas com acesso aos dados consigam ver as atividades de organizações e pessoas específicas. E se não forem tratados com cuidado, esses dados podem vazar para os outputs dos modelos.

Além da anonimização, há o risco de que conversas de uma pessoa sejam literalmente regurgitadas por modelos de IA. Um estudo de 2020 realizado por pesquisadores de instituições como OpenAI e Google demonstrou que grandes modelos de linguagem podem memorizar sequências do seu conjunto de dados de treinamento de forma literal — e essas sequências podem ser extraídas com os prompts certos. Isso coloca uma camada extra de preocupação sobre a venda de comunicações corporativas para treinamento de IA. 😬

Os Novos Ginásios de Treinamento Para Agentes de IA

A demanda por dados corporativos reais deu origem a uma indústria completamente nova: os chamados RL gyms, ou ginásios de aprendizado por reforço. São ambientes simulados construídos a partir de dados de empresas defuntas, onde agentes de IA podem praticar a navegação em locais de trabalho reais.

E estamos falando de dinheiro sério aqui. Segundo o The Information, a Anthropic está considerando gastar até 1 bilhão de dólares em RL gyms neste ano. Já existem cerca de 50 startups nascentes nesse espaço, além de empresas de rotulação de dados como Mercor e micro1 — que tradicionalmente ganham dinheiro pagando humanos para gerar dados de treinamento — entrando no jogo.

Algumas dessas startups já estão alcançando avaliações impressionantes. A Prime Intellect passou de 1 bilhão de dólares em valuation, segundo uma fonte familiarizada com o assunto. A Fleet está em negociações para captar investimentos numa avaliação de 750 milhões de dólares, também de acordo com o The Information.

Uma empresa chamada AfterQuery vende uma série de mundos prontos para uso por laboratórios de IA, com nomes como Big Tech World, Finance World e Tax World. Nesses ambientes, um agente de IA pratica navegar por um escritório digital, interagir com agentes simulados de usuários e aprender a resolver problemas do mundo real.

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

Um exemplo de tarefa lembra a rotina mais entediante de gestão intermediária: o agente é instruído a planejar um aniversário para um colega chamado Bob. Mas, sem que o agente saiba, outro colega já está planejando a mesma festa. Para piorar, o agente esqueceu quando é o aniversário do Bob. Para ter sucesso, ele precisa mandar mensagens para outros funcionários, fazer um trabalho de detetive e depois decidir se junta forças com o outro organizador ou abandona o plano original. 🎂

Um Mercado Novo Surgindo das Cinzas

O caso da cielo24 não é único, e essa é a parte mais reveladora de toda a história. Existe hoje um ecossistema emergente de empresas especializadas em identificar organizações que estão encerrando atividades, negociar a aquisição de seus dados de trabalho e preparar esses conjuntos para comercialização junto a laboratórios de inteligência artificial. É um modelo de negócio que nasceu diretamente da explosão na demanda por dados de treinamento de alta qualidade — uma demanda que a internet pública já não consegue suprir sozinha.

Para as empresas defuntas, ou melhor, para seus fundadores, investidores e credores, esse mercado representa uma oportunidade inesperada de recuperar algum valor de um ativo que, até pouco tempo atrás, seria simplesmente descartado. Uma startup que não sobreviveu às pressões do mercado pode, mesmo assim, deixar um legado financeiro através da venda de seu histórico de comunicações e operações internas. Isso muda a forma como empreendedores e investidores pensam sobre o encerramento de uma empresa — o dado acumulado ao longo dos anos deixa de ser um custo de armazenamento e passa a ser parte do inventário de ativos a liquidar.

Do ponto de vista dos modelos de aprendizado, o impacto é igualmente significativo. Dados corporativos reais, com toda a sua complexidade, suas abreviações, seus jargões específicos de setor e sua variação natural de tom e contexto, enriquecem os modelos de uma forma que textos rastreados da web simplesmente não conseguem replicar. A diferença entre um modelo treinado apenas com conteúdo público e um que também absorveu anos de comunicações internas de empresas reais pode ser percebida em tarefas como redação de e-mails profissionais, gestão de projetos assistida por IA e qualquer aplicação onde o contexto corporativo importa. 🤖

O Que Isso Significa Para Quem Trabalha Com Dados

Se você trabalha em tecnologia ou acompanha de perto o desenvolvimento da inteligência artificial, esse movimento traz reflexões que vão além da curiosidade sobre um caso isolado. A questão central é: o que fazemos com o rastro digital que deixamos para trás no ambiente profissional? Durante anos, a resposta padrão foi que esses dados ficavam nos servidores das empresas, acessíveis apenas internamente, e sumiam quando a organização deixava de existir. Essa resposta não é mais adequada.

O surgimento desse mercado de dados de trabalho provenientes de empresas defuntas coloca em evidência a necessidade de políticas mais claras sobre propriedade e destino dos dados gerados por colaboradores. Quem é dono de um e-mail enviado por um funcionário usando a conta corporativa da empresa? A resposta jurídica varia por jurisdição, mas a resposta prática — pelo menos por enquanto — parece estar se inclinando para o lado das organizações e de quem as adquire ou liquida. Isso pode mudar à medida que reguladores prestarem mais atenção ao fenômeno, e há boas razões para acreditar que essa atenção está chegando.

Para quem desenvolve ou utiliza soluções baseadas em inteligência artificial, entender de onde vêm os dados de treinamento dos modelos que você usa é cada vez mais relevante. A procedência dos dados afeta a qualidade, a ética e a conformidade legal de qualquer sistema de IA.

E pensando por outro ângulo, talvez aquelas horas que você achava que estava desperdiçando no Slack possam acabar sendo o trabalho mais duradouro que você já fez. A não ser, claro, que o modelo de IA — tendo memorizado seus dados bem demais — acidentalmente revele para a próxima geração de colegas de escritório que foi você quem esqueceu o aniversário do Bob. 💡

Foto de Rafael

Rafael

Operações

Transformo processos internos em máquinas de entrega — garantindo que cada cliente da Método Viral receba atendimento premium e resultados reais.

Preencha o formulário e nossa equipe entrará em contato em até 24 horas.

Publicações relacionadas

Ações da Amazon podem subir com parceria OpenAI

Parceria entre Amazon e OpenAI pode impulsionar receitas de IA e valorizar ações, diz Citi; impacto estratégico no AWS e

Moratória em Datacenters de IA: Energia em Debate

Moratória: Sanders e AOC propõem pausa na construção de datacenters de IA nos EUA para avaliar impactos ambientais e energéticos.

Blockchain e Agentes de IA Mudam os Pagamentos em Cripto

Agentes de IA impulsionam pagamentos cripto com blockchain, stablecoins e x402, viabilizando transações autônomas, micropagamentos e economia entre máquinas

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

Rafael

Online

Atendimento

Calculadora Preço de Sites

Descubra quanto custa o site ideal para o seu negócio

Páginas do Site

Quantas páginas você precisa?

Arraste para selecionar de 1 a 20 páginas

Em apenas 2 minutos, descubra automaticamente quanto custa um site sob medida para o seu negócio

Mais de 0+ empresas já calcularam seu orçamento

Fale com um consultor

Preencha o formulário e nossa equipe entrará em contato.