Trabalhadores de tecnologia estão no limite: a corrida pelo consumo máximo de inteligência artificial
A inteligência artificial está mudando não só como os programadores trabalham, mas também como eles são avaliados, comparados e até como se enxergam dentro das empresas.
E o termômetro dessa mudança tem um nome bem específico: tokens.
Se você ainda não ouviu falar em tokenmaxxing, prepare-se, porque esse conceito está dominando as conversas nos corredores — virtuais ou não — das maiores empresas de tecnologia do mundo.
A ideia é simples na superfície: quanto mais tokens você consome usando ferramentas de IA, mais produtivo você parece ser. Mas será que é assim mesmo que funciona na prática? A resposta, como quase tudo em tecnologia, não é tão direta quanto gostaríamos que fosse. 😅
O que começou como uma forma de medir o uso de ferramentas como ChatGPT, Claude e Gemini virou um verdadeiro jogo de competitividade corporativa, com leaderboards internos, orçamentos de tokens como benefício de trabalho e avaliações de desempenho atreladas a quanto cada engenheiro consegue consumir por semana. Tem gente gastando mais de 150 mil dólares por mês com ferramentas de codificação baseadas em IA. Tem engenheiro processando o equivalente a 33 vezes o conteúdo da Wikipédia em uma única semana. E tem empresa usando tudo isso como critério para decidir quem sobe — ou quem fica para trás. É uma corrida que mistura produtividade real, ansiedade de carreira e, convenhamos, um bocado de teatro corporativo. 🎭
O que são tokens e por que eles viraram moeda de poder
Antes de entrar no jogo, vale entender as peças. Dentro dos modelos de linguagem — os famosos large language models — os tokens são as unidades básicas de processamento de texto. Pensa neles como pedaços de palavras, às vezes uma sílaba, às vezes uma palavra inteira, às vezes um símbolo. Cada vez que você manda uma mensagem para o ChatGPT ou pede para o Claude revisar um bloco de código, você está consumindo tokens — tanto os que você envia quanto os que o modelo devolve para você. E esse consumo tem um custo, seja financeiro, seja computacional.
Durante muito tempo, os tokens foram apenas uma métrica técnica. Os times de engenharia os monitoravam para controlar gastos com APIs e garantir que os orçamentos de infraestrutura não saíssem do controle. Só que quando as empresas começaram a distribuir cotas individuais de tokens para seus engenheiros — como um benefício de trabalho, quase como vale-alimentação digital — a dinâmica mudou completamente. De repente, o volume de tokens consumidos passou a sinalizar, pelo menos na percepção coletiva, o quanto aquele profissional estava realmente usando a inteligência artificial no seu dia a dia de trabalho. Quem consumia mais, aparentemente, estava mais integrado à nova era da tecnologia.
Esse movimento não surgiu do nada. Empresas como Meta, Shopify e OpenAI já declararam publicamente que esperam que seus funcionários usem ferramentas de IA de forma intensiva, e que esse uso será avaliado em revisões de desempenho. Alguns gestores começaram a recompensar engenheiros que fazem uso pesado de ferramentas de IA e a advertir aqueles que não adotam a tecnologia. Nesse contexto, os tokens deixaram de ser uma métrica de infraestrutura e viraram um indicador de desempenho profissional — com todas as pressões, distorções e incentivos tortos que isso pode trazer. 🤔
Os números que impressionam — e assustam
Para ter uma dimensão do que está acontecendo, basta olhar os números divulgados recentemente. Um engenheiro da OpenAI processou 210 bilhões de tokens em uma única semana — texto suficiente para preencher a Wikipédia inteira 33 vezes. Na Anthropic, um único usuário do Claude Code, o sistema de codificação com IA da empresa, acumulou uma conta de mais de 150 mil dólares em um mês.
Até pouco tempo atrás, usuários avançados consumiam milhares de tokens por dia em ferramentas como ChatGPT, Claude ou Gemini. Para se ter uma referência, um estudante escrevendo um ensaio com a ajuda de IA, incluindo várias rodadas de revisão, poderia gastar cerca de 10 mil tokens — algo equivalente a 7.500 palavras. Usar milhões de tokens exigiria horas consecutivas na frente do computador sem fazer outra coisa senão digitar. E usar bilhões era praticamente impossível.
O cenário mudou drasticamente com a chegada das chamadas ferramentas de codificação agênticas. Esses sistemas conseguem trabalhar de forma autônoma por horas seguidas, revisando e editando grandes bases de código e escrevendo programas inteiros a partir de um único prompt. Cada agente pode criar subagentes para lidar com diferentes partes de uma tarefa, gerando milhares de tokens em cada etapa do processo. Alguns sistemas de IA, como o popular assistente open-source OpenClaw, são projetados para rodar 24 horas por dia, 7 dias por semana, consumindo tokens enquanto seus usuários humanos dormem.
Ege Erdil, cofundador da Mechanize, uma startup de IA, estimou que um único agente rodando em tempo integral pode consumir 700 milhões de tokens por semana. Ele calculou seu próprio consumo pessoal entre 1 bilhão e 10 bilhões de tokens por semana. Na sua visão, isso nem é tanto assim quando se tem agentes rodando continuamente.
Max Linder, engenheiro de software em Estocolmo, resumiu a situação de forma direta: ele provavelmente gasta mais com o Claude do que o próprio salário. No caso dele, quem paga a conta de tokens é o empregador. 💸
Tokenmaxxing: produtividade de verdade ou performance?
O termo tokenmaxxing nasceu exatamente dessa tensão. Ele descreve a prática — consciente ou não — de maximizar o consumo de tokens para parecer mais produtivo dentro dos sistemas de avaliação corporativos. E aqui está o problema central: consumir muitos tokens não é, necessariamente, sinônimo de entregar mais valor. Um engenheiro pode usar o Claude para gerar páginas e páginas de código que nunca vão para produção. Outro pode usar o mesmo modelo para resolver um bug crítico em quinze minutos com uma única pergunta bem formulada. O volume de tokens é completamente diferente. O impacto no negócio? Talvez o segundo caso seja infinitamente mais valioso.
Esse descolamento entre volume de consumo e qualidade de entrega é o ponto cego mais perigoso da corrida por tokens. Quando as empresas usam dashboards de consumo para avaliar quem está sendo produtivo com inteligência artificial, elas correm o risco de premiar quem sabe jogar o jogo das métricas — e não necessariamente quem está gerando os melhores resultados com a tecnologia. É o tipo de incentivo que, em teoria de jogos, se chama de Lei de Goodhart: quando uma métrica vira uma meta, ela deixa de ser uma boa métrica. Os números sobem, mas o que eles medem começa a se desconectar da realidade.
Vários profissionais de tecnologia ouvidos pelo The New York Times expressaram preocupação com o fato de que colegas estão consumindo bilhões de tokens — que podem custar milhares de dólares por dia — essencialmente para acumular direitos de se gabar. Mesmo dentro dos próprios laboratórios de IA, onde os funcionários têm uso ilimitado das ferramentas da empresa, a ideia de que todo esse consumo seja genuinamente produtivo parece bastante improvável. Um funcionário da OpenAI, que pediu para não ser identificado por não ter autorização para discutir os hábitos de codificação com IA de seus colegas, colocou de forma simples: isso não parece sustentável.
Dito isso, seria injusto ignorar que existe, sim, uma correlação razoável entre uso intenso de IA e ganhos reais de produtividade. Dados publicados pela GitHub sobre o Copilot mostram que desenvolvedores que integram ferramentas de codificação com IA no fluxo de trabalho conseguem completar tarefas significativamente mais rápido em determinados contextos. O problema não é usar IA com intensidade — o problema é transformar o volume de uso em um ranking de valor humano dentro da empresa. Aí a coisa começa a sair dos trilhos. 😬
O dinheiro que está por trás da corrida
Todo esse consumo desenfreado de tokens se traduz em receita expressiva para as empresas que os vendem. A Anthropic mais que dobrou suas projeções de receita em apenas dois meses neste ano, em grande parte por causa do crescimento acelerado de suas ferramentas de codificação agênticas. A OpenAI revelou recentemente que o Codex, sua ferramenta de codificação agêntica, triplicou o número de usuários ativos semanais desde o início do ano, e que o uso total do Codex, medido em tokens, aumentou cinco vezes. No ano passado, o Google informou que seus modelos de IA processavam mais de 1,3 quatrilhão de tokens por mês.
As empresas de IA não estão apenas observando esse fenômeno passivamente — elas estão incentivando. Os maiores consumidores de tokens recebem troféus, recompensas e reconhecimento público. É um modelo que alimenta a competitividade e mantém os usuários engajados, gastando cada vez mais. Para os executivos de tecnologia, se um programador quer operar um enxame de 10 agentes de IA executando tarefas paralelas em janelas separadas, eles ficam felizes em pagar a conta.
Do lado dos assinantes individuais, planos pagos do Claude e do ChatGPT oferecem uma quantidade fixa de tokens por uma mensalidade. Alguns tokens são armazenados em cache, o que significa que o sistema já os tem na memória e não precisa gerá-los do zero, e as empresas cobram mais pelos tokens de saída do que pelos de entrada. Quem precisa de mais tokens pode comprá-los separadamente ou migrar para planos mais caros.
Mas os usuários mais espertos aprenderam a contornar o sistema, empilhando múltiplas assinaturas ou aproveitando ofertas promocionais. Um fundador de startup revelou ter descoberto que uma ferramenta de IA da Figma permitia usar o equivalente a 70 mil dólares em tokens do Claude por meio de uma conta que custava apenas 20 dólares por mês. Ele usou essa brecha para construir seis projetos de software simultaneamente. Uma porta-voz da Figma esclareceu que esse uso aconteceu antes da aplicação de limites de crédito de IA, que entrou em vigor recentemente. 👀
Como as empresas estão estruturando essa corrida
O cenário que está se desenhando no mercado de tecnologia é curioso e, dependendo do ponto de vista, um pouco perturbador. Empresas como Meta e OpenAI criaram leaderboards internos — painéis visíveis que mostram quais engenheiros consomem mais tokens por semana. A lógica, segundo os gestores que defendem essa abordagem, é criar uma cultura de adoção acelerada da inteligência artificial. Se todo mundo pode ver quem está usando mais, a pressão social e a competitividade natural dos times de tecnologia empurram os números para cima. É um mecanismo de gamificação aplicado ao trabalho — e funciona, pelo menos para aumentar os números no painel.
Na Meta, gestores passaram a considerar o uso de IA nas avaliações de desempenho, recompensando engenheiros que utilizam ferramentas de forma intensiva. Na Shopify, a empresa declarou que o uso de tokens é apenas uma das métricas utilizadas para medir desempenho, analisando também como a IA melhora e amplifica o trabalho realizado.
Além dos rankings, outra prática que está ganhando força é a distribuição de orçamentos de tokens como benefício corporativo. Em vez de liberar acesso irrestrito às ferramentas, algumas empresas estabelecem cotas mensais individuais. Orçamentos generosos de tokens estão se tornando um benefício de trabalho para programadores, comparável a plano dental ou almoço gratuito. Quem usa mais do que a cota recebe aprovação para expandir o limite, sinalizando que está integrado ao fluxo de trabalho inteligente. Quem fica muito abaixo pode receber uma conversa com o gestor sobre por que não está aproveitando as ferramentas disponíveis. Esse tipo de estrutura cria uma pressão constante para consumir mais, independentemente de a tarefa em questão realmente se beneficiar do uso de IA ou não.
Gergely Orosz, autor de uma newsletter popular entre engenheiros de software, defendeu a prática de avaliar profissionais por meio de leaderboards de IA, chamando-a de uma forma extremamente barata de aprender sobre formas novas e interessantes de trabalhar. Ele reconheceu que as métricas anteriores usadas para avaliar a produtividade dos programadores — como quantas linhas de código escreveram ou quantas alterações submeteram — também não eram perfeitas. Mas sua observação mais contundente foi outra: dentro das grandes empresas de tecnologia, está se tornando um risco de carreira não usar IA em ritmo acelerado, independentemente da qualidade do resultado.
Vale notar que nem todas as empresas estão seguindo esse caminho. Há uma corrente forte de líderes técnicos que defende uma abordagem mais qualitativa: em vez de medir tokens, medir entregas. Em vez de rankear consumo, avaliar impacto. Organizações com cultura de engenharia mais tradicional têm resistido a transformar o uso de IA em métrica de desempenho individual, argumentando que isso distorce incentivos e pode piorar a qualidade do código gerado — afinal, código escrito com pressa, mesmo que assistido por IA, ainda precisa ser revisado, testado e mantido por humanos. ⚙️
A ansiedade dos tokens e o medo de ficar para trás
Nikunj Kothari, um investidor de capital de risco em São Francisco, escreveu em uma publicação recente sobre o que chamou de token anxiety — a ansiedade dos tokens. Ele descreveu um cenário em que o ecossistema de tecnologia se tornou obcecado com produtividade de IA, não produtividade humana. Kothari disse que trocou a Netflix pelo Claude Code e observou que as conversas nos jantares do Vale do Silício mudaram. Antes, a pergunta padrão era o que você está construindo. Agora, a pergunta é quantos agentes você tem rodando.
Essa mudança de mentalidade revela algo mais profundo do que uma simples tendência de mercado. Existe um medo genuíno entre os profissionais de tecnologia de que estamos no limiar de uma transformação radical no mercado de trabalho para programadores. Se realmente estamos à beira de uma revolução nos empregos de colarinho branco, talvez a ansiedade dos tokens seja racional. Ninguém quer ser o último programador escrevendo código manualmente, sem equipes de agentes de IA trabalhando 24 horas em seu nome.
Para os empregadores que estão pagando por todos esses tokens gerados pela ansiedade, o gasto pode parecer um investimento razoável para se manter à frente da curva. E para os engenheiros, a corrida representa tanto uma oportunidade genuína de ampliar suas capacidades quanto uma pressão sem precedentes para se adaptar ou se tornar obsoleto. 😓
O impacto real na codificação e no futuro dos engenheiros
Por trás de toda essa discussão sobre métricas e rankings, existe uma transformação muito concreta acontecendo na forma como o trabalho de codificação é feito. Ferramentas como GitHub Copilot, Cursor, Claude Code e os agentes de código mais recentes da Anthropic e da OpenAI já são capazes de escrever funções completas, refatorar módulos inteiros, identificar bugs e até propor arquiteturas de sistemas. O engenheiro que aprende a trabalhar bem com essas ferramentas — que sabe fazer as perguntas certas, revisar o output com senso crítico e integrar o código gerado de forma coerente com o restante do sistema — genuinamente consegue entregar muito mais em menos tempo.
A maioria dos tokenmaxxers ouvidos em reportagens recentes eram engenheiros ou programadores amadores construindo e mantendo softwares grandes e complexos usando agentes de codificação rodando em paralelo. Eles relataram, de maneira geral, que as ferramentas de codificação com IA estavam tornando-os mais produtivos. Porém, alguns também enquadraram seu uso de IA como um movimento estratégico — uma forma de sinalizar para colegas e chefes que estão acompanhando o ritmo dos tempos, enquanto a era da codificação puramente humana parece estar chegando ao fim.
Esse é o lado positivo da equação, e ele é real. A produtividade que essas ferramentas desbloqueiam não é ficção de marketing. É possível ver, em contextos concretos, engenheiros resolvendo em horas problemas que antes levariam dias. A capacidade de usar inteligência artificial para acelerar tarefas repetitivas de codificação — como escrever testes unitários, documentar APIs ou converter código de uma linguagem para outra — libera tempo mental para o que realmente exige criatividade humana: entender o problema do negócio, tomar decisões de arquitetura e garantir que o sistema como um todo faz sentido. Quando o uso de tokens reflete esse tipo de trabalho, os números altos são absolutamente justificados.
A grande pergunta: estamos construindo algo bom?
A questão que paira sobre toda essa corrida é inevitável: algum desses tokenmaxxers está produzindo algo realmente bom? Ou estão apenas girando rodas, gerando código inútil e desperdiçando poder de processamento valioso na tentativa de parecer ocupados?
Os leaderboards não medem qualidade. Eles medem volume. E essa lacuna é o calcanhar de Aquiles de todo o sistema de avaliação baseado em tokens. Talvez os viciados em IA de hoje se tornem os engenheiros 100 vezes mais produtivos de amanhã. Ou talvez tudo isso não passe de teatro de produtividade — uma torre reluzente de tokens, construída pelos competitivos e temerosos, que vai desmoronar assim que entendermos de verdade o que constitui trabalho útil.
O desafio para as empresas é criar sistemas de avaliação que consigam distinguir o uso inteligente do uso performático. Isso passa por combinar métricas quantitativas — como o volume de tokens — com avaliações qualitativas de entrega, revisão por pares e impacto nos produtos. Também passa por criar uma cultura onde os engenheiros se sintam seguros para usar a IA de forma honesta, sem precisar inflar números para parecer mais relevantes.
De qualquer maneira, uma coisa parece certa: vamos precisar de muitos mais data centers. No fim das contas, a competitividade mais saudável não é a corrida por quem gasta mais tokens — é a corrida por quem entrega software melhor, mais rápido e mais confiável. E essa corrida, felizmente, a inteligência artificial ainda não consegue vencer sozinha. 🚀
