O Tokenmaxxing está morto. Não produziu o ROI em IA que as empresas desejavam.

O Tokenmaxxing está morto. Não produziu o ROI em IA que as empresas desejavam.


Olá e bem-vindo ao Eye on AI. Sou Jeremy, substituindo Sharon que está de férias. Nesta edição… a CNN processa a Perplexity…IBM e RedHat anunciam um projeto de 5 bilhões de dólares para correção de bugs… a Snowflake fecha um contrato de 6 bilhões de dólares com a AWS… e a Casa Branca destina 9 bilhões de dólares para que as agências de inteligência dos EUA construam seu próprio cluster de chips de IA.

Há apenas algumas semanas, parecia que o ‘tokenmaxxing’ estava em alta em muitas empresas. A ideia era que, se você quisesse descobrir quais funcionários estavam sendo mais inovadores na implementação de agentes de IA, deveria acompanhar o uso de tokens deles. (Tokens são as unidades de dados que os modelos de IA processam; um token equivale a cerca de uma palavra e meia do texto em inglês.) Quanto mais tokens utilizados, mais produtivos eram os agentes de IA daquele funcionário, ou pelo menos, mais à frente em IA e inovador aquele funcionário estava tentando ser. Essa era a ideia, de qualquer forma. Meta, Amazon, OpenAI e muitas outras empresas até estabeleceram classificações formais ou informais de uso de tokens e incentivaram engenheiros e desenvolvedores a competir para ver quem conseguiria usar mais tokens em um determinado período de tempo.

É claro que a Lei de Goodhart ainda se aplica (ela postula que qualquer medida que se torna um alvo deixa de ser uma boa medida) e o tokenmaxxing teve alguns resultados perversos previsíveis. Na Amazon, o Financial Times relatou que alguns funcionários criaram agentes de IA para completar tarefas completamente inúteis ou desnecessárias apenas para manter suas estatísticas de uso de tokens, que agora estavam sendo usadas pelos gerentes para avaliar o desempenho dos funcionários.

Além disso, todos esses tokens têm um custo, e algumas empresas ficaram chocadas com as contas da Anthropic e da OpenAI. Agora, muitas empresas parecem estar se afastando da mentalidade do tokenmaxxing, chegando até a limitar quais funcionários podem usar agentes de IA de terceiros, pelo menos aqueles que utilizam os modelos de IA mais avançados como “cérebros” dentro dos sistemas de agentes. A Meta desativou a classificação informal de tokenmaxxing criada por seus funcionários. A Microsoft cancelou assinaturas do Claude Code para funcionários em vários setores chave, segundo informações do The Verge. A Uber disse ter consumido todo o seu “orçamento de tokens” de 2026 nos primeiros quatro meses do ano, em parte devido ao alto uso do Claude Code. Enquanto isso, o CEO da Salesforce, Marc Benioff, afirmou que a conta da Anthropic de sua empresa será cerca de 300 milhões de dólares este ano e que gostaria que houvesse um “roteador inteligente” que pudesse determinar quais consultas realmente exigiam os modelos mais capazes e caros e quais poderiam ser atendidas por alternativas menores, mas suficientemente capazes e mais baratas.

Além disso, muitos executivos estão dizendo que os gastos com tokens não estão se traduzindo em retorno sobre investimento para a empresa. O COO da Uber, Andrew Macdonald, disse em um podcast na semana passada que a empresa de transporte tem enfrentado dificuldades para conectar o aumento na produtividade de alguns trabalhadores com qualquer impacto em toda a empresa. “Se você não consegue realmente traçar uma linha direta de quão úteis estão as funcionalidades que você está entregando para seus usuários”, disse. “[Os custos dos tokens estão] mais difíceis de justificar.” O resultado líquido é que os dias do tokenmaxxing chegaram ao fim.

Por que os gastos com IA ainda não estão produzindo ROI

Mas isso ainda deixa a questão mais ampla de por que existe esse descompasso entre gastos com IA e ROI? Certamente, recompensar explicitamente o tokenmaxxing não ajuda, já que falha em alinhar os incentivos dos funcionários com os objetivos da empresa (veja o exemplo da Amazon). Azeem Azhar, autor da Exponential View, que é um pensador excepcional sobre o impacto econômico e empresarial da IA, argumenta que o atual paradoxo da produtividade da IA pode ser simplesmente o esperado “J-curve” de produtividade que se vê com qualquer nova tecnologia de propósito geral.

Diferente de uma tecnologia desenvolvida para tornar um processo específico melhor, que muitas vezes pode ter impactos positivos imediatos na produtividade, geralmente leva tempo para as pessoas descobrirem a melhor forma de implementar uma tecnologia de propósito geral. Durante esse período de “descoberta”, a produtividade pode até cair em vez de aumentar. Isso acontece porque as empresas precisam gastar tempo e dinheiro experimentando como utilizar a nova tecnologia, muitas vezes sem ver um impacto positivo no resultado final. Apenas mais tarde, uma vez que as pessoas descobrem as maneiras ótimas de reconfigurar os processos de negócios em torno da nova tecnologia, a produtividade experimenta uma aceleração repentina.

O exemplo clássico que Azhar aborda em profundidade é a invenção da eletricidade e seu impacto na manufatura. A primeira coisa que as fábricas fizeram com a eletricidade foi substituir a iluminação a gás pela iluminação elétrica. Isso resultou em economia de custos, mas não mudou muito em termos de produção da empresa. (E houve algum custo na instalação das luzes e na fiação da fábrica, que até mesmo diminuiu essas economias.) A física do vapor significava que as fábricas pré-elétricas eram construídas com um motor central que movia muitos, ou até todos, os equipamentos da fábrica a partir de um único eixo de transmissão. Assim, a segunda coisa que as fábricas fizeram foi substituir o grande motor a vapor central por grandes motores elétricos, que continuaram a ser usados para operar clusters de máquinas a partir de eixos de transmissão centrais. Isso era mais barato do que tentar reconfigurar toda a fábrica. Mas, na prática, turnou-se ineficiente ou economicamente inviável. Ganhos de produtividade em uma parte do chão de produção muitas vezes simplesmente causavam gargalos em outras áreas da linha de montagem, e, no geral, a fábrica não via grandes ganhos. Foi somente quando as empresas começaram a eletrificar máquinas individuais e reorganizar toda a disposição das fábricas que começaram a ver grandes aumentos de produtividade.

Poucas empresas estão alcançando a Etapa 3

Azhar prevê que a mesma coisa acontecerá com a IA, mas que a maioria das empresas está presa nas etapas um ou dois dessa evolução. Eu acho que ele está provavelmente certo. O tokenmaxxing é fácil. Redesigner fluxos de trabalho é difícil. Mais difícil ainda—e um aspecto que Azhar não aborda—é repensar linhas de negócios inteiras, ou seja, quais produtos ou serviços a empresa vende, e até mesmo modelos de negócios. Isso atinge o propósito fundamental da empresa. Aqui está onde o verdadeiro grande valor da IA está. É sobre reinvenção, não redesenho. Mas a maioria das empresas ainda não está pensando grande o suficiente.

Como a maioria das empresas existentes está sendo muito pequena em sua abordagem ao uso de IA, as empresas nativas de IA têm uma grande oportunidade neste momento. Elas poderão se mover mais rápido e roubar uma fatia significativa do mercado dos incumbentes antes que as empresas tradicionais consigam responder de forma eficaz. É muito mais fácil inventar um novo negócio do zero do que tentar renovar completamente um existente. (Isso também é por isso que pode ser mais difícil do que muitos fundos de private equity esperam simplesmente adicionar um toque de IA a seus investimentos de portfólio e esperar revender as empresas a avaliações mais altas.)

Ok, com isso, aqui estão mais notícias sobre IA.

Jeremy Kahn
jeremy.kahn@fortune.com
@jeremyakahn

FORTUNE SOBRE IA

Exclusivo: Geordie AI levanta 30 milhões de dólares em rodada Series A para ser a ‘controladora de tráfego aéreo’ para os agentes de IA da sua empresa—por Jeremy Kahn

Exclusivo: Orbital Industries, uma startup que usa IA para descobrir novos materiais exóticos, levanta 50 milhões de dólares em rodada de financiamento Series B—por Jeremy Kahn

Diretores-executivos, AI-washing e ‘capital humano de baixo valor’: as armadilhas psicológicas que os CEOs estão enfrentando ao errar suas mensagens sobre IA—por Claire Zillman

O novo mapa da IA da América mostra algo surpreendente: ‘Muitas pessoas normais estão adotando IA’—por Nick Lichtenberg

Destaques de IA na Mídia

CNN processa Perplexity por violação de direitos autorais. A rede de notícias processou a empresa de IA, alegando que o “motor de respostas” da Perplexity raspou mais de 17.000 histórias, fotos, vídeos e outros conteúdos da CNN para fornecer dados para suas saídas geradas por IA. O processo contesta que, após as negociações de um acordo de licenciamento fracassarem em 2025, a Perplexity continuou a apropriar-se do conteúdo da CNN e implicou falsamente em uma relação comercial com a rede que não existe. A CNN busca danos monetários não especificados e uma liminar bloqueando nova infração, enquanto a Perplexity respondeu de forma curta e direta com seu porta-voz: “Você não pode proteger direitos autorais sobre fatos.” Esta é a primeira vez que a CNN processa uma empresa de IA. Leia mais da CNN aqui.

Relato: Trump nomeia ex-AG Bondi para painel de IA da Casa Branca. O presidente Trump nomeou a ex-procuradora-geral Pam Bondi para o Conselho Presidencial de Consultores sobre Ciência e Tecnologia (PCAST), um painel consultivo da Casa Branca que influencia as políticas de IA, conforme relatado pela Axios relatos, citando fontes anônimas familiares com a decisão. O painel é presidido pelo ex-czar de IA David Sacks, juntamente com o atual conselheiro científico da Casa Branca, Michael Kratsios, e também inclui grandes nomes da tecnologia, como o CEO da Nvidia, Jensen Huang, o CEO da Meta, Mark Zuckerberg, e o CEO da Oracle, Larry Ellison. Bondi, que foi demitida como AG no mês passado, terá a tarefa de facilitar a coordenação entre o governo e os executivos de tecnologia no painel, e também assumirá um novo papel de assessoria focado na infraestrutura nacional. A nomeação ocorre enquanto Bondi se recupera de câncer de tireoide, diagnosticado pouco depois de deixar o Departamento de Justiça, disse Axios, novamente citando fontes anônimas.

IBM e Red Hat anunciam projeto de 5 bilhões de dólares para corrigir código de código aberto. A iniciativa, que a IBM está chamando de Projeto Lightwell, surge enquanto modelos avançados de IA, como o Mythos da Anthropic, descobrem cada vez mais vulnerabilidades críticas em bases de código. O projeto verá a IBM e a Red Hat implantar 20.000 engenheiros assistidos por IA para criar um clearinghouse empresarial confiável, projetado para identificar, testar e corrigir vulnerabilidades de segurança em software de código aberto amplamente utilizado pela maioria das grandes corporações para muitas funções críticas. As empresas acessarão o serviço por meio de assinaturas comerciais, recebendo correções validadas e prontas para produção que podem ser inseridas diretamente em suas cadeias de suprimento de software. Um grupo de instituições financeiras de destaque—incluindo Bank of America, Citi, Goldman Sachs, Morgan Stanley, Visa e Wells Fargo—já está participando como primeiros adotantes. Você pode ler mais do Wall Street Journal aqui.

Snowflake fecha contrato de 6 bilhões de dólares para usar chips da AWS. O Wall Street Journal reporta que a gigante de gerenciamento de dados Snowflake assinou um contrato de 6 bilhões de dólares, com duração de cinco anos, para utilizar os chips de CPU Graviton da Amazon Web Services, tornando a Snowflake um dos maiores clientes de computação baseada em CPU da AWS ao lado da Meta e da Apple. O negócio reflete uma crescente demanda por CPUs impulsionada pela ascensão de agentes de IA, que exigem grandes quantidades desses processadores para orquestrar e sequenciar suas tarefas computacionais. Fabricantes de CPUs como Intel, AMD e Arm Holdings viram aumento nas vendas e nos preços das ações nos últimos meses à medida que a IA autônoma se torna comum.

Robinhood lança recursos de negociação com IA autônoma. A Robinhood revelou dois novos produtos—Negociação Autônoma e um Cartão de Crédito Autônomo—que permitem aos clientes conectar assistentes de IA de terceiros, como o Claude da Anthropic ou o agente de codificação Cursor, para realizar estratégias de investimento ou tarefas de gastos com mínima intervenção humana. Para negociação, os clientes podem estabelecer uma conta autônoma dedicada completamente separada de seu portfólio principal, direcionando a IA para construir um portfólio diversificado a partir do zero ou reequilibrar os investimentos à medida que surgem oportunidades. Para gastos, os agentes podem receber acesso a um cartão de crédito virtual Robinhood Gold para fazer compras automáticas, como garantir ingressos para shows ou comprar produtos quando os preços caem abaixo de um determinado limite. As medidas de segurança incluem contas isoladas com fundos limitados, limites de gastos, feeds de atividade em tempo real e um botão de desligamento rápido—embora a Robinhood advirta que agentes de IA podem errar ou agir de maneira inesperada, e que os usuários têm a responsabilidade de monitorar suas contas. Leia mais aqui do CNBC.

NÚMEROS DE IA EM FOCO

9 bilhões de dólares

Esse é o valor que a Casa Branca está alocando para que as agências de inteligência dos EUA ajudem a estabelecer seus próprios clusters computacionais com os sofisticados superchips Grace Blackwell da Nvidia. Os chips são necessários para que as agências de inteligência dos EUA possam rodar suas próprias cópias dos modelos de IA de ponta, como o GPT-5.5 da OpenAI, e possivelmente o Mythos da Anthropic, assim como futuros modelos de IA, em suas próprias redes classificadas. Esses modelos de última geração exigem uma grande quantidade de chips de IA especializados para operar ou para refinamento. O Pentágono recentemente firmou contratos com a OpenAI, Google e xAI que permitem uso de seus modelos de IA em redes classificadas. A Agência de Segurança Nacional (NSA) também se diz estar utilizando muitos desses modelos, bem como aqueles da Anthropic, que a administração Trump tentou proibir de serem usados por agências governamentais depois que a empresa se recusou a acatar a insistência do Pentágono em permitir que seus modelos fossem usados para “qualquer propósito lícito.” A NSA supostamente ainda está trabalhando em algum tipo de arranjo que lhe permita continuar usando o modelo da Anthropic. Embora os termos completos de todos os contratos não sejam públicos, acredita-se que, em alguns casos, as empresas estão fornecendo versões desses modelos ao governo que contêm menos restrições do que a versão que divulgam ao público em geral. Leia mais do New York Times aqui.

CALENDÁRIO DE IA

8-10 de junho: Fortune Brainstorm Tech, Aspen, Colo. Inscreva-se para participaraqui.

17-20 de junho: VivaTech, Paris.

6-11 de julho: Conferência Internacional sobre Aprendizado de Máquina (ICML), Seul, Coreia do Sul.

7-10 de julho: Cúpula AI for Good, Genebra, Suíça.

4-6 de agosto: Ai4 2026, Las Vegas.

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *