O preço por utilizador está a terminar em silêncio
Durante uma década, os custos de software foram previsíveis. Pagava-se uma tarifa fixa por utilizador por mês, e a fatura quase não se mexia por mais que cada um trabalhasse. Esse modelo está agora a ruir nas ferramentas de IA. Em junho de 2026, um dos principais assistentes de IA para programação passou os seus planos para faturação baseada no consumo, cobrando pelos tokens que cada pedido consome em vez de um preço fixo por lugar.
A mudança importa porque os agentes de IA não se comportam como uma pessoa a clicar por um menu. Um agente autónomo que planeia, edita e verifica o próprio trabalho pode consumir na ordem de mil vezes mais tokens do que uma única pergunta. O mesmo lugar que custava um montante fixo no ano passado fatura agora contra um contador aberto, e os utilizadores mais intensivos são os que mais o exigem.
Os números já são alarmantes
Os primeiros relatos não são subtis. Utilizadores intensivos de agentes viram os custos projetados subir entre dez e cinquenta vezes sob o novo modelo medido. Uma grande empresa de tecnologia terá gasto todo o seu orçamento anual de ferramentas de IA para programação em quatro meses, limitando depois cada colaborador a um montante mensal fixo por ferramenta. Até uma das maiores empresas de software do mundo terá cancelado a maioria das suas licenças internas de uma ferramenta de IA externa no final de junho, invocando custos de tokens descontrolados.
Há uma armadilha mais profunda. Os preços dos tokens caíram acentuadamente desde 2023, e ainda assim as faturas totais de IA subiram, porque tokens mais baratos convidam a um uso muito mais intenso. Preços unitários mais baixos não protegem um orçamento quando o consumo não tem limite. A rubrica de custo que disseram aos proprietários que encolheria com a escala é a que mais depressa cresce.
Os créditos expiram no final do verão
Grande parte da dor atual está a ser amenizada por créditos promocionais que os fornecedores associaram à mudança de faturação. Esses créditos são temporários. No caso mais relevante, a almofada dura apenas durante o verão de 2026 e depois cessa, deixando a fatura medida na íntegra a partir do outono.
Isto torna o calendário concreto. Uma organização que não tenha medido o seu consumo real e sem limite de IA antes de os créditos cessarem irá descobrir o número verdadeiro numa fatura em vez de num plano. Os meses calmos são a janela para instalar controlos, não o momento depois de o contador estar plenamente exposto.
Governação, não uma ferramenta mais barata
O instinto de mudar para o modelo que estiver mais barato neste trimestre falha o essencial. A exposição real é a ausência de atribuição e de limites. A maioria das organizações não consegue dizer que equipa, que agente ou que fluxo de trabalho provocou um pico, o que significa que não o consegue governar. Os estudos do setor mostram agora que quase todas as empresas tentam ativamente gerir o gasto em IA, enquanto a preparação para a governar de facto fica bem atrás.
A ação do proprietário é direta e não técnica. Exija atribuição de custos por equipa e por agente, defina limites rígidos antes de os créditos promocionais expirarem, e faça da escolha de modelo uma decisão deliberada para cada tarefa em vez de um automatismo. A IA é agora um serviço medido. Precisa de ser gerida como tal.
Leia a seguir: Combine o Nível do Modelo com a Tarefa · Quando Você Não Pode Comprar o Melhor Modelo