O que a DeepSeek anunciou

A 30 de junho de 2026 a DeepSeek comunicou que a versão oficial do V4 chega em meados de julho, graduando a pré-visualização disponível desde 24 de abril, segundo o TechNode. A novidade principal não é um benchmark. É um mecanismo de preço: pela primeira vez numa grande API de IA, os tokens custarão valores diferentes consoante a hora, com tarifas a duplicar nas janelas diárias das 9:00 às 12:00 e das 14:00 às 18:00, o horário laboral chinês, e a tarifa de vazio inalterada.

Os modelos em si têm peso: a janela de contexto de 1 milhão de tokens torna-se padrão em toda a gama, o V4-Pro é um desenho mixture-of-experts de 1,6 biliões de parâmetros com 49 mil milhões ativos, o V4-Flash um modelo de 284 mil milhões com 13 mil milhões ativos. A documentação da DeepSeek acrescenta um prazo duro: os endpoints antigos deepseek-chat e deepseek-reasoner ficam inacessíveis depois de 24 de julho, pelo que as integrações existentes têm de migrar, gostem ou não do novo contador.

Porque é que um laboratório cobra como uma elétrica

A tarifa por horas existe num só tipo de mercado: capacidade fixa, procura oscilante. As redes elétricas inventaram-na porque armazenar era caro e a ponta de procura dimensionava todo o sistema. Que um laboratório de IA recorra agora à mesma ferramenta é uma admissão que vale mais do que qualquer apresentação: a capacidade de inferência é finita, as GPU não fazem fila educadamente, e o token marginal das 10:30 de uma terça-feira custa ao operador mais do que o mesmo token à meia-noite.

Também quebra uma suposição confortável. O setor passou dois anos a dizer que a inteligência fica mais barata a cada trimestre. Por token, continua verdade. Mas o novo mecanismo significa que o preço do mesmo pedido já não é uma constante, e quem orçamentou com custos unitários planos possui agora um pequeno problema de trading de energia. Assim que um fornecedor demonstra que os clientes aceitam preços de ponta, todos os outros têm incentivo para seguir.

A vantagem horária europeia

Para os compradores europeus, a geografia das janelas de ponta é invulgarmente simpática. As horas de ponta comunicadas caem entre as 2:00 e as 5:00 e entre as 7:00 e as 11:00 no horário de verão de Lisboa. A partir das 11 da manhã em Portugal, toda a tarde e a noite de trabalho correm em tarifa de vazio. Uma empresa europeia que use a DeepSeek paga a tarifa reduzida durante a maior parte do seu dia útil, enquanto um concorrente chinês paga o dobro durante o seu.

O passo prático é arquitetónico, não contratual: separar as chamadas críticas em latência das adiáveis. Processamentos noturnos em lote, embeddings, reindexação, avaliações e relatórios podem ser agendados para as janelas de vazio com uma fila e uma entrada de cron. Essa disciplina vale a pena construir mesmo que nunca use a DeepSeek, porque a tarifa horária está agora demonstrada, e a versão do seu próprio fornecedor está à distância de uma reunião de produto.

O que fazer antes de meados de julho

Três ações cabem nas duas semanas antes do lançamento. Primeira: quem corre os endpoints em fim de vida deepseek-chat ou deepseek-reasoner precisa de um plano de migração antes de 24 de julho, testado, não apenas planeado. Segunda: as equipas que usam qualquer API de IA medida deviam etiquetar já as suas cargas como adiáveis ou interativas, para que o agendamento seja depois uma mudança de configuração. Terceira: quem gere o orçamento de IA devia modelar a despesa com um preço de dois escalões e fazer a cada fornecedor uma pergunta na renovação: compromete-se com preços independentes da hora durante a vigência do contrato, ou não. A resposta, em qualquer dos casos, é informação.