O que a DeepSeek de fato lançou com o V4?
A DeepSeek lançou o V4 em 24 de abril de 2026 como modelos de pesos abertos sob a licença MIT, em dois tamanhos chamados V4-Pro e V4-Flash. Pesos abertos pesam mais do que marketing de código aberto: os pesos estão publicados no Hugging Face, então uma empresa pode executar o modelo nas próprias máquinas, ajustá-lo com os próprios dados e servi-lo aos próprios usuários sem uma relação por token com a DeepSeek. O carro-chefe V4-Pro é um modelo mixture-of-experts de 1,6 trilhão de parâmetros com cerca de 49 bilhões de parâmetros ativos por token e, em benchmarks agênticos, segundo relatos posiciona-se ao lado de sistemas fechados de fronteira como GPT-5.5 e Claude Opus 4.7. Esta é a linha que os próprios lançamentos V3 e R1 da DeepSeek cruzaram primeiro no fim de 2024 e início de 2025. Capacidade de nível de fronteira já não é algo que apenas alguns poucos fornecedores podem alugar a você.
Se o modelo é gratuito para ser próprio, por que quase todo mundo o aluga?
Porque alugar esconde o trabalho de verdade, e o trabalho de verdade é caro de maneiras que uma tabela de preço por milhão de tokens nunca mostra. As estimativas do setor ainda colocam a grande maioria dos gastos corporativos com API de 2026 em um punhado de fornecedores fechados, e os modelos de pesos abertos em apenas uma pequena minoria, mesmo que já existam pesos abertos credíveis. O motivo não é ignorância. Rodar um modelo de fronteira internamente significa GPUs, uma pilha de serving, atualizações do modelo, segurança e as pessoas que mantêm tudo isso vivo. As análises de custo de 2026 colocam o custo total de propriedade real em três a cinco vezes a linha bruta de hardware, uma vez contados os salários de engenharia e a capacidade ociosa. Para uma equipe que gasta alguns milhares por mês em uma API, contratar um engenheiro de inferência para economizar custa muito mais do que economiza. Alugar costuma ser a resposta certa. O que custa dinheiro às pessoas é alugar sem nunca ter feito a pergunta.
Então quando hospedar por conta própria é de fato a melhor escolha?
Quando a pergunta deixa de ser sobre preço e passa a ser sobre controle. O ponto de cruzamento honesto em que hospedar por conta própria supera a economia da API somente em custo costuma situar-se em algum lugar na faixa de cinquenta mil a duzentos mil dólares de gasto mensal com API, dependendo de quanto você de fato usa o modelo. As razões mais duradouras não são financeiras. Se você opera sob o RGPD, um endpoint próprio ou privado pode ser a única configuração em que seus dados nunca saem de um perímetro que você controla, independentemente do custo naquele trimestre. Se o modelo é o núcleo do seu produto e não uma conveniência, ser dono dos pesos significa que um fornecedor não pode descontinuar, reprecificar nem recusá-lo a seu bel-prazer. Um family office ou uma empresa liderada pelo proprietário quer aquilo que ainda controlará daqui a cinco anos, e isso raramente é a linha mais barata na fatura de hoje.
O que um proprietário deve fazer antes da próxima fatura de IA?
Separe a questão da capacidade da questão da propriedade, porque não são a mesma decisão. Primeiro, decida o que o modelo é para você: um serviço que você consome ou um ativo do qual você depende. Um serviço você quase sempre pode alugar. Um ativo vale a pena possuir. Segundo, exija um custo total de propriedade real, não um preço por token; se a sua equipe só lhe mostra a linha da API, ela não fez a análise. Terceiro, trate a residência de dados e a concentração de fornecedores como riscos de nível de conselho, não como preferências de engenharia, porque é aí que pesos abertos como o DeepSeek V4 mudam o que é possível e não apenas o que é barato. A Servola assessora sobre infraestrutura de IA e a decisão entre construir e alugar, com um único responsável e sem agenda de fornecedor.
Leia a seguir: A Alphabet está a captar 80 mil milhões de dólares para IA. Esse é o seu sinal para parar de competir em infraestrutura. · A Nvidia financia os laboratórios que compram os seus chips. O boom da IA está a pagar-se a si próprio?