DeepSeek lança o modelo V4 em meio a rumores de investimento bilionário de Tencent e Alibaba
O mercado de inteligência artificial está acostumado com surpresas, mas o que a startup chinesa DeepSeek acaba de fazer merece atenção especial.
No final de abril de 2026, a empresa lançou o seu mais novo modelo fundacional open-source, o DeepSeek V4, e o movimento chegou num momento bem estratégico: enquanto gigantes como Tencent e Alibaba circulam nos bastidores com conversas sobre um possível investimento que pode ultrapassar os 20 bilhões de dólares na startup.
E não é só a movimentação financeira que chama a atenção.
O modelo em si já virou assunto na comunidade tech pelo simples fato de chegar com números impressionantes debaixo do braço — e em duas versões diferentes para atender perfis distintos de uso.
A versão Pro e a versão Flash chegam com propostas bem definidas, equilibrando poder de processamento com eficiência de custo, e isso coloca o DeepSeek V4 direto no centro de uma disputa que está ficando cada vez mais acirrada, especialmente dentro da China.
O que é o DeepSeek V4 e por que ele importa
O DeepSeek V4 é o mais recente modelo fundacional da startup chinesa DeepSeek, lançado como open-source — o que significa que qualquer desenvolvedor, empresa ou pesquisador pode acessar, estudar e adaptar o modelo conforme a própria necessidade. Esse detalhe muda bastante a dinâmica do mercado, porque retira barreiras de entrada que normalmente travam a adoção de tecnologias dessa magnitude. Diferente de soluções proprietárias que exigem contratos, APIs pagas e dependência direta do fornecedor, um modelo open-source coloca o poder de decisão nas mãos de quem vai usá-lo — e isso tem um valor enorme para empresas que buscam autonomia tecnológica sem comprometer o orçamento.
Mas não para por aí. O que torna o V4 especialmente relevante é a escala dos seus parâmetros. A versão Pro conta com 1,6 trilhão de parâmetros totais e 49 bilhões de parâmetros ativos, o que faz dela um modelo open-weights treinado com o maior número de parâmetros entre os disponíveis atualmente. Esse patamar era território quase exclusivo dos grandes laboratórios americanos, como OpenAI e Google DeepMind. Alcançar essa faixa como uma startup, ainda oferecendo o modelo de forma aberta, é um feito técnico considerável — e serve como sinal claro de que a corrida pela liderança em inteligência artificial não é mais um duelo bilateral entre Estados Unidos e o restante do mundo. A China está cada vez mais presente nessa conversa, e o DeepSeek V4 é uma prova concreta disso.
Outro ponto importante é o timing do lançamento. Com negociações de investimento envolvendo duas das maiores corporações tecnológicas da China — Tencent e Alibaba — em andamento, o lançamento do V4 funciona quase como uma demonstração pública de capacidade. É a startup mostrando ao mercado, e aos potenciais investidores, que não está apenas prometendo: está entregando. Esse tipo de movimento estratégico diz muito sobre a maturidade da empresa e sobre como ela enxerga o seu próprio posicionamento dentro de um ecossistema altamente competitivo.
Pro e Flash: duas versões, dois objetivos
A divisão do DeepSeek V4 em duas versões — Pro e Flash — não é um detalhe cosmético. Ela reflete uma decisão de produto muito bem pensada, que reconhece que nem todos os casos de uso precisam da mesma configuração.
A versão Pro é a opção mais robusta, projetada para aplicações que demandam raciocínio profundo, contexto longo e alta precisão nas respostas. Com seus 1,6 trilhão de parâmetros totais e 49 bilhões de parâmetros ativos, ela é indicada para tarefas complexas, como análise de documentos extensos, geração de código sofisticado, pesquisa técnica e qualquer cenário onde a qualidade da resposta tem mais peso do que a velocidade de entrega. Para empresas que estão construindo produtos baseados em IA e precisam de consistência e profundidade, a versão Pro tende a ser o caminho natural.
Já a versão Flash aposta numa proposta diferente: eficiência. Com 284 bilhões de parâmetros totais e 13 bilhões de parâmetros ativos, ela foi projetada para oferecer serviços de API mais econômicos. Com uma arquitetura otimizada para velocidade e custo reduzido de inferência, a Flash é voltada para casos de uso onde a escala é o fator determinante — como chatbots de alto volume, sistemas de recomendação em tempo real ou qualquer aplicação que precise processar milhões de requisições sem explodir o custo operacional. A lógica aqui é clara: nem sempre você precisa de um modelo que pensa por dez minutos para responder algo. Às vezes, uma resposta boa o suficiente em milissegundos vale muito mais do que uma resposta perfeita entregue com atraso.
As duas versões compartilham uma característica técnica notável: ambas suportam uma janela de contexto de até um milhão de tokens. Isso significa que o modelo consegue processar e considerar uma quantidade massiva de informação de uma só vez, o que é fundamental para aplicações como análise de contratos longos, revisão de bases de código extensas ou conversas prolongadas com histórico preservado.
Essa estratégia de oferecer múltiplas variações de um mesmo modelo base é algo que vemos cada vez mais no mercado de inteligência artificial — e não por acidente. Empresas como Anthropic, com Claude Haiku e Claude Opus, e Google, com Gemini Flash e Gemini Pro, já perceberam que o mercado não é homogêneo. Há perfis distintos de consumidores, com necessidades distintas e tolerâncias de custo muito diferentes. Ao lançar Pro e Flash simultaneamente, o DeepSeek demonstra que entende essa dinâmica e está posicionando o V4 para competir em várias frentes ao mesmo tempo — o que amplia o alcance do modelo e potencializa a sua adoção dentro do ecossistema open-source.
Sparse Attention: a inovação técnica que reduz drasticamente o custo computacional
Um dos avanços técnicos mais relevantes do DeepSeek V4 é a implementação de um mecanismo chamado Sparse Attention. Essa tecnologia permite que o modelo reduza significativamente a quantidade de computação necessária para processar informações, sem comprometer de forma drástica a qualidade das respostas.
Na versão Flash, a redução de computação chega a 90% em comparação com o modelo anterior, o V3.2. Na versão Pro, a redução é de 70%. Esses números são impressionantes porque significam que rodar o V4 custa muito menos em termos de infraestrutura — e custo computacional é um dos maiores gargalos para qualquer empresa que trabalha com modelos de linguagem em larga escala.
Pra ter uma ideia do impacto, imagine uma empresa que roda milhões de chamadas de API por dia. Cada percentual de eficiência ganha se traduz em economia real de energia, hardware e dinheiro. Uma redução de 90% na computação necessária não é apenas uma melhoria incremental — é uma transformação completa na equação de viabilidade econômica de projetos baseados em IA. Isso tem o potencial de tornar o DeepSeek V4 Flash uma das opções mais atrativas do mercado para operações de alto volume.
Benchmarks: onde o V4 brilha e onde ainda precisa evoluir
Os resultados do DeepSeek V4 em avaliações independentes mostram um cenário misto, com pontos fortes evidentes e áreas onde os concorrentes ainda mantêm vantagem.
De acordo com a firma de avaliação VALS AI, o V4 alcançou uma precisão média de 63,87% em testes que cobrem áreas como finanças, direito e programação. Embora esse seja um resultado respeitável, ele fica atrás de modelos como o Claude Opus 4.6 da Anthropic, o Gemini 3.1 Pro Preview do Google, o GPT-5.4 da OpenAI e até o Kimi K2.6 da Moonshot AI, que não só superou o V4 em precisão média como também apresentou velocidade de saída superior.
Por outro lado, o DeepSeek V4 se mostrou competitivo em áreas específicas como matemática, STEM e programação, onde seus resultados se equiparam aos melhores modelos do mercado. Isso sugere que o modelo tem pontos fortes bem definidos que podem ser explorados em aplicações onde essas habilidades são prioritárias.
Para os desenvolvedores, o quadro é de uma evolução significativa em relação às versões anteriores, mesmo que o V4 não tenha dominado todas as categorias de benchmark. A combinação de desempenho sólido em tarefas técnicas com a eficiência proporcionada pelo Sparse Attention cria um pacote bastante atrativo, especialmente para quem precisa de um modelo open-source de alto desempenho sem pagar os custos de APIs proprietárias.
Concorrência chinesa: DeepSeek não está sozinho nessa corrida
O lançamento do V4 acontece em um momento particularmente agitado no ecossistema de IA chinês. Poucos dias antes, a própria Tencent havia lançado o seu modelo Hy3 Preview, um sistema mixture-of-experts com 295 bilhões de parâmetros, dos quais 21 bilhões são ativados, com capacidade de processar até 256 mil tokens de contexto. O modelo já foi implantado no Yuanbao, o chatbot principal da Tencent, que substituiu justamente o DeepSeek como tecnologia base.
A movimentação da Tencent faz parte de uma reestruturação mais ampla, liderada por Yao Shunyu, nomeado como cientista-chefe de IA da empresa em dezembro de 2025. A estratégia da Tencent enfatiza utilidade prática em vez de perseguir apenas resultados em benchmarks — uma abordagem pragmática que reflete as necessidades reais do seu enorme ecossistema de produtos e serviços.
Ainda assim, a Tencent enfrenta desafios significativos na adoção de seus produtos de IA. O Yuanbao registrava 57,35 milhões de usuários ativos mensais em março de 2026, um número modesto quando comparado aos 345 milhões do Doubao, chatbot da ByteDance, e aos 166 milhões do Qianwen, solução da Alibaba. Essa diferença mostra que ter um modelo tecnicamente competente é apenas parte da equação — distribuição e experiência do usuário continuam sendo fatores decisivos.
Além da Tencent, startups como a Moonshot AI e a Zhipu AI também seguem evoluindo suas ofertas. O Kimi K2.6 da Moonshot, por exemplo, superou o DeepSeek V4 tanto em precisão quanto em velocidade nos testes da VALS AI, mostrando que o cenário chinês de IA é extremamente dinâmico e que nenhum player pode se dar ao luxo de relaxar.
Trilhões de parâmetros: o que esse número significa na prática
Quando a gente fala em parâmetros em modelos de inteligência artificial, estamos falando essencialmente das variáveis internas que o modelo ajusta durante o treinamento para aprender padrões, relações e contextos a partir dos dados. Quanto mais parâmetros, maior a capacidade do modelo de capturar nuances complexas — mas também maior a demanda por recursos computacionais para treinar e rodar esse modelo. Por muito tempo, modelos com trilhões de parâmetros eram considerados inacessíveis para quem não tinha o nível de infraestrutura das big techs americanas.
O DeepSeek V4 chegar nessa faixa como um modelo open-source é, portanto, um marco relevante. Significa que a comunidade de desenvolvedores agora tem acesso a um nível de capacidade que antes estava trancado atrás de APIs pagas e acordos comerciais. Pesquisadores podem estudar o comportamento do modelo em profundidade, identificar vieses, propor melhorias e criar versões especializadas para domínios específicos — como saúde, direito ou finanças — sem precisar pedir permissão para ninguém. Isso acelera o ritmo de inovação de uma forma que modelos fechados simplesmente não conseguem replicar.
Claro que parâmetros não são tudo. A qualidade do dado de treinamento, a arquitetura escolhida, as técnicas de alinhamento e o processo de ajuste fino têm tanto peso quanto o tamanho bruto do modelo. Mas o número de parâmetros ainda é um indicador razoável de capacidade potencial — e chegar nessa escala com uma abordagem open-source posiciona o DeepSeek V4 como uma alternativa séria para quem está avaliando qual modelo adotar em projetos de grande porte. A combinação de escala, abertura e custo acessível é uma proposta de valor difícil de ignorar.
O peso do investimento bilionário no cenário
As negociações envolvendo Tencent e Alibaba como potenciais investidores no DeepSeek não são apenas uma notícia financeira — elas contam uma história sobre como o mercado de inteligência artificial na China está se reorganizando. Um aporte que pode superar os 20 bilhões de dólares colocaria o DeepSeek em outro patamar de recursos, permitindo um ritmo de desenvolvimento que hoje ainda é limitado pela comparação com os orçamentos das grandes empresas americanas. Com esse volume de capital disponível, a startup teria condições de acelerar o treinamento de modelos ainda maiores, expandir sua infraestrutura de dados e contratar os melhores talentos disponíveis no mercado global.
Para Tencent e Alibaba, o interesse faz todo sentido estratégico. Ambas as empresas estão construindo seus próprios ecossistemas de IA — a Tencent com o Hunyuan e a Alibaba com o Qwen — mas investir numa startup que já demonstrou capacidade técnica de alto nível é uma forma de garantir uma posição relevante numa corrida cujo resultado ainda não está definido. É a lógica clássica do portfólio: se você não consegue vencer todos os adversários internamente, vale apostar em quem tem potencial de chegar na frente. E o DeepSeek, com o V4 no portfólio, tem argumentos sólidos para justificar essa aposta.
Além disso, o contexto geopolítico adiciona uma camada extra de urgência a tudo isso. Com restrições americanas sobre exportação de chips avançados para a China, as empresas chinesas de tecnologia estão sendo pressionadas a desenvolver soluções cada vez mais eficientes dentro das limitações de hardware disponíveis. O DeepSeek já mostrou em versões anteriores que é capaz de extrair performance competitiva de configurações de hardware mais modestas. Isso não é uma qualidade menor: é uma vantagem estratégica direta no contexto atual, e reforça ainda mais o argumento para que grandes corporações chinesas coloquem dinheiro no projeto. 💡
O que esperar daqui pra frente
O cenário que se desenha após o lançamento do DeepSeek V4 é de uma competição ainda mais intensa no mercado global de IA. Com modelos open-source cada vez mais poderosos e eficientes, a pressão sobre empresas que operam com modelos fechados tende a aumentar. A pergunta que muitos desenvolvedores e empresas vão se fazer nos próximos meses é: faz sentido pagar por uma API proprietária quando existe uma alternativa aberta com desempenho comparável em diversas tarefas?
Ao mesmo tempo, o possível investimento de Tencent e Alibaba pode transformar a dinâmica competitiva de maneira imprevisível. Se confirmado, o aporte daria ao DeepSeek recursos para competir ainda mais diretamente com gigantes como OpenAI, Anthropic e Google — não apenas em capacidade técnica, mas também em infraestrutura, distribuição e ecossistema de parceiros.
Para a comunidade tech, o recado do V4 é claro: os modelos open-source não estão apenas acompanhando a evolução dos modelos fechados — eles estão, em muitos aspectos, definindo o ritmo dessa evolução. E isso beneficia todo o ecossistema, dos pesquisadores acadêmicos às startups que estão construindo a próxima geração de aplicações baseadas em inteligência artificial.
O DeepSeek V4 chega como um dos modelos open-source mais ambiciosos já lançados, combinando escala de trilhões de parâmetros com inovações como Sparse Attention, uma estratégia de produto bem estruturada em duas versões e um contexto de investimento que pode transformar a startup numa das forças centrais da inteligência artificial global nos próximos anos.
