Conforme publicado pelo WCCFTech no último sábado (26), a DeepSeek, startup chinesa de inteligência artificial, volta aos holofotes com rumores sobre seu novo projeto: o DeepSeek R2.
Após o impacto causado pelo modelo R1, que surpreendeu o Ocidente com sua capacidade e preço agressivo, a novidade agora promete levar essa disputa a um novo nível, combinando alta escala com custos extremamente reduzidos.
- Jensen Huang quebra o silêncio, fala sobre a DeepSeek e causa polêmica
- Como a DeepSeek e os especuladores do mercado de IA afetaram a NVIDIA
Arquitetura deve ser um diferencial

De acordo com fontes chinesas, o DeepSeek R2 deve adotar uma arquitetura híbrida baseada em MoE (Mixture of Experts) aprimorada, potencialmente combinando camadas densas e sistemas avançados de seleção de especialistas.
O novo design permitiria ao modelo atingir cerca de 1,2 trilhão de parâmetros, o dobro da capacidade do R1, o que o colocaria em pé de igualdade com pesos-pesados como o GPT-4 Turbo e o Gemini 2.0 Pro.
Custo da solução surpreende
Mas a novidade mais chamativa não é apenas o tamanho: o custo operacional do R2 pode ser um divisor de águas. Estima-se que o custo por token gerado seja até 97% mais barato que o do GPT-4, tornando o modelo chinês uma alternativa extremamente competitiva para empresas que buscam soluções de IA escaláveis e econômicas.
Outro dado relevante é a infraestrutura usada no treinamento: o R2 teria sido treinado majoritariamente em clusters de chips Ascend 910B da Huawei, alcançando uma eficiência de 82% e uma capacidade de 512 PetaFLOPS em precisão FP16, o que sinaliza uma mudança estratégica clara: a aposta da DeepSeek em tecnologia local para ganhar independência da cadeia de suprimentos ocidental.
Confirmações oficiais pendentes
Embora essas informações ainda não tenham sido confirmadas oficialmente, especialistas já enxergam o DeepSeek R2 como uma possível grande virada para o mercado de IA, ainda mais em um momento em que o custo de desenvolvimento é cada vez mais decisivo.