Já faz pouco mais de um ano DeepSeek apresentou seu modelo DeepSeek-V3, uma surpresa no mundo da inteligência artificial. Da noite para o dia, um modelo chinês conseguiu competir Bate-papoGPTum sinal muito claro de que o país estava se recuperando na corrida pela IA. Seu custo de desenvolvimento anunciado é quase insignificante em comparação com a concorrência e sua operação requer muito menos recursos. E é publicado sob uma licença gratuita.
Agora, o DeepSeek se prepara para repetir a experiência com o DeepSeek-V4. Outras empresas aproveitaram o Ano Novo Chinês para lançar os seus novos modelos, como Alibaba, Zhipu AI ou Moonshot AI, e o anúncio da DeepSeek seria iminente, talvez ainda antes do final das festividades.

Etiquetas:
tecnologia
A lacuna está diminuindo perigosamente entre a China e o Vale do Silício em matéria de IA: visão geral dos últimos avanços
Leia o artigo
Novas tecnologias altamente esperadas
Dependendo do desempenho do novo modelo, poderia representar um novo obstáculo e já preocuparia os concorrentes americanos, em particular a OpenAI, Google e Antrópico. Embora esses gigantes invistam bilhões de dólares em centros de dadosDeepSeek anunciou que o treinamento de seu V3 custou menos de US$ 6 milhões. De acordo com Reutersque cita uma fonte da administração Trump, esta nova versão teria sido treinada em chips Blackwell da Nvidia, enquanto estivessem sob embargo. Esses processadores seriam instalados em seu data center localizado na Região Autônoma da Mongólia Interior.

Etiquetas:
tecnologia
Sem esta empresa europeia, nem o iPhone, nem a IA e tantos outros existiriam realmente: a história de uma aposta maluca
Leia o artigo
DeepSeek-V4 seria baseado na nova arquitetura Model1 que reduz o uso de memória em até 40%, distribuindo melhor os dados e colocando os acessados com mais frequência na memória mais rápida, e arquivando os menos utilizados. Isto teria o efeito de reduzir os custos operacionais e aumentaria o janela contextual além de um milhão de tokens. Também integra a decodificação “Sparse FP8”, onde a precisão varia dependendo da importância dos tokens, o que permitiria multiplicar o velocidade inferência por 1,8.

A nova versão do chatbot chinês DeepSeek poderá ser lançada nos próximos dias. © Solen Feyissa, Unsplash
A DeepSeek também divulgou recentemente detalhes sobre seu módulo Engram, que deve ser a base do V4, que separa a memória de curto e longo prazo, evitando que processe todo o histórico de conversas a cada solicitação. Por fim, o novo modelo deverá também integrar tecnologia Hiperconexões com restrições múltiplas (mHC), uma técnica que visa estabilizar grandes modelos fornecendo restrições matemáticas.
Práticas que levantam questões
No entanto, a IA chinesa também é controversa. Diante dos riscos de viés nas respostas e no envio de dados aos servidores chineses para a versão do chatbot acessível online, vários países proibiram seu uso por órgãos governamentais, incluindo Taiwan, Itália, Holanda, República Tcheca e parte dos Estados Unidos. Além disso, DeepSeek teria usado o destilação treinar o V3 a um custo menor. Em vez de usar grandes bancos de dados Para treinamento, o modelo teria se conectado ao ChatGPT para utilizar suas respostas para agilizar o processo. Acusação renovada em 12 de fevereiro de 2026.

Etiquetas:
tecnologia
Uma ideia maluca? Nem tanto: os data centers em breve deixarão a Terra!
Leia o artigo
A OpenAI não está sozinha ao acusar o DeepSeek de trapacear dessa forma. A Anthropic, desenvolvedora do chatbot Claude, também acaba de acusá-la de usar destilação, assim como duas outras empresas chinesas, nomeadamente Moonshot AI e MiniMax. Eles teriam criado cerca de 24 mil contas e conduzido mais de 16 milhões de conversas com Claude.
Isto levanta uma questão importante: será que a China conseguiu recuperar o atraso em termos de matéria da IA ou simplesmente duplica os resultados dos modelos americanos? O lançamento do DeepSeek-V4 sem dúvida nos fornecerá alguns esclarecimentos.