o lançamento iminente do DeepSeek V4 está causando pânico no Vale do Silício

Já faz pouco mais de um ano DeepSeek apresentou seu modelo DeepSeek-V3, uma surpresa no mundo da inteligência artificial. Da noite para o dia, um modelo chinês conseguiu competir Bate-papoGPTum sinal muito claro de que o país estava se recuperando na corrida pela IA. Seu custo de desenvolvimento anunciado é quase insignificante em comparação com a concorrência e sua operação requer muito menos recursos. E é publicado sob uma licença gratuita.

Agora, o DeepSeek se prepara para repetir a experiência com o DeepSeek-V4. Outras empresas aproveitaram o Ano Novo Chinês para lançar os seus novos modelos, como Alibaba, Zhipu AI ou Moonshot AI, e o anúncio da DeepSeek seria iminente, talvez ainda antes do final das festividades.

Apesar do embargo americano, a China está acelerando… e surpreendendo a OpenAI. ©XD

Etiquetas:

tecnologia

A lacuna está diminuindo perigosamente entre a China e o Vale do Silício em matéria de IA: visão geral dos últimos avanços

Leia o artigo

Novas tecnologias altamente esperadas

Dependendo do desempenho do novo modelo, poderia representar um novo obstáculo e já preocuparia os concorrentes americanos, em particular a OpenAI, Google e Antrópico. Embora esses gigantes invistam bilhões de dólares em centros de dadosDeepSeek anunciou que o treinamento de seu V3 custou menos de US$ 6 milhões. De acordo com Reutersque cita uma fonte da administração Trump, esta nova versão teria sido treinada em chips Blackwell da Nvidia, enquanto estivessem sob embargo. Esses processadores seriam instalados em seu data center localizado na Região Autônoma da Mongólia Interior.

ASML é a única empresa no mundo a oferecer máquinas de litografia ultravioleta extrema. © XD com ChatGPT

Etiquetas:

tecnologia

Sem esta empresa europeia, nem o iPhone, nem a IA e tantos outros existiriam realmente: a história de uma aposta maluca

Leia o artigo

DeepSeek-V4 seria baseado na nova arquitetura Model1 que reduz o uso de memória em até 40%, distribuindo melhor os dados e colocando os acessados com mais frequência na memória mais rápida, e arquivando os menos utilizados. Isto teria o efeito de reduzir os custos operacionais e aumentaria o janela contextual além de um milhão de tokens. Também integra a decodificação “Sparse FP8”, onde a precisão varia dependendo da importância dos tokens, o que permitiria multiplicar o velocidade inferência por 1,8.

A nova versão do chatbot chinês DeepSeek poderá ser lançada nos próximos dias. © Solen Feyissa, Unsplash

A DeepSeek também divulgou recentemente detalhes sobre seu módulo Engram, que deve ser a base do V4, que separa a memória de curto e longo prazo, evitando que processe todo o histórico de conversas a cada solicitação. Por fim, o novo modelo deverá também integrar tecnologia Hiperconexões com restrições múltiplas (mHC), uma técnica que visa estabilizar grandes modelos fornecendo restrições matemáticas.

Práticas que levantam questões

No entanto, a IA chinesa também é controversa. Diante dos riscos de viés nas respostas e no envio de dados aos servidores chineses para a versão do chatbot acessível online, vários países proibiram seu uso por órgãos governamentais, incluindo Taiwan, Itália, Holanda, República Tcheca e parte dos Estados Unidos. Além disso, DeepSeek teria usado o destilação treinar o V3 a um custo menor. Em vez de usar grandes bancos de dados Para treinamento, o modelo teria se conectado ao ChatGPT para utilizar suas respostas para agilizar o processo. Acusação renovada em 12 de fevereiro de 2026.

O data center da Starcloud será composto por módulos alimentados por uma usina de energia solar. © Starcloud

Etiquetas:

tecnologia

Uma ideia maluca? Nem tanto: os data centers em breve deixarão a Terra!

Leia o artigo

A OpenAI não está sozinha ao acusar o DeepSeek de trapacear dessa forma. A Anthropic, desenvolvedora do chatbot Claude, também acaba de acusá-la de usar destilação, assim como duas outras empresas chinesas, nomeadamente Moonshot AI e MiniMax. Eles teriam criado cerca de 24 mil contas e conduzido mais de 16 milhões de conversas com Claude.

Isto levanta uma questão importante: será que a China conseguiu recuperar o atraso em termos de matéria da IA ou simplesmente duplica os resultados dos modelos americanos? O lançamento do DeepSeek-V4 sem dúvida nos fornecerá alguns esclarecimentos.

Fonte

o lançamento iminente do DeepSeek V4 está causando pânico no Vale do Silício

Byirabrins771@gmail.com

A lacuna está diminuindo perigosamente entre a China e o Vale do Silício em matéria de IA: visão geral dos últimos avanços

Novas tecnologias altamente esperadas

Sem esta empresa europeia, nem o iPhone, nem a IA e tantos outros existiriam realmente: a história de uma aposta maluca

Práticas que levantam questões

Uma ideia maluca? Nem tanto: os data centers em breve deixarão a Terra!

By irabrins771@gmail.com

Related Post

Esses pesquisadores descobrem uma pista surpreendente… escondida em seu cabelo, anos antes dos sintomas

Água e agricultura, uma questão crucial sob tensão climática

Os vulcões e as megaincêndios podem explicar o aquecimento atual? Este estudo do MIT é uma virada de jogo

Deixe um comentário Cancelar resposta

You missed

Porta-voz do governo descreve o relatório do La France insoumise à imprensa como “totalitário e conspiratório”

“Meu terno amor”: Virginie (Love está na pré temporada 9) comemora aniversário do marido Thomas com linda declaração

Esses pesquisadores descobrem uma pista surpreendente… escondida em seu cabelo, anos antes dos sintomas

A Tesla poderia finalmente corrigir uma das falhas mais irritantes de seus carros elétricos: os limpadores de para-brisa — Frandroid