Mistral faz ouvir sua musiquinha. Em vez de tentar competir com os principais players americanos de IA, a start-up francesa tomou um caminho lateral ao oferecer uma alternativa aos modelos dominantes de IA. A nova entrega do Mistral 3 quer assim adaptar-se aos dispositivos e funcionar localmente, seja em smartphones, PCs, carros ou mesmo drones.

Mistral não fazia as coisas pela metade. A jovem empresa revelou hoje o Mistral 3, uma família de dez (!) modelos de IA de código aberto, capazes de operar tanto em servidores remotos como localmente, num smartphone ou num drone. O novo carro-chefe da linha, Mistral Large 3, mobiliza 41 bilhões de parâmetros ativos; suporta texto e imagens e aceita consultas muito longas (256.000 tokens).

Dez modelos para agitar o mercado de IA

A sua particularidade, e este é o caso de todos os modelos Mistral, é que é multilingue: a sua formação foi realizada com dados em inglês claro, mas também outras línguas. Portanto, este modelo é utilizável em ambientes linguísticos mais amplos do que outros modelos concorrentes mais focados em inglês ou chinês.

O que atrai particularmente o interesse neste novo lote são os modelos Ministral 3. Esses modelos de três tamanhos (14 bilhões, 8 bilhões e 3 bilhões de parâmetros) são oferecidos cada um em três versões: um modelo básico destinado à personalização, uma versão de “instrução” para uso conversacional e uma variante de “raciocínio” otimizada para tarefas que exigem lógica mais estruturada.

O modelo menor pode rodar localmente em dispositivos com 4 GB de memória de vídeo; ou seja, pode ser executado em computadores básicos ou em sistemas embarcados, onde a conectividade com a nuvem não é garantida. A ideia principal de Mistral é demonstrar que um modelo bem ajustado e personalizado às suas necessidades pode competir, e até fazer melhor, do que um modelo muito maior e mais complexo.

O outro trunfo da Mistral continua sendo seu apego ao código aberto. Todos os modelos da família Mistral 3 são publicados sob a licença Apache 2.0, uma das mais permissivas do setor: desenvolvedores e empresas podem explorá-los livremente, modificá-los, integrá-los em seus próprios produtos e, acima de tudo, treiná-los com seus próprios dados sem nunca expô-los a um serviço de terceiros.

A abordagem da start-up contrasta com os sistemas proprietários da OpenAI, Google ou Anthropic, cujo funcionamento interno permanece opaco. Para Mistral, a transparência e a capacidade de personalização são uma grande vantagem estratégica, especialmente em sectores regulamentados onde o controlo da infra-estrutura e a soberania dos dados não são negociáveis ​​(governo, empresas e organizações públicas).

Resta um elemento que Mistral reconhece prontamente: os seus modelos não pretendem competir, em potência bruta, com os mais recentes sistemas fechados dos seus concorrentes americanos. Mas a start-up desempenha um papel diferente. Enquanto os gigantes apostam em modelos cada vez mais massivos, a Mistral aposta na modularidade e na personalização. Um modelo menor, ajustado a um caso de uso específico, pode muitas vezes superar um modelo geral muito mais caro, ao mesmo tempo que fornece melhor controle de dados, desempenho previsível e integração mais flexível à infraestrutura existente.

Para muitas empresas, esta capacidade de moldar a sua própria IA é agora tão importante, se não mais, do que a busca pelo poder máximo. Os novos modelos Mistral 3 já estão disponíveis.

👉🏻 Acompanhe notícias de tecnologia em tempo real: adicione 01net às suas fontes no Google News, assine nosso canal no WhatsApp ou siga-nos em vídeo no TikTok.

Fonte :

Mistral



Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *