Yannick Dehée, historiador e fundador da Nouveau Monde Editions, é o primeiro “pedir à Mistral AI que compense os autores e editores franceses que pirateou”. Isso garante Mundo que o campeão francês da inteligência artificial (IA) utilizou para treinar o seu modelo generativo de IA, “mais de 200 títulos do seu catálogo”, ou mais de um quinto do seu fundo, sem nunca lhe pagar um centavo.
De acordo com uma pesquisa de Mediapart de 22 de dezembro de 2025, o diretor científico da Mistral AI, Guillaume Lample – que anteriormente trabalhou na Meta – havia implorado para que a Meta treinasse sua IA generativa, LLaMA, em “baseando-se em milhões de livros coletados pela Library Genesis (LibGen), um site pirata”. O que seria, segundo Mediapartpermitir “o hackeamento de várias dezenas de terabytes (um terabyte equivale a 1.000 gigabytes) de dados”.
A questão toda é se a Mistral AI também usou o LibGen, como Yannick Dehée está convencido. Porta-voz da Mistral AI “disputa as alegações das Edições Nouveau Monde”sem dizer claramente que o LibGen não foi utilizado. E simplesmente adicione: “Os modelos da Mistral AI são treinados, testados e validados em um conjunto de dados diversificado que abrange vários idiomas e geografias, e cuidadosamente selecionados de várias fontes para garantir ampla cobertura e aprendizado de alta qualidade. Esses dados incluem informações públicas disponíveis na Internet, conjuntos de dados não públicos licenciados de terceiros e dados gerados internamente. »
“Como piratas americanos”
“Se você não tivesse usado o LibGen, ainda seria fácil dizer”retruca Yannick Dehée, que lembra que a start-up Mistral AI “é francês, parcialmente financiado pelas autoridades públicas” E “não podem se comportar como piratas americanos”.
No entanto, é do outro lado do Atlântico que a Nouveau Monde Editions – uma das editoras prejudicadas pela Anthropic nos Estados Unidos – vencerá a causa. Pelo menos cinco obras da empresa francesa traduzidas para o inglês foram usadas ilegalmente para treinar a IA generativa Claude da Anthropic. Esta última concordou, em setembro de 2025, num acordo amigável, em pagar pelo menos 1,5 mil milhões de dólares (1,26 mil milhões de euros) a um fundo de compensação para autores, titulares de direitos e editores que processavam a empresa por ter descarregado ilegalmente milhões de livros.
Você ainda tem 9,57% deste artigo para ler. O restante é reservado aos assinantes.