O diretor do Wayback Machine, serviço vinculado ao Internet Archive e que salva páginas da web de todo o mundo, está preocupado. Os editores bloqueiam o backup de seus sites pela Wayback Machine por medo de que ele seja usado para treinar IA.

Preservar a Web não é o problema, perdê-la é “. É com estas palavras que Mark Graham, diretor responsável pela Wayback Machine no Internet Archive, iniciou sua coluna para denunciar o bloqueio da ferramenta por alguns editores de imprensa.

Na verdade, durante várias semanas, certos grupos grandes, como O GuardiãoO New York Times ou mesmo Redditbloquearam seu site para bloquear ou limitar o acesso ao seu conteúdo pela Wayback Machine, impedindo efetivamente que ela salvasse suas páginas da web para inclusão no arquivo global da web.

Este movimento por parte de grandes editores de conteúdo é alegadamente motivado pelo receio de que os gigantes da IA ​​utilizem o Internet Archive como uma “porta dos fundos” para desviar este conteúdo em grande escala, a fim de treinar os seus modelos.

Medos infundados que correm o risco de penalizar a memória da Web

Para Mark Graham, estes receios são infundados. Ele lembra que o Internet Archive, organização sem fins lucrativos que existe há trinta anos, tornou-se uma fonte essencial para muitos profissionais como pesquisadores, jornalistas e até tribunais.

Usamos mecanismos de limitação de taxa, filtragem e monitoramento para evitar acesso abusivo, e monitoramos e respondemos ativamente a novos esquemas de raspagem à medida que surgem. » explica o diretor da Wayback Machine.

Para ele, bloquear bibliotecas digitais não é a solução a adotar face aos desafios colocados pela IA. Um bloqueio massivo deste arquivamento da Web poderia, de facto, causar danos irreversíveis à memória colectiva da Web. Pior ainda, isto poderia impedir que os investigadores encontrassem provas ou que os jornalistas pudessem cruzar ou verificar informações.

01net.com abril de 2000
© 01net.com tal como existia quando foi lançado em abril de 2000. Sem a Wayback Machine e o Internet Archive, essas memórias seriam permanentemente apagadas da Web.

Um verdadeiro dilema para os editores

Em apenas alguns meses, as capacidades dos grandes modelos de IA aumentaram dez vezes. É provavelmente por isso que os editores se sentem cada vez mais vulneráveis. Alguns também fazem campanha há anos para impedir o que consideram ser um “pilhagem” do seu conteúdo, para “alimentar o monstro”, com danos em jogo.

Leia também: Após o fracasso das negociações entre a tecnologia e os detentores de direitos, em breve uma nova lei para proteger os criadores?

Eles também temem, e acima de tudo, que a IA generativa distraia potenciais leitores do seu site, fornecendo-lhes uma resposta direta. Não é por acaso que a Microsoft se ofereceu recentemente para arbitrar a situação, oferecendo-se para remunerar os editores quando o seu conteúdo for utilizado por uma IA.

Mas ao bloquearem o arquivamento do seu site pela Wayback Machine, por medo de serem saqueados pela IA, não estão a dar um tiro no próprio pé ao contribuir para o enfraquecimento e a fragmentação da Web?

👉🏻 Acompanhe notícias de tecnologia em tempo real: adicione 01net às suas fontes no Google e assine nosso canal no WhatsApp.

Fonte :

Tecnologia

Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *