A Meta, empresa de Mark Zuckerberg, está no centro de uma polêmica envolvendo o uso de livros protegidos por direitos autorais para treinar seus modelos de inteligência artificial.
De acordo com documentos judiciais, a empresa teria baixado pelo menos 81,7 terabytes (TB) de dados de fontes ilegais, como a LibGen e a Z-Library, por meio de torrents. As informações vieram à tona em janeiro deste ano, quando detentores de direitos autorais nos Estados Unidos entraram com um processo contra a gigante de tecnologia.
Os e-mails internos da Meta, anexados ao processo, revelam que funcionários da empresa utilizaram serviços como o LibTorrent para acessar milhões de livros de forma ilegal. Um dos funcionários chegou a expressar preocupação sobre o uso de endereços IP da empresa para baixar conteúdo pirata, indicando que a companhia estava ciente da ilegalidade das ações.
Além disso, os documentos mostram que a Meta também teria baixado outros 80,6 TB de dados da LibGen anteriormente, totalizando mais de 160 TB de material potencialmente protegido por direitos autorais.
O que diz a Meta
A Meta alega que o uso desses dados se enquadra na doutrina do "fair use" (uso justo), que permite o uso limitado de material protegido sem a necessidade de autorização do detentor dos direitos. A empresa argumenta que o treinamento de modelos de IA não visa lucro direto e que os autores do processo não conseguiram identificar trechos específicos de livros que teriam sido usados pela companhia.
Além disso, a gigante de tecnologia nega ter distribuído os livros baixados, o que poderia configurar uma violação adicional dos direitos autorais.
A LibGen e a Z-Library, plataformas citadas no processo, são conhecidas por hospedar milhões de livros e artigos científicos, muitos deles protegidos por direitos autorais. Esses sites operam em uma zona cinzenta da legalidade, frequentemente associados à pirataria digital. O uso dessas fontes por uma empresa do porte da Meta levanta diversas questões éticas e legais sobre como grandes corporações de tecnologia obtêm dados para treinar sistemas de IA.
Especialistas em direitos autorais apontam que o caso pode estabelecer um precedente importante para a indústria de IA. "Se a Meta for considerada culpada, isso pode forçar outras empresas a repensarem como obtêm e usam dados para treinar seus modelos", explica um analista jurídico.
Por outro lado, se a empresa vencer o caso, isso pode abrir caminho para um uso mais amplo de material protegido sob a justificativa de "fair use".
Enquanto o caso segue nos tribunais, a Meta não se manifestou publicamente sobre as acusações. A empresa tem se concentrado em defender suas ações judicialmente, mas a falta de transparência sobre o assunto tem gerado críticas de especialistas e ativistas.
O caso também reacendeu o debate sobre a necessidade de regulamentações mais claras para o uso de dados protegidos em projetos de IA, especialmente em um momento em que a tecnologia generativa está se tornando cada vez mais presente no cotidiano.
Para ficar por dentro das principais notícias de tecnologia, siga o TechShake no Instagram.
VEJA TAMBÉM!