
A utilização de obras intelectuais para o treinamento de sistemas de Inteligência Artificial [1] sem a devida autorização dos autores tem consolidado um novo cenário de disputas jurídicas no Brasil. O avanço de tecnologias de web scraping (raspagem de dados), que coletam volumes massivos de informações para alimentar algoritmos, é atualmente confrontado pela legislação de direitos autorais, podendo resultar em sanções civis e criminais para as empresas de tecnologia.
O treinamento de Inteligência Artificial a partir de repositórios de dados, como o LAION 5B, tem sido associado a problemas graves de segurança digital. Relatórios indicam que o uso indevido de conteúdos protegidos facilita a criação de deepfakes, manipulação de voz e imagem, além da violação direta da propriedade intelectual.
Segundo o advogado Guilherme Sadi [2], sócio-fundador do escritório Sadi//Morishita Advogados e especialista em Direito Digital, a infração ocorre no momento em que a obra é reproduzida ou distribuída sem anuência.
"A infração de direitos autorais ocorre ao usar, reproduzir, vender ou distribuir obras intelectuais protegidas sem autorização expressa do autor ou titular, conforme a Lei 9.610/98", explica Sadi.
Medidas judiciais e consequências para empresas
Quando a Inteligência Artificial utiliza conteúdos sem permissão, os titulares podem adotar medidas que vão desde a notificação extrajudicial até a busca por indenizações. Maurício Morishita, também especialista em Direito Digital, destaca que o impacto para as empresas de tecnologia ultrapassa o campo financeiro, atingindo a credibilidade no mercado.
"As empresas podem sofrer ações de remoção de conteúdos mediante tutela antecipada, além de pedidos de danos materiais e morais. A Inteligência Artificial não possui exclusão da necessidade de obter anuência expressa do titular", afirma Morishita. O especialista reforça que o uso não autorizado configura desvio de clientela, uma vez que receitas que deveriam ser do autor são direcionadas à empresa desenvolvedora da tecnologia.
Técnicas de prevenção para detentores de conteúdo
Para mitigar os riscos de ter seus dados capturados por uma Inteligência Artificial de forma automática, especialistas recomendam a implementação de barreiras técnicas e jurídicas:
Aplicação de CAPTCHA: Dificulta a ação de robôs de raspagem.
Rate Limiting: Limitação da taxa de requisições por IP.
Marcas D’água: Proteção visual e metadados em imagens e vídeos.
Notificações de "No AI Training": Declaração explícita de proibição de uso para modelos.
Direito de Oposição (Opt-Out): Ferramentas que permitem ao autor solicitar a exclusão de seus dados.
A tendência é que o cerco judicial se feche contra plataformas que operam sem transparência sobre a origem de seus bancos de dados, exigindo que a Inteligência Artificial respeite a remuneração e a autoria das obras intelectuais que a sustentam.
[1] https://abcdoabc.com.br/marca-na-era-da-ia-vale-mais-que-ativos-fisicos/
[2] https://www.instagram.com/sadi_guilherme/