Por Stephen Wolfson, traduzido por Leonardo Foletto e Pedro Lana*
Texto publicado originalmente no site do CC
Embora a IA generativa como ferramenta de expressão artística não seja verdadeiramente nova (a IA tem sido utilizada para criar arte desde, pelo menos, a década de 1970 – a casa de leilões de arte Christie’s vendeu a sua primeira peça de arte com IA em 2018), o ano passado lançou esta tecnologia instigante e disruptiva no imaginário público. Com uma rapidez incrível, o desenvolvimento e a disponibilização generalizada de ferramentas fantásticas como a Stable Diffusion e a Midjourney geraram entusiasmo, debate e, de fato, receio sobre o que o futuro pode reservar e o papel que a IA generativa deve ter na produção de obras criativas.
Talvez sem surpresa para quem tem estado atento à conversa em torno da IA generativa, o ano passado também viu os primeiros processos judiciais a colocara em causa a legalidade destas ferramentas. Primeiro, em Novembro, um grupo de programadores processou o Github e a OpenAI em razão da ferramenta de geração de código, Github Copilot, alegando (entre outras coisas) que a ferramenta remove indevidamente informações de gestão de direitos de autor do código nos seus metadados, em violação do Digital Millennium Copyright Act (DMCA – Lei de Direitos Autorais dos EUA), e reproduz código nos seus dados de treinamento sem seguir as estipulações do contrato de licença, como a obrigação de atribuir a autoria do código ao seu criador original. Depois, em janeiro, um grupo de artistas (representados pelos mesmos advogados que no processo do Github) processou a Stability AI e a Midjourney por causa das suas ferramentas de geração de arte de texto para imagem. Nesta segunda ação judicial, os artistas reclamantes fizeram várias alegações, todas elas merecedoras de discussão.
Neste post, vou abordar uma dessas alegações: que a utilização das obras protegidas por direitos de autor dos reclamantes (e de cerca de 5 bilhões de outras obras) para treinar o Stable Diffusion e o Midjourney constitui uma violação dos direitos de autor. Como a Creative Commons já argumentou, e outros concordam, acredito que este tipo de utilização deve ser protegido pela doutrina de “uso justo” (ou fair use, termo anglófono pela qual é conhecida) dos direitos de autor. Nesta publicação, vou discutir o que é “uso justo”, qual o seu objetivo e porque é que acredito que a utilização de obras protegidas por direitos de autor para treinar modelos de IA generativos deve ser permitida ao abrigo conforme a lei de direitos autorais dos EUA. Abordarei as outras reivindicações nos processos judiciais do Github e da Stable Diffusion em publicações subsequentes no blog.
Copyright para o bem público
Tanto a história como a origem do direito de autor nos Estados Unidos mostram claramente que o objetivo do direito de autor é servir o bem público. Podemos ver isso na própria Constituição. O artigo I, seção 8, cláusula 8 da Constituição dos EUA confere ao Congresso o poder de criar legislação sobre direitos de autor. Esta disposição estabelece que a lei de direitos de autor deve “promover o progresso da ciência e das artes úteis” e que a protecção dos direitos de autor só pode durar “tempo limitado”. Como tal, qualquer lei de direitos de autor que o Congresso aprove tem de ser concebida para apoiar a criação de novas obras e os direitos de autor têm de expirar, para que a coleção de obras que são de utilização livre para todos nós – o domínio público – cresça e alimente outros esforços criativos. No entanto, embora o beneficiário final dos direitos de autor possa ser o público, a lei tenta alcançar estes objetivos dando aos titulares de direitos várias formas específicas de controlar as suas obras, incluindo o direito de controlar a reprodução e distribuição de cópias das suas obras.
Com esta concepção, a lei dos direitos de autor tenta encontrar um equilíbrio entre os interesses dos titulares de direitos e do público e, quando esse equilíbrio é quebrado, os direitos de autor não conseguem atingir os seus objetivos. É aqui que surge o uso justo. Pouco depois da primeira lei de direitos de autor, os tribunais começaram a perceber que a capacidade de os direitos de autor beneficiarem o público seria frustrada se os titulares de direitos tivessem um direito ilimitado de controlar a reprodução e distribuição das suas obras. Assim, em 1841, o Juiz Joseph Story articulou pela primeira vez o que viria a ser o teste moderno para o uso justo no caso Folsom v. Marsh. Como parte dessa decisão, escreveu que,, após esta data, as utilizações de obras protegidas por direitos de autor que não “substituam os objetos” das obras originais devem ser permitidas por lei.
O que é uso justo?
Atualmente, o uso justo está previsto na seção 107 do título 17 do U.S. Code,sendo inquestionavelmente uma parte essencial da lei dos direitos autorais nos Estados Unidos. Os tribunais, incluindo o Supremo Tribunal, têm sublinhado repetidamente a importância do uso justo como salvaguarda contra a usurpação dos direitos das pessoas de utilizarem obras protegidas por direitos de autor de formas que os detentores dos direitos possam bloquear. Infelizmente, porém, o uso justo é uma doutrina difícil de aplicar. Os tribunais escrevem repetidamente que não existem linhas claras sobre o que é ou não é uso justo e que, sempre que consideramos o uso justo, temos de efetuar uma análise caso a caso. Para tal, a lei exige que os tribunais considerem quatro fatores diferentes, tendo em conta a finalidade e o objetivo da lei dos direitos de autor.Estes fatores são:
1. A finalidade e o caráter da utilização, ou o que o utilizador está fazendo com a obra original;
2. A natureza da obra original;
3. A quantidade e a substancialidade da cópia presente na utilização secundária;
4. Se a utilização secundária prejudica o mercado do original.
Embora não existam linhas claras, há alguns princípios que podemos ter em conta ao ponderar os quatro fatores que os tribunais tendem a considerar para determinar o que é uso justo – e que são particularmente relevantes para a forma como podemos pensar sobre o uso justo e os dados de treino de IA generativa. Em primeiro lugar, e talvez o mais importante, é saber se a utilização secundária “transforma” o original de alguma forma, ou se “meramente substitui” o original. Desde 1994, quando o Supremo Tribunal adotou a “transformabilidade” como parte da investigação sobre a finalidade e o caráter da utilização secundária no caso Campbell v. Acuff Rose Music, esta questão tem vindo a se tornar cada vez mais importante. Atualmente, se alguém conseguir demonstrar que a sua utilização secundária transforma o original de alguma forma, é muito mais provável que seja uso justo. No entanto, é importante salientar que, em Outubro de 2022, o Supremo Tribunal julgou o caso Andy Warhol Foundation v. Goldsmith, e a decisão ali tomada pode mudar a forma como abordamos a transformação na utilização justa ao abrigo da legislação dos EUA. No entanto, parece ainda provável que as utilizações altamente transformadoras pesem a favor do uso justo, mesmo após a decisão desse caso.
Em segundo lugar, ao considerarmos a natureza da obra original, temos de nos lembrar que os direitos autorais protegem algumas obras um pouco mais intensamente do que outras. As obras de ficção ou que são inteiramente produtos criativos dos seus autores estão mais protegidas do que as obras de não ficção, porque os direitos de autor não protegem fatos ou ideias. Como tal, as utilizações de algumas obras são menos suscetíveis de serem consideradas utilização justa do que outras.
Em terceiro lugar, temos de pensar na quantidade da obra original que é copiada no contexto do inquérito sobre a transformação e se a quantidade copiada serve o objetivo da transformação. Se a quantidade copiada se adequa ao e apoia o propósito transformador, então o uso justo pode fundamentar a cópia de obras inteiras. Em quarto lugar, quando consideramos os danos no mercado, temos de pensar se a utilização secundária prejudica o mercado ou atua como substituto da obra original. E, finalmente, temos de considerar se a autorização de uma utilização secundária como uso justo serviria aos objetivos dos direitos de autor.
A IA é transformadora?
Tendo em conta todos estes antecedentes sobre o uso justo, como aplicamos estes princípios à utilização de obras protegidas por direitos de autor como dados de treino de IA, como no caso Stable Diffusion/Midjourney? Para responder a esta pergunta, temos de começar por analisar os fatos do caso. Andrés Guadamuz tem duas excelentes publicações no seu blog que explicam a tecnologia envolvida neste caso e que começam a explicar por que razão isto deve constituir um uso justo.
A Stability AI utilizou um conjunto de dados chamado LAION para treinar o Stable Diffusion, mas este conjunto de dados não contém efetivamente imagens. Em vez disso, contém mais de 5 bilhões de hiperligações da Web para pares de imagem-texto. Os modelos de difusão, como o Stable Diffusion e o Midjourney, pegam nestes dados, adicionam-lhes “ruído”, corrompendo-os, e depois treinam redes neuronais para remover a corrupção. Os modelos utilizam depois outra ferramenta, chamada CLIP, para compreender a relação entre o texto e as imagens associadas. Por fim, utilizam os chamados “espaços latentes” para agrupar dados semelhantes. Com estes espaços latentes, os modelos contêm representações do aspecto que as imagens devem ter, com base nos dados de treinamento, e não cópias das imagens em suas bases de dados. Em seguida, as aplicações orientadas para o utilizador recolhem pedidos de texto dos usuários para gerar novas imagens com base nos dados de treinamento, no modelo de linguagem e no espaço latente.
Voltando à questão do uso justo, este método de utilização de combinações imagem-texto para treinar o modelo de IA tem um objetivo inerentemente transformador das imagens originais e deve permitir, assim, a conclusão de que se trata de um uso justo. Embora estas imagens tenham sido originalmente criadas pelo seu valor estético, o seu objetivo para o modelo de IA é apenas como dados. Para a IA, estes pares de imagem-texto são apenas representações da forma como o texto e as imagens se relacionam. O que as imagens são não importa para o modelo – são apenas dados para ensinar o modelo sobre relações estatísticas entre elementos das imagens, e não peças de arte.
Isto é semelhante à forma como a Google utilizou cópias digitais de livros impressos para criar o Google Books, uma prática que foi contestada no caso Author’s Guild v. Google (Google Books). Neste caso, o Tribunal de Recursos do Segundo Circuito considerou que o ato da Google de digitalizar e armazenar cópias de milhares de livros impressos para criar uma base de dados pesquisável em texto era uso justo. O tribunal escreveu que o objetivo da Google era diferente do objecivo dos autores originais porque a Google não estava a utilizar os livros pelo seu conteúdo. De fato, o conteúdo não era realmente importante para a Google; os livros eram como peças de dados necessárias para construir a base de dados de livros da Google. Em vez de utilizar os livros pelo seu conteúdo, o objetivo da Google era criar uma ferramenta digital que permitisse novas formas de utilizar livros impressos que seriam impossíveis no mundo analógico. Assim, os livros, enquanto parte da base de dados da Google, serviram um objetivo muito diferente do seu propósito original, o que fundamentou a conclusão de uso justo neste caso.
Além disso, a situação é também semelhante à forma como o operador do motor de busca Arriba Soft utilizou cópias de imagens, tema que foi objeto de julgamento no processo Kelly v. Arriba Soft. Neste caso, uma fotógrafa, Leslie Kelly, processou o operador do Arriba Soft por copiar e apresentar cópias das suas fotografias como miniaturas aos usuários. O tribunal, no entanto, discordou que isso constituísse uma infracção aos direitos de autor. Em vez disso, o tribunal considerou que esta utilização servia um propósito transformador e diferente do objetivo original, porque a Arriba Soft apenas copiou as fotografias de Kelly para permitir o funcionamento do seu motor de busca – e não devido ao seu valor estético. Tal como o Google Books e os dados de treino da IA, as imagens tinham aqui uma função de dados para a ferramenta e não de obras de arte para serem apreciadas como tal.
Sobre a natureza das obras como inputs de IA
Passando ao fator dois, a natureza das obras originais, embora não saibamos que imagens específicas constam do conjunto de dados LAION utilizado para treinar a Stable Diffusion e a Midjourney, é provável que estas imagens envolvam um vasto espectro de criatividade. Embora isto possa pesar contra uma conclusão de utilização justa para Stable Diffusion e Midjourney, dada a natureza presumivelmente criativa dos trabalhos de entrada, este fator raramente é determinante. De fato, no caso Google Books, o tribunal mostrou-se cético quanto ao fato de este fator pesar contra o uso justo, mesmo que os livros da base de dados fossem ficção. Isso ocorre pelo fato de que os livros estão ali, como parte de uma base de dados, para fornecer informações sobre os próprios livros, não sendo utilizados pelo seu conteúdo criativo. Do mesmo modo, no caso contra a Stable Diffusion e a Midjourney, estas ferramentas de IA generativa utilizam as obras da base de dados apenas como dados. Nesse sentido, qualquer coisa extraída de seus dados de treinamento pode ser apenas elementos não protegidos das obras enquanto dados de treinamento, como fatos e ideias sobre como vários conceitos são visualizados. Assim, como este fator raramente é algo importante nas decisões de uso justo, parece improvável que ele deva pesar fortemente contra o uso justo neste caso.
A IA está a fazer cópias?
Em terceiro lugar, devido à forma como os modelos de IA generativa funcionam, eles não utilizam mais das obras originais do que o necessário para permitir o objetivo transformador. Os modelos não armazenam cópias das obras nas suas bases de dados e não criam colagens a partir das imagens nos seus dados de treinamento. Em vez disso, utilizam as imagens apenas durante o tempo necessário para o treinamento. Trata-se de cópias meramente transitórias que servem a um objetivo transformador como dados de treinamento. Mais uma vez, o caso do Google Books é útil para compreender esta questão. Nessa decisão, o Tribunal escreveu que a Google precisava copiar e reter cópias de livros inteiros para que a sua base de dados funcionasse. Mas isso era permitido devido ao objetivo transformador da Google. Além disso, a Google não permitia que os usuários acessassem cópias completas dos livros na base de dados, mas apenas revelava “trechos” aos usuários. Sobre este ponto, o tribunal escreveu que a melhor pergunta a responder não era a quantidade de obras copiadas pela Google, mas sim a quantidade que estava disponível para os usuários. Da mesma forma, a Stability AI e a Midjourney não funcionariam a menos que utilizassem as imagens completas nas suas bases de dados de treinamento. Além disso, não armazenam imagens, não reproduzem imagens nas suas bases de dados e não juntam novas imagens a partir de fragmentos de imagens dos seus dados de treinamento. Em vez disso, aprendem o que as imagens representam e criam novas imagens com base no que aprendem sobre as associações de texto e imagens.
4. A IA no mercado
Em quarto lugar, a questão sobre saber se a Stable Diffusion e a Midjourney prejudicam o mercado das obras nos seus dados de treinamento é difícil, em parte porque a forma como os tribunais pensam nesta questão pode ser um pouco inconsistente. Por um lado, a resposta deverá ser sim, pois o uso tem pelo menos o potencial de prejudicar o mercado da obra original. Afinal de contas, essa é uma das prováveis razões pelas quais os reclamantes interpuseram ações judiciais – eles receiam que o conteúdo gerado pela IA prejudique a sua capacidade de lucrar com a sua arte. De fato, qualquer arte tem o potencial de competir com outra arte, não necessariamente porque preenche o mesmo nicho, mas porque a atenção é limitada, e o conteúdo gerado por IA tem a vantagem de poder ser feito de forma rápida e automatizada. No entanto, esta pode não ser a melhor forma de pensar sobre os danos mercadológicos no contexto da utilização de imagens como dados de treinamento.
Como já foi referido, temos de reflectir sobre esta questão no contexto do objetivo de transformação. Em Campbell v. Acuff Rose, o Supremo Tribunal escreveu que quanto mais transformador for o objetivo, menos provável é que substitua a posição de mercado do original. Tendo em conta este fato, talvez seja melhor perguntar se este uso como dados de treinamento, e não como peças de arte, prejudica o mercado do original. A utilização das obras pela Stability AI e pela Midjourney existe num mercado completamente diferente do das obras originais. Não usurpa o mercado do original e não funciona como um substituto do mercado, porque as obras originais não estavam no mercado de dados. Além disso, esta utilização como dados de treinamento não “se sobressai aos objetos” dos originais e não concorre no mercado estético com eles.
5. Treinar a IA como uso justo
Por último, como já foi referido, uma vez que o objetivo da lei dos direitos autorais é encorajar novos trabalhos criativos, promover a aprendizagem e beneficiar o interesse público, o uso justo deve permitir a utilização de trabalhos protegidos por direitos de autor como dados de treinamento para modelos generativos de IA como o Stable Diffusion e o Midjourney. A lei deve apoiar e promover o desenvolvimento de novas tecnologias que possam trazer benefícios para o público, e o uso justo constitui uma salvaguarda contra a utilização dos direitos de autor para impedir essas tecnologias.
Como escrevem Mark Lemley e Bryan Casey num artigo recente em que defendem que este tipo de utilização deve constituir um uso justo: “Um problema central com a autorização de processos de direitos de autor contra o ML [aprendizado de máquina] é que o valor e o benefício da utilização do sistema não estão geralmente relacionados com o objetivo dos direitos de autor.” De fato, o Supremo Tribunal reconheceu a importância do uso justo no desenvolvimento de novas tecnologias, primeiro em 1984, em Universal City Studios v. Sony e, mais recentemente, em 2021, em Google v. Oracle. Na Sony, o Tribunal considerou que o gravador de videocassete Betamax não deveria ser processado até a falência, mesmo que pudesse ajudar as pessoas a violar a lei de direitos autorais. Em vez disso, por se tratar de “utilizações substanciais e não infratoras”, o Tribunal considerou que a lei dos direitos de autor não devia ser utilizada para impedir a utilização dessa tecnologia. Depois, no caso Google, o Tribunal considerou que a utilização das 11 500 linhas de código Java da Google era um uso justo, escrevendo que os tribunais devem considerar essa permissão de utilização no contexto do desenvolvimento tecnológico.
Em suma, considero que este tipo de utilização para fins de treinamento da IA, mesmo em grande escala, constitui um uso justo, e que existem formas fora do judicialização que podem oferecer aos autores outras formas de controlar a utilização das suas obras em conjuntos de dados.
Já podemos ver um exemplo disto, até certo ponto, quando a Stability AI anunciou que iria permitir que os artistas optassem por não ter as suas obras utilizadas para treinar a Stable Diffusion. Embora esta não seja certamente uma solução perfeita, e a exclusão seja apenas uma forma possível de abordar estas questões, é pelo menos um começo, e sublinha que há formas de abordar estes problemas sem ser através de soluções baseadas em direitos autorais. Talvez, analisando as normas e as melhores práticas e envolvendo as pessoas na colaboração e no diálogo, possamos abordar melhor as preocupações suscitadas pelos dados de treino da IA, em vez de recorrer a ações judiciais que forçam os diferentes lados desta questão a entrar em conflito e que podem criar novos precedentes imprevisíveis e potencialmente perigosos para tecnologias futuras.
*Stephen Wolfson é Associate Director of Research and Copyright Services na University of Georgia School of Law. Leonardo Foletto é jornalista, doutor em comunicação pela UFRGS, professor e pesquisador da FGV ECMI e integrante do Creative Commons Brasil. Pedro Lana é advogado, pesquisador (GEDAI/UFPR) e professor (ESMA-PB). Doutorando em direito na UFPR, é integrante do Creative Commons Brasil.