Não devemos permitir que os desenvolvedores de IA, com todas as suas técnicas desleais, nos minem até que sejamos finalmente suplantados. Devemos revidar — de outra forma, abrimos um precedente perigoso para todos os sistemas de IA que estão por vir.
Introdução
Estou em choque por ter que dizer as coisas que estou prestes a dizer. Lutar seriamente contra Inteligências Artificiais que fazem arte é um tema tão surreal, tão absurdamente fictício, que às vezes tenho dificuldade de levá-lo a sério. Infelizmente, devo fazê-lo . As IAs de arte estão aqui e eu descobri que as sombras lúgubres que elas lançam sobre o discurso artístico e sobre as mentes dos estudantes dificilmente podem ser ignoradas.
Estruturei este ensaio como uma série de contra-argumentos para algumas das réplicas mais comuns em torno da arte de IA. Depois disso, pretendo chicotear vocês em um poste e açoitá-los publicamente por sua falta de resistência. Isso deveria, espero, captar o tamanho do absurdo que está acontecendo aqui. Quero deixar claro desde já que os próximos argumentos não são sobre se “arte de IA” é “arte” ou não. Não tenho problema algum em dizer que é arte – isso simplesmente não acrescenta muito à substância deste argumento. É evidente que os seres humanos podem se expressar com absolutamente qualquer coisa, e desde que haja expressão envolvida, é provável que a pessoa experimente seu trabalho como arte e se sinta um artista. Mas os próximos argumentos não são sobre esse ponto – eles são sobre o ambiente falho, antiético e enganoso em torno dos sistemas de IA. Um ponto que eu argumentarei é que está feito e promete levar as coisas em uma direção pouquíssimo artística. Não é difícil imaginar um sistema de imagem de IA ético baseado no consentimento, e isso só torna ainda mais desagradável o fato de que os que estão sendo liberados agora enfaticamente não o sejam.
Também quero dizer que eu, como uma pessoa deste mundo e deste tempo, estou tão morbidamente curioso sobre o que estes sistemas podem criar como qualquer outro, e estou certo de que serei profundamente comovido por exemplos de arte da IA no futuro. Entretanto, as interessantes possibilidades da arte da IA não significam que os horrendos excessos e valores anti-humanistas de seus sistemas atuais estejam acima de qualquer censura.
Devo admitir que estarei me engajando em uma certa adivinhação nesta discussão, mas considerando o assunto em questão acho que isso é inevitável, necessário e desejável. A maioria de nós teria chamado o estado atual desses sistemas de uma impossibilidade fantasiosa há apenas dez anos, e esse evento poderia não ter se esgueirado e nos desarmado tão facilmente se estivéssemos dispostos a projetar um pouco mais o futuro. Ouvi argumentos que tentam terminar toda esta discussão antes mesmo de começá-la – eles tomam em grande parte a forma de afirmações técnicas de que estes sistemas de texto-para-imagem não podem melhorar com base na natureza de seu próprio design, e que já estamos vendo sua forma final. Não sou um especialista em aprendizagem de máquinas, programador ou engenheiro de software, mas devo dizer que acho isso difícil de acreditar, já que elas já melhoraram consideravelmente desde as versões anteriores. Quero deixar claro no entanto, que mesmo que não se faça uma extrapolação para o futuro, e se contente apenas com o atual estado da arte – a forma como estas IAs estão sendo treinadas, liberadas, usadas e comercializadas no presente, já é motivo de séria preocupação. Se estes sistemas de IA forem autorizados a se propagar sem algum controle, da forma que têm até agora, um precedente perigoso será estabelecido, revelando que os artistas não estão dispostos a se defenderem e defenderem seu trabalho contra roubo e exploração.
E não tenham dúvidas de que é isso que está acontecendo aqui. Em seu estado atual e ao longo de sua trajetória, estes sistemas estão fortemente baseados na coleta e exploração oportunista de grandes quantidades do trabalho criativo de um incontável número de pessoas sem nenhum consentimento ou compensação. Indicar a estas empresas – incluindo as que virão – que os artistas permitirão isto com pouca resistência, não será um bom prenúncio para as indústrias comerciais, para os artistas de renome, para os hobbistas – para todos. E estou perplexo com meus amigos e colegas que estão olhando para a boca do leão e dizendo que afinal poderia ser acolhedor lá dentro porque eles vislumbraram alguns pedaços de comida grudados em seus dentes.
Estou tão ciente quanto vocês de que a falsa certeza sobre eventos tecnológicos monumentais como estes não significa muito no infindável turbilhão da história. Mas devemos reconhecer que ajoelhar-nos diante deste fato bruto não nos torna sábios, ao contrário, nos torna mudos e dóceis, e isso é a última coisa que nós, como artistas, precisamos neste momento. Devemos estar dispostos a nos defender, uns aos outros, e nosso trabalho – mesmo que estas empresas de IA tentem nos lançar como chorões e ingratos.
Não deixem que eles controlem a narrativa e os guiem à complacência – devemos ficar furiosos com isso! Estes sistemas estão coletando o trabalho dos artistas e empregando-o em empreendimentos comerciais com fins lucrativos, que muitas vezes se escondem atrás da cortina de fumaça de seu status “sem fins lucrativos”, citando “intenção de pesquisa acadêmica”, tornando-os difíceis de atacar. Eles dependem que artistas visuais sejam dóceis, e há exemplos deles lidando com outras indústrias mais inclinadas ao litígio de forma muito diferente, transmitindo um duplo-padrão. Cada vídeo, postagem ou discussão que vejo de meus colegas lidando com o tema da arte de IA com uma submissão sanguínea vira meu estômago, e eu me sinto envergonhado por eles. É enfurecedor vê-los aceitar casualmente o que esses sistemas estão fazendo, especialmente quando eles já foram desarmados por essas mesmas ilusões em tantas outras áreas. Todos nós desprezamos os mesmos valores anti-humanistas quando são exibidos pelas mídias sociais, pelo campo trabalhista, e por aí afora. Quantas vezes iremos falhar em aprender esta lição? Não há nada que não abdicaremos?
O que quer que você veja seus amigos fazendo, o que quer que você ouça dos desesperados e dos assustados, não se junte a eles em sua aquiescência bovina. As empresas gigantes que projetam e liberam estes sistemas estão manipulando a narrativa e estão dependendo de nosso ritual suicida. Como já aconteceu em tantas outras arenas, eles vão deixar que você lute a guerra por eles, e nos farão lutar uns contra os outros por ossos e sobras, como hienas. Eles esperam deixá-lo à vontade com o canibalismo artístico em uma escala nunca antes vista. Mas este não é o momento para os artistas se dividirem – devemos ter discussões honestas uns com os outros, defender uns aos outros e colocar esta informação na esfera artística.
Argumento – “A IA apenas coleta referências da Internet da mesma forma que os artistas”.
Há muitas suposições ruins aninhadas neste argumento, às quais quero voltar mais tarde. Escolhi começar com este porque me permite explicar os “data sets” (conjuntos de dados) que estão sendo usados para treinar estes sistemas. Você já deve ter ouvido falar de várias ferramentas de IA de texto-para-imagem na comunidade artística e nas notícias – MidJourney, DALL-E, Stable Diffusion, Imagen, só para citar algumas. Mas você pode não ter ouvido falar de seus respectivos data sets, que são “produtos” separados que às vezes são protegidos e outras vezes compartilhados entre diferentes sistemas texto-para-imagem.
Vamos usar um sistema muito popular como nosso exemplo, LAION, uma das coleções de conjuntos de dados que foi usada para treinar as versões atuais do StableDiffusion e do Google Imagen. Uma de suas versões, LAION 5B, é uma coleção de 5 bilhões de URLs de imagens e texto descritivo que apontam e descrevem imagens em toda a Internet. Quando um modelo como o Stable Diffusion é “treinado” para fazer seu trabalho – um processo caro e ávido de recursos quando se utiliza um conjunto de dados tão grande, ele passa por um processo matemático particular que solidifica uma conexão entre imagem e texto. Os detalhes do processo do Stable Diffusion ou de qualquer outro processo do tipo, não são o ponto de foco da discussão, pois novos métodos serão desenvolvidos, novas empresas surgirão e a tecnologia mudará. O que é fundamental observar aqui é que as imagens de entrada são o que define o potencial do modelo. O desempenho do modelo não seria possível sem todos os dados nele inseridos – muitos deles com direitos autorais. E uma vez que um modelo é treinado em um conjunto de imagens, não se pode facilmente alterá-lo. Se você quiser modificar o conjunto de dados e atualizar o modelo, você deve remontar o modelo a partir do zero em todo o conjunto de dados modificados, pelo menos com as técnicas mais comuns atuais.
Eis o que acontece com o aglutinado de imagens que compõem o conjunto de dados: Há tudo e qualquer coisa lá dentro. Sua arte pode estar ali, fotos de seu rosto podem estar ali, imagens médicas confidenciais foram encontradas ali. Isso porque as imagens são localizadas e catalogadas indiscriminadamente e o grande número delas torna a coleção como um todo uma confusão labiríntica para navegar e entender. Enormes quantidades são imagens com direitos autorais que, para ser claro, você certamente não seria capaz de copiar e colar nem mesmo em seu blog pessoal sem incorrer em algum risco legal.
Então, como é possível que eles possam incluí-las nestes modelos? É tudo sobre as organizações e suas artimanhas. A Laion 5b é promovida pela LAION, uma organização alemã sem fins lucrativos, enquanto as imagens em si são exploradas por outra organização sem fins lucrativos chamada CommonCrawl. Dependendo de sua localização, estas empresas, apresentadas como organizações sem fins lucrativos que funcionam para “fins de pesquisa”, têm isenções legais privilegiadas e não serão consideradas culpadas de coletar e utilizar dados que de outra forma seriam protegidos por direitos autorais.
A questão é que estes conjuntos de dados, coletados sob estas isenções, estão agora se canalizando para empreendimentos comerciais com fins lucrativos como a Stable Diffusion. E você sabe quem financiou uma grande parte do poder de processamento da LAION para criar este conjunto de dados? Isso mesmo, Stability.AI, os criadores da Stable Diffusion. A LAION está listada ao lado dos outros produtos em seu website. Portanto, este conjunto de dados supostamente para pesquisa, sem fins lucrativos e legalmente privilegiado está sendo usado por uma empresa com fins lucrativos, que atualmente está sendo avaliada em um bilhão de dólares, em seu principal produto. Isto parece ser uma violação direta do espírito destes privilégios de pesquisa. Isto está rapidamente se tornando uma prática comum na IA, com as muralhas complexas de proteção de empresas com e sem fins lucrativos tornando difícil identificar onde ocorreu qualquer ato ilícito. O objetivo com isso é evitar a responsabilização e a obrigação legal por meio de uma complicada lavagem de dados que eles argumentarão ser lícita, mas todos nós podemos ver claramente que não é bem assim.
Outro exemplo deste modelo evasivo de prestação de contas é o desenvolvedor do texto-para-imagem IA DALL-E, denominado “OpenAI“, que é constituído pela corporação sem fins lucrativos OpenAI LP e sua matriz, a sem fins lucrativos OpenAI Inc.
Tudo isso soa confuso? Porque claramente é, e eles inventaram tudo isso. Deixe-me dizer o que eles escreveram sobre isso em seu blog da empresa:
“Queremos aumentar nossa capacidade de levantar capital enquanto ainda servimos nossa missão, e nenhuma estrutura legal pré-existente que conhecemos atinge o perfeito equilíbrio. Nossa solução é criar a OpenAI LP como um híbrido de uma empresa com e sem fins lucrativos – o que estamos chamando de uma empresa com limite de lucro“.
Não é uma pena que nenhuma outra estrutura legal pré-existente funcione para eles? Pobres indivíduos. Pelo menos eles tiveram a coragem de inventar sua própria estrutura legal que lhes permite ganhar o máximo de dinheiro possível ao mesmo tempo em que reivindicam incentivos fiscais, privilégios legais e o disfarce de uma empresa sem fins lucrativos que coleta ativos para fins de “pesquisa”. E foram suficientemente adoráveis para nomeá-la também, de modo que se qualquer outra empresa estiver interessada em reproduzir esta insanidade, eles podem apontar um precedente com autoridade. Se você quiser uma boa risada amarga, eu o encorajaria a procurar os “limites” que eles decidiram para sua empresa “com limite de lucro”.
Estas artimanhas são o tipo de coisa para a qual quero chamar a atenção. O problema é que elas estão sendo arrastadas para baixo do tapete pelas pessoas que têm tudo a ganhar com estes sistemas. Estas preocupações práticas sobre a IA estão sendo abafadas por argumentos incongruentes sobre “prudência tecnológica” e a natureza da arte e do progresso. Muitos desses argumentos não têm substância – eles simplesmente exaltam as virtudes de se ter uma mente aberta sobre um futuro tecno-utópico, em vez de abordar as implicações éticas e legais, e se aproveitam da razoabilidade que deveríamos querer nesses sistemas. Observe também que algumas das IAs, como MidJourney a partir do momento em que escrevo, não divulgaram nenhuma informação sobre os conjuntos de dados em que foram treinadas, são caixas pretas para nós, e espero que mais empresas tentem essa rota uma vez que vejam o quanto seus conjuntos de dados são vexadores para um público informado.
Portanto, não, as IAs não coletam referências na Internet da mesma forma que os artistas fazem, e elas estão usando-as de maneiras que você como uma pessoa normal não teria permissão para fazer. Você não teria os privilégios legais de uma pesquisa sem fins lucrativos quando se trata de coletar e utilizar obras protegidas por direitos autorais sem consentimento, muito menos quando se trata de colocar isso em uso com fins lucrativos. O bom e velho você, naturalmente, seria rápida e sumariamente penalizado por qualquer infração desse tipo.
Argumento – “A IA é apenas uma nova ferramenta”.
Este argumento nasceu de uma tremenda falta de imaginação – como artista você deveria, é claro, sentir-se envergonhado por isso. Os programas de IA podem ser uma ferramenta neste momento, em seu estado inicial, mas pensar que eles continuarão assim exige uma ignorância intencional sobre a ferramenta que você está usando e o ambiente ao seu redor. Eles não são ferramentas para os artistas – eles são substitutos para os artistas. E eles estão se anunciando como tal. Basta ler a linguagem que estão usando para vender os programas de IA a você – eis algumas citações do lançamento da Stable Diffusion para pesquisadores: “O Stable Diffusion é um modelo de texto-para-imagem que capacitará bilhões de pessoas a criar artes impressionantes em segundos”. E aqui está outra: “Você pode ver um pouco da incrível produção que foi criada por este modelo sem pré ou pós-processamento nesta página”.
Observe a linguagem – eles não querem um futuro onde você precise retocar ou editar estas imagens depois que elas foram geradas, eles não têm interesse em deixar qualquer tarefa para um artista fazer – eles querem você completamente fora do quadro – mesmo que a sua arte tenha treinado a IA. E você deveria fazer uma busca usando “ctrl-f” na página de onde tirei essas citações para a palavra “artista” – resultado zero. Eles querem vender a promessa de que alguém sem experiência pode fazer a mesma imagem na primeira tentativa que alguém com anos de experiência pode fazer. Com base em seu modelo comercial, quanto menos necessidade houver da intervenção de um artista, mais bem sucedido e atraente será seu produto.
Se eles alcançarem ou não este objetivo de produzir uma IA que não precisa de intervenção artística é quase irrelevante, porque eles anunciarão que alcançaram este objetivo de forma tão ampla que transformará completamente a ótica em torno da arte para o mundo em geral. Eles investirão milhões para anunciar à pessoa comum que imagens deslumbrantes, vídeos, o que quer que seja – são feitos com o apertar de um botão. Dito isto, acredito que eles provavelmente sucederão. Muito do que é possível com estes sistemas em seus primeiros lançamentos já ultrapassa o “suficientemente bom”. Você não estará retocando estas imagens, melhorando-as, ou compondo sobre elas por muito tempo. E tenha cuidado, as empresas dirão que estas são ferramentas para artistas apenas quando confrontados por artistas, enquanto elas incessantemente as comercializam para todos os outros como uma forma de gerar arte incrível facilmente e imediatamente com o mínimo de esforço.
A retórica usual aqui é que mesmo que as imagens não precisem ser consertadas, alguém deve sempre fazer a solicitação (redigir o “prompt” /comando ) ou seleção das saídas desejáveis. Se sua imaginação lhe falhou antes e está fazendo isso novamente, você deve se envergonhar duplamente. O futuro destas IAs não envolve humanos sentados redigindo comandos. O sonho de conseguir um emprego como um adivinho da IA que, através de uma amorosa bajulação puxa a mais bela imagem possível para fora da máquina, é inviável. As IAs são tão boas em gerar linhas de texto quanto em gerar imagens. Na sua pressa em redigir os comandos você não percebeu que estava treinando a próxima parte da IA – aquela que conhece as preferências combinadas de milhões das pessoas com o maior bom gosto do mundo. Isto é claramente sinalizado por programas como MidJourney, que arquivam permanente e publicamente cada peça gerada, incluindo os prompts utilizados. Quando você digita o prompt, você está inserindo o interior do seu coração em um novo data set para as IAs.
Uma vez que esse conjunto de dados atinja massa crítica eles não precisarão que você diga à IA o que fazer. Estes sistemas, talvez incontáveis modelos deles, funcionarão em piloto automático. Eles simplesmente irão iterar sobre o que aprenderam que as pessoas estão interessadas em ver, combinar isso com análises em tempo real da Internet e de outros sistemas, e começar um derramamento intenso de mídia que nunca vai acabar, transformando completamente o mercado de arte. O enorme volume de produção permitirá que as IAs e seus manipuladores controlem o mercado, inundando os feeds com imagens quando querem que algo desapareça, e facilitando quando querem que algo chame a atenção. Teríamos sorte se isso afetasse apenas o mercado de arte comercial, mas a desvalorização por atacado e o silenciamento da arte provavelmente afetará todos os setores – comercial, hobbyista, fine arts, tudo. Penso nesta supernova de mediocridade desumana como a “Mega-Feed”, a versão ad absurdum dos “feeds” comparativamente fracos com os quais estamos familiarizados hoje.
E no fim das contas se revelará que VOCÊ foi apenas uma ferramenta. Você foi usado para ensinar à IA qual de suas criações é a melhor, como você faz toda vez que clica em seu resultado preferido entre as muitas oferendas grotescas. Você lhe ensina as palavras-chave e buzzwords relacionadas a estilos e critérios de renderização que são de mais amplo interesse. E toda vez que você voltar a ela com uma ideia nova, ela, naturalmente, anotará a sua originalidade, lhe dará uma palmadinha na cabeça e em seguida, usará as próprias ameaçadoras maquinações para a destilação e redistribuição infinita de qualquer semente criativa que lá estivesse.
Este contra-argumento também é minha resposta à acusação de que eu e outros como eu somos “ludditas” que simplesmente temem as novas tecnologias quando deveríamos abraçá-las como ferramentas. É ridículo chamar alguém como eu de Luddita, eu nunca resisti a ferramentas. Passei toda minha carreira testando alegremente cada nova ferramenta que apareceu. Comecei a fazer arte digital no msPaint antes dos 10 anos, fiz meus primeiros renders 3d no Bryce 3d aos 11, uso o Photoshop desde os 13 anos, fiz minhas primeiras animações 3d no Maya aos 15, aprendi Modo, zBrush, Sketchup, Blender e outros programas 3D que não me recordo. Tenho uma impressora 3D, comprei um VR para esculpir em realidade virtual, transmito arte no YouTube e dirijo um negócio on-line, pelo amor de Deus. Não uso nenhuma dessas ferramentas de má vontade, foi uma alegria aprendê-las e brincar com elas. Eu só quero mais dessas coisas, não menos. E sei que muitos dos artistas que estão resistindo às IAs são como eu – amantes vorazes do progresso e de novas maneiras de criar. Não, eu não sou um Luddita, e não tenho medo de novas ferramentas, apenas sei dizer o que é uma ferramenta, e o que é um substituto.
Se você tivesse sido um trabalhador em uma linha de montagem de automóveis, você teria errado ao chamar cada nova chave inglesa, furadeira e rebitador que eles colocaram em sua mão um substituto. Mas no dia em que a grade subisse e eles empurrassem um braço robótico para o chão da fábrica, você estaria certo. Algumas coisas são ferramentas, e algumas coisas são substituições, e simplesmente gritar “ferramenta” repetidamente não vai mudar a natureza da coisa.
Argumento – “Os artistas só precisam se concentrar em contar histórias através de videogames, animações e histórias em quadrinhos”.
Já mencionei o maior problema com este argumento – as IAs serão muito capazes de rodar em piloto automático, e serão tão boas em contar histórias quanto em fazer imagens e vídeos. Elas produzirão romances, ensaios e roteiros em quantidades que podem preencher a library-of-babel, cada peça composta de meias-citações e passagens não atribuídas. Todo este texto auto-gerado pode ser processado pelas IAs de imagem e vídeo para gerar mídia de formato longo, e o ciclo será completo, auto-suficiente e livre de humanos.
As empresas pularão neste sistema, é claro, já que ele é previsível, consistente e isento dos corpos orgânicos providos de emoções e insustentáveis dos artistas. Elas produzirão um fluxo infinito de cada filme, tv, jogo, notícia e imagem imagináveis, assim como cada permutação possível de cada instância destes.
Isto inundará completamente o reino da história e o futuro se encontrará esmagadoramente escrito por fantasmas. O “anime” que você sonha em fazer desde os 8 anos, que você está disposto a ignorar toda arte para produzir, receberá a atenção que merece neste ambiente – nenhuma. E quando seu projeto de sonho, regurgitado em segundos por uma IA, não receber nenhuma atenção, nenhuma influência e nenhum dinheiro, você descansará bem sabendo que o mereceu. Nem mesmo sua mãe será capaz de encontrá-lo na interminável onda do Mega Feed. Isto não seria um problema por si só – de outra forma você nunca conseguiria produzir isso de qualquer maneira – exceto que você estará arruinando o mercado para todos que estão posicionados para conseguir algo por seus próprios esforços. Você não ganhará nada e prejudicará seus amigos e colegas.
A idéia de que todos terão o poder de contar sua história é um dos poucos argumentos para a arte da IA que me atrai, há uma discussão complexa a ser feita aqui, mas acredito que, em última instância seja uma argumento falho. É um sentimento agradável, e posso empatizar com as frustrações de ser um artista que sente que suas habilidades não estão à altura de sua visão – mas estamos esquecendo algo muito importante aqui. Você não quer apenas contar sua história, e não quer apenas contá-la bem, você quer que seja importante que você tenha contado sua história. As IAs lhe roubarão, e a todos os outros, disto.
A execução de sua petulante “visão” pelas IAs garantirá que ninguém se importe com sua história, e que ela seja arrastada no mar agitado de escória da IA. Sua arte já não chama a atenção, e ela não vai receber mais atenção quando estiver competindo com o fluxo interminável de quadrinhos, romances, imagens, filmes, jogos e canções, gerados por si mesmos e propriamente direcionados. Como eu já disse, estas IAs não precisarão ser comandadas por humanos por muito tempo e, em vez disso, responderão automaticamente ao fluxo e refluxo da Internet, notícias atuais, vendas em tempo real e até mesmo conversas particulares. Afinal de contas já preparamos estas informações para eles. Todos nós nos sentimos um pouco desconfortáveis quando nosso telefone nos mostra um anúncio de algo que mencionamos a alguém durante o jantar, mas o que acontecerá quando ele mostrar um filme que ele fez só para você sobre sua separação? Uma canção sobre um desabafo com sua mãe? Uma versão acabada daquela idéia cômica que você começou a pesquisar? Você começará a receber notificações dizendo: “Ei! Confira mil versões acabadas do seu sonho”! Nossos sistemas digitais cotidianos já têm acesso íntimo a tantas entradas que definem nosso gosto – em certo sentido, vendemos nossas almas há muito tempo.
Portanto, talvez você possa contar sua história, mas à custa de sua completa irrelevância, o que provavelmente terá o efeito de fazer com que você se ressinta de que teve a idéia em primeiro lugar. As histórias não alcançam seu incrível efeito simplesmente pelo fato de existirem. Elas vivem e morrem pela conexão humana e pelo intelecto. A IA não “democratizará a arte” – isso é apenas uma das banalidades “copicoladas” de campanhas de marketing insípidas – alimentando você de colherinha com sua própria desgraça. Em uma democracia, sua voz é relevante. Em um mundo inundado pela mídia da IA, sua voz não tem nenhuma chance de ser ouvida.
Também quero ressaltar aqui que os responsáveis por estes programas dependem que você pense que eles têm a chave dourada para sua visão artística. Eles precisam que você se sinta inútil e como se tivesse perdido sua chance de contar sua história. Que você ficou muito velho, ou que não tem tempo, recursos ou capacidade ou o que quer que seja; dessa forma, você precisará do produto deles. Desta forma você os apoiará monetariamente e, o mais importante, você os ajudará a mudar as leis e a influenciar a cultura para permitir a mineração destrutiva de todo o trabalho criativo. Eles sempre serão incentivados a fazer você se sentir baixo, dependente, incapaz e escravo dos caprichos monstruosos de suas empresas.
E quando terminarem, eles puxarão o tapete de baixo de você, é claro. Eles não têm nenhuma razão real para deixar você ter estas coisas de graça, eles não se importam com você. Eles podem dizer que se importam, mas isso não significa nada. Uma vez que eles tornaram impossível para você ganhar a vida como artista, e você os ajudou a mudar as leis, e eles o afastaram de seus colegas, virando você contra eles, eles simplesmente venderão tudo para o Google, Facebook e YouTube e para o resto – porque eles podem ganhar bilhões com as grandes empresas e nada com você. Vocês deram tudo de graça, seus tolos.
Argumento – “Estas empresas não podem manipular nosso acesso a estes sistemas por causa de projetos de código aberto como o Stable Diffusion. Eu posso executá-lo off-line em meu computador pessoal!”
Digamos inicialmente que Stable Diffusion and Stability.AI não são o corpo permanente da discussão aqui, e de fato estes nomes podem ser completamente desconhecidos para as pessoas lendo isto, mesmo em um futuro próximo. Muitas empresas de IA se levantarão e cairão e algumas serão de fonte aberta e outras serão altamente protegidas. Haverá uma enorme variedade de modelos de negócios, modelos de lançamento, modelos de assinatura e modelos de requalificação associados ao enorme número de projetos de IA que estão prestes a entrar em cena. Só porque o código fonte está liberado para a versão atual do Stable Diffusion não significa que a Stability.AI e outras empresas de mesma mentalidade não mudarão suas táticas no futuro. Também quero ressaltar que a versão da Stable Diffusion que você pode baixar e rodar offline está limitada a seu data set atual. Você pode ter algum controle sobre seus parâmetros, mas seria dispendioso e demorado re-treinar o modelo em um conjunto de dados atualizados, como expliquei anteriormente. Foi preciso muita potência e placas gráficas para treinar a versão atual da Stable Diffusion, e se você quiser se manter atualizado com estas tecnologias, você precisará ou dedicar enormes recursos para a re-treinar o programa ou se render a estas empresas – o que claramente é o que elas querem.
Além disso, parece muito ingênuo confiar que uma empresa com fins lucrativos como a Stability.AI, depois de uma avaliação em 1 bilhão de dólares, procurando eleger investidores com dinheiro para seu conselho de administração, com um gerente de hedge funds (Fundos de Cobertura) como CEO, é de alguma forma favorável a lhe dar seu brinquedo favorito de graça por tempo indeterminado. E suponha que eles continuem a oferecer versões gratuitas, eles acabarão como Facebook, Twitter, Instagram, etc., repletos de maus incentivos e efeitos de distorção mundial que temos visto a partir desses modelos.
Argumento – “As pessoas não fazem a mesma coisa com referências que os AIs fazem?”
Agora voltamos a uma análise mais profunda das más suposições incorporadas no primeiro argumento que abordamos aqui. Para esclarecer, este argumento diz respeito à prática de usar referências e a arte de outros para fazer ou inspirar uma imagem. Este argumento é confundido em sua essência.
Primeiro suponha que a resposta é sim, a forma como uma IA usa referências é análoga à forma como as pessoas usam referências. Isto levanta a questão de por que daríamos os privilégios deste esforço a máquinas insensíveis ao invés de seres humanos. Isto é fazer arte, pelo amor de Deus, e não algum processo manual agitado que as pessoas odeiam. Esta é uma das coisas que as pessoas amam fazer. Qualquer pessoa com uma visão humanista verá que, como a intenção e o resultado desejado são os mesmos, devemos reservar a produção de arte para aqueles que têm a ganhar algo com ela, para quem ela pode trazer alegria e recompensa, em vez de a conceder de forma fictícia a um insensível não-ser que não pode desfrutar dos frutos de seu trabalho.
Segundo – não, as pessoas não fazem a mesma coisa com referências que as máquinas fazem. A diferença é que as máquinas podem replicar as referências precisamente com facilidade. Claro, os artistas humanos olham as referências, as coletam, as combinam, as transformam e, de fato, às vezes fazem o melhor que podem para copiá-las, mas na grande maioria dos casos, eles não podem replicar com precisão cirúrgica essas referências.
Você pode olhar quantos desenhos de Michelangelo quiser, você pode pendurar uma centena deles em volta da sua prancheta de desenho – você ainda assim não conseguirá desenhar como ele. Você não poderia traçar um Michelangelo suficientemente bem para criar confusão sobre qual é o original, e se você pudesse, garantidamente você seria um desenhista em seu pleno direito pelo árduo esforço.
As IAs não têm as mesmas restrições de equilíbrio. A IA pode perfeitamente alcançar, através da reprodução digital, memorização e sobreposição, qualquer efeito o qual esteja suficientemente treinada para executar. Assim, embora os esforços mais veementes de um humano para recriar as melhores partes do trabalho de outro possam resultar em deficiências aceitáveis e surpresas agradáveis, a IA pode conseguir o perfeito roubo em massa.
Um humano também é enobrecido por suas tentativas de replicar e copiar, pelo menos quando o faz através de habilidades manuais em vez de copiar partes de uma obra de arte digitalmente. Por causa da mecânica de execução manual, uma pessoa melhorará como artista ao fazer múltiplas tentativas de copiar. Executar uma cópia adequada de uma obra de arte está completamente fora da capacidade de um iniciante e ironicamente exige alguma habilidade honesta. Em um sentido muito real, e pode ser difícil de entender isto se você não tem lutado para melhorar seu ofício por muito tempo, se você conseguir copiar bem Vermeer, você mereceu.
Argumento – “A IA nunca poderá substituir a alma de um artista, nunca será capaz de produzir idéias únicas da maneira que uma pessoa pode!
Este argumento é realmente mais voltado a ignorar do que aceitar as IAs, mas aparece com frequência suficiente para validar uma abordagem aqui. Quando pensamos na “visão do artista” desta maneira, acho que a elevamos a uma posição estranha. Este argumento parece assumir que nossas idéias são como manifestações divinas, não adulteradas e nascidas do acaso. Na realidade, nossas idéias são reações complexas, tanto conscientes quanto subconscientes, aos inúmeros fatores condicionantes que moldam nossas vidas. Lembre-se, as IAs eventualmente estarão reagindo a muitos dos mesmos estímulos que nós. Elas estarão sempre tomando o pulso do desempenho da Internet em tempo real, de palavras-chave e buzzwords e trending topics.
As IAs estarão avaliando essas coisas simultaneamente no mar de datasets online e a nível individual – seus interesses particulares, hábitos, preferências e até mesmo o seu estado mental e a saúde física. Já fornecemos essas informações às empresas em detalhes impressionantes. As IAs o conhecerão intimamente, e isso incluirá sua visão artística. Mesmo que a maioria de suas oferendas sejam fracas, medíocres ou ininteligíveis, os números estão do lado deles, não do nosso. O enorme volume de resultados garantirá que, em algum lugar, você se sentirá atraído por algo que você mesmo poderia ter pensado, se lhe tivessem sido concedidos os mesmos privilégios que a IA.
E se a qualidade atual da produção de IA indicar algo, menos do que esperamos poderia ser medíocre. Percorrer a montanha de criações não editadas das oferendas atuais de IA pode ser às vezes inquietante e confuso, mas até mesmo eu me vejo parando para me analisar algumas delas. Mais uma vez, isto fala muito, considerando que estes sistemas estão em seus primórdios.
Argumento: O Problema da Dance Diffusion
Há um “double standard” flagrante de como esses sistemas lidam com a arte visual em relação a outras indústrias criativas. Tomemos o exemplo gritante da Dance Diffusion, a próxima ferramenta de música feita por IA vinda de uma equipe dentro da Stability.AI, os criadores do modelo texto-para-imagem Stable Diffusion. Deixe-me ler para você um artigo que descreve como a Dance Diffusion é treinada:
“Dance Diffusion é também construído sobre conjuntos de dados compostos inteiramente de músicas e amostras de áudio livres de direitos autorais e fornecidos voluntariamente. Como os modelos de difusão são propensos à memorização e sobreposição, a liberação de um modelo treinado em dados protegidos por direitos autorais poderia potencialmente resultar em questões legais. Ao honrar a propriedade intelectual dos artistas e ao mesmo tempo cumprir o melhor de sua capacidade com os padrões muitas vezes rigorosos de direitos autorais da indústria musical, manter qualquer tipo de material protegido por direitos autorais fora dos dados de treinamento era uma obrigação”.
Se você acha que não poderia ter lido o que acabou de ler, volte atrás e leia novamente. O fato de existir um padrão duplo tão desconcertante dentro do conjunto de produtos de uma única empresa de IA torna difícil imaginar qualquer outra explicação que não seja a má fé em relação aos artistas visuais e a crença insensível de que não há problema em espezinhá-los em particular porque eles estão menos inclinados à autodefesa e ao litígio do que outras indústrias, ou seja, a música. Eu quero que você imagine trocar a palavra “música” naquele parágrafo com a palavra “arte”. Será que isso seria realmente uma loucura? Isso sugere que eu sou um Luddita temeroso que simplesmente resiste à mudança? Eu não acho. Acho que a maioria das pessoas sãs veriam que “honrar a propriedade intelectual dos artistas” é uma coisa lógica para estender aos artistas visuais, não apenas aos músicos.
Em seguida, quero que você imagine que estamos no passado, digamos 10 anos no passado, e que os geradores de texto-para-imagem ainda não chegaram à cena. E se você soubesse que alguém estava planejando fazer um desses sistemas e prometesse seguir as diretrizes judiciosas que acabamos de ler? Será feito com peças de arte livres de direitos autorais e fornecidas voluntariamente. Imagino que você pensaria que essa seria a maneira mais sã e lógica de fazer e liberar um desses sistemas, não é mesmo? Agora imagine que, depois de ouvir isso, alguém lança a idéia de, em vez disso, sair tratorando a internet por bilhões de imagens e aspirando milhões de peças de arte feitas árduamente, sem consentimento, sem compensação e sem forma de remover este trabalho do modelo uma vez treinado sobre ele. Você não acha que esse plano pareceria, claramente, insano e antiético de sua posição de sorte na linha do tempo, ou seja, antes do lançamento de um programa tão aberrante?
O fato de estarmos vivendo em uma realidade onde alguém fez este último sem receber nenhuma permissão ou oferecer nenhuma compensação àqueles que geram as imagens nas quais o sistema é treinado, e depois se apressou a liberá-lo antes que alguém pudesse alcançar seus delitos, não significa que seja menos antiético ou claramente louco. Penso que muitas das suposições ingênuas sobre a IA podem ser reveladas se apenas imaginarmos como teríamos esperado que estes sistemas fossem tratados em uma realidade em que levássemos a sério seu potencial antes de serem feitos e liberados. Infelizmente, não tomamos nenhuma medida porque a maioria das pessoas não achava que poderiam ficar tão bons quanto atualmente, e se o fizessem, a maioria não achava que poderiam fazê-los tão rapidamente.
Mas termos sido enganados não significa que devemos continuar a ceder de forma idiota a estas IAs calouras. Estabeleceremos um precedente muito perigoso ao não disputar e desmantelar estes sistemas injustos. Novas IAs surgirão rapidamente, e os vilões multiplicadores de sua natureza se amontoarão sobre nós. Não queremos que as pessoas que as fabricam pensem que podem escapar da violação dos direitos dos artistas, e que não examinaremos os sistemas, inspecionaremos seus modelos de negócios e, em geral, estaremos dispostos a nos defender.
Conclusão
Estes sistemas de IA vão continuar a nos desafiar. Não apenas no reino da arte, mas em todas as esferas da vida, eles tornarão sua presença conhecida tanto no espaço digital quanto no físico, e se apropriarão de todos os tipos de trabalho criativo e mundano tipicamente destinado aos humanos. Onde quer que eles apareçam, e qualquer que seja o trabalho que empreendam, antes de você simplesmente deixar rolar e entregar todos os esforços da vida à IA, pergunte a si mesmo – será que eu estou perdendo um trabalho edificante? A vida é realmente tão cheia de alegria excedente que deveríamos deixar que as máquinas automatizem algo em que tenhamos prazer? Será que realmente temos uma boa razão para deixar que elas comandem um trabalho ou hobby que seja aspiracional e divertido, em vez de ruim e miserável? Ou estamos apenas inventando razões para deixá-los fazer isso porque não queremos assumir o fardo de nos defendermos, algo do qual os artistas geralmente se esquivam?
Não devemos permitir que os desenvolvedores de IA, com todas as suas técnicas desleais, nos minem até que sejamos finalmente suplantados. Devemos revidar — de outra forma, abrimos um precedente perigoso para todos os sistemas de IA que estão por vir.
As pessoas que são fortemente incentivadas a proteger a percepção pública desses sistemas nos acusarão de sermos Ludditas, de não sermos adaptáveis e de catastrofizar as conseqüências de sua má conduta. Mas não deixem que eles os acalmem sua revolta com este refrão inato, lembrem-se sempre que eles não são artistas, e não é o trabalho deles no dataset. Eles querem controlar o ambiente emocional em torno de tudo isso, lançando você como um estridente e queixoso e eles mesmos como calmos, inteligentes e progressistas.
Eles querem que você aceite, sem questionar, que toda e qualquer coisa que você criar e compartilhar servirá de alimento para produto lucrativo deles. No momento em que escrevo isto não há como fugir destes sistemas, mesmo que alguns prometam acrescentar essa opção. Ao escrever este vídeo, a Stable Diffusion indicou que está respondendo às críticas e desenvolvendo internamente uma ferramenta que permitirá que os artistas optem por não participar do treinamento de IA. Isto soa como um passo na direção certa, mas quero destacar algumas coisas: 1. A crítica foi necessária para que eles fizessem a mudança 2. Não há razão para confiar que a próxima empresa que vier junto com um modelo similar de treinamento e lançamento permitirá escolha, e 3. A versão de Stable Diffusion que já foi lançada como open source estará para sempre por aí e treinada neste conjunto de dados sem consentimento. Se você optar por não alimentar a máquina, estará optando por não participar de futuros modelos da Stable Diffusion, não de modelos já lançados, e imagino que a maioria das pessoas não estará nem mesmo inclinada a não participar até descobrir que já estão incluídos em um modelo. Nesse ponto, se o lançamento for open source, é tarde demais para você. Para que isso faça a diferença, é claro que você deve saber que essa escolha existe e como utilizá-la. Além disso, você deve saber fazer isso para cada produto de coleta de dados que existe. Somente os mais experientes revogarão seu trabalho, e o resto estará condenado. Estas empresas oferecerão opções de opt-out na esperança de que você não perceba que elas deveriam ter oferecido opt-in em primeiro lugar.
Como disse no início deste ensaio, não é difícil imaginar um gerador de texto-para-imagem justo e equitativo, o que faz com que seu caminho escolhido pareça – na interpretação mais caridosa – irrefletido. Você o construiria sobre uma base de imagens comuns de domínio público e criativas, o embelezaria com imagens que sua empresa produz internamente, comissionaria artistas para criar imagens de treinamento para você ou compensaria os artistas que optassem por ter suas imagens adicionadas ao conjunto de dados. Talvez até lhes dê um royalty cada vez que suas imagens ou nome forem usados para produzir um resultado. Não vejo nada de errado com um modelo como esse, e imagino que ainda seria fascinante e eficaz, mas ainda tem algumas restrições totalmente sãs que deixariam muita arte para ser feita por seres humanos que trabalham duro. Eu também acho que haveria uma quantidade enorme de artistas que optariam de bom grado por adicionar suas imagens ao projeto. Nós somos artistas! Adoramos coisas novas, estranhas e maravilhosas. Por mais que estas empresas de IA pareçam querer nos colocar como puristas ultrapassados – é um pouco exagerado, considerando nossa demografia. A maioria de nós usa e adora tecnologia, tem uma longa lista de credenciais de nerds, está constantemente tentando coisas novas, experimentando e se entusiasmando com as curvas estranhas do mundo. Acho que se alguém fizesse um modelo baseado no consentimento como este, até eu atiraria minhas imagens para dentro dele. Mas por enquanto, por favor, vamos parar com a febre, e pensar bem nisto. Vamos acabar com este roubo massivo de nosso trabalho criativo. Vou deixar links para associações que tentam se organizar em torno destas questões, fontes e vídeos informativos sobre o estado atual dos sistemas de arte. Eu os encorajo muito a fazer mais pesquisas sobre como estes sistemas funcionam e como as empresas que os estão fazendo estão controlando a narrativa.
Links:
Siga a Concept Art Association para mais notícias sobre organização contra IA, e confira seu recente vídeo: https://www.youtube.com/c/ConceptArtAssociation/
Equity está lutando contra as IAs que substituem muitos tipos de artistas, seus esforços são relevantes para todos os artistas criativos e eles têm bons recursos aqui: https://www.equity.org.uk/getting-involved/campaigns/stop-ai-stealing-the-show/
Um site para investigar apenas um dos conjuntos de dados do LAION para ver se você ou sua arte estão lá dentro. Uma nota que este site oferece para inscrever você em um futuro produto “opt-out” – eu não tenho idéia de qual será a natureza desse produto e peço cautela: https://haveibeentrained.com/
Open AI explicando como inventaram sua estrutura legal porque nada mais funcionou para eles: https://openai.com/blog/openai-lp/
Lançamento da Stable Diffusion sem menção a “artistas”: https://stability.ai/blog/stable-diffusion-announcement
IMAGEN libera informações que explicam como o conjunto de dados em que é treinado é “não-curado” e contém “uma ampla gama de conteúdo inapropriado, incluindo imagens pornográficas, calúnias racistas e estereótipos sociais nocivos”. Esta é outra página em que você deve fazer uma busca ctrl-f por “artista” em: https://imagen.research.google/
Anna G. Eshoo, congressista da Califórnia, escreve ao OSTP pedindo investigação sobre modelos inseguros de liberação de IA, a saber, Stable Diffusion: https://eshoo.house.gov/media/press-releases/eshoo-urges-nsa-ostp-address-unsafe-ai-practices
Um grande artigo que resume as técnicas de lavagem de dados das empresas de AI: https://waxy.org/2022/09/ai-data-laundering-how-academic-and-nonprofit-researchers-shield-tech-companies-from-accountability/
Uma boa explicação semi-técnica de como funcionam modelos de difusão como o Stable Diffusion: https://www.youtube.com/watch?v=1CIpzeNxIhU