quinta-feira, novembro 21

Sede do New York Times

Crédito: Haxorjoe/CC 3.0

O processo que todos sabíamos que estava por vir finalmente chegou: o New York Times se tornou a primeira grande organização de mídia a abrir um processo por violação de direitos autorais contra a OpenAI e a Microsoft. A ação, movida no tribunal federal de Manhattan, afirma que os modelos de linguagem OpenAI treinados com conteúdo do Times estão agora competindo com o meio de comunicação como fonte de informação online. O processo não lista danos monetários específicos, mas observa que a OpenAI deveria ser responsável por “bilhões de dólares em danos legais e reais”.

As atuais leis de direitos autorais permaneceram praticamente inalteradas durante décadas. O advento de dados infinitamente copiáveis ​​e facilmente partilhados deveria ter forçado um reexame da propriedade intelectual, mas, na verdade, os direitos de autor foram fortalecidos face às mudanças tecnológicas. Os sites são forçados a responder às demandas de remoção do DMCA, muitas vezes errôneas, e a duração dos direitos autorais foi estendida várias vezes. Esta falta de progresso significa que não se sabe como os tribunais irão lidar com os dados de formação para inteligência artificial. Não é a mesma coisa que copiar o trabalho de alguém e revendê-lo, mas é definitivamente algo.

O Times estaria em negociações com a OpenAI durante o verão com o objetivo de chegar a um acordo de licenciamento semelhante ao entre a OpenAI e a Associated Press. No entanto, as negociações terminaram sem acordo. Este caso será o primeiro grande teste às questões jurídicas que envolvem a inteligência artificial. Os grandes modelos de linguagem (LLMs) subjacentes aos sistemas de IA populares de hoje são enormes, às vezes consistindo em trilhões de parâmetros de aprendizado de máquina. Os modelos precisam ser grandes para formular respostas em linguagem natural de maneira semelhante à humana, e isso significa que eles precisam ingerir muitos dados de treinamento. A OpenAI notoriamente destruiu uma grande parte da Internet para alimentar seus modelos GPT.

O Times usou o Bing Search com ChatGPT para encontrar evidências de seu conteúdo no modelo. Crédito: Microsoft

O Times afirma que muitas consultas do ChatGPT baseiam-se em dados do NYT e forneceu alguns exemplos. O processo mostra que o ChatGPT pode responder a perguntas com citações quase literais de artigos no site do NYT que exigiriam uma assinatura para acesso. A investigação também revelou que o ChatGPT está emprestando pesadamente do Wirecutter, o centro de recomendação de produtos do Times. No entanto, a IA não fornece o Wirecutter e certamente não inclui os links comerciais que geram a receita do site.

Além de reclamar dos direitos autorais, o processo levanta preocupações sobre a imprecisão da IA ​​generativa. Esses modelos são apenas calculadoras sofisticadas de palavras – eles não sabem o que é e o que não é verdade. Como resultado, os modelos podem “alucinar” detalhes e podem até defender essas mentiras quando são denunciados. O Times observa que as pessoas podem fazer perguntas ao ChatGPT sobre eventos atuais, e o bot se baseará em todo o conteúdo do NYT para parecer que sabe a resposta. Mas, na realidade, pode estar a espalhar desinformação perigosa.

Este caso representa uma escalada dramática dos problemas jurídicos da OpenAI. A OpenAI estava chamando a atenção antes de 2023, mas foi a parceria com a Microsoft anunciada no início de 2023 que chamou a atenção de todos. Desde então, autores e organizações de mídia menores lançaram ações legais contra a OpenAI, alegando que o modelo ingeriu seu trabalho sem a sua autorização. Se for vitorioso, o Times poderá exigir uma montanha de dinheiro, mas, mais importante, poderá forçar a OpenAI a excluir os modelos que treinou com dados do NYT. Isso eliminaria instantaneamente a vantagem da IA ​​da Microsoft. Nem a OpenAI nem a Microsoft responderam ao processo até o momento.

Marcado em

Inteligência Artificial Microsoft

Mais de Extremo

A ExtremeTech apoia o Group Black e sua missão de aumentar a diversidade nas vozes e na propriedade da mídia.

© 2001-2024 Ziff Davis, LLC., uma empresa da Ziff Davis. Todos os direitos reservados.

ExtremeTech é uma marca registrada federalmente da Ziff Davis, LLC e não pode ser usada por terceiros sem permissão explícita. A exibição de marcas registradas e nomes comerciais de terceiros neste site não indica necessariamente qualquer afiliação ou endosso da ExtremeTech. Se você clicar em um link de afiliado e comprar um produto ou serviço, esse comerciante poderá receber uma taxa.

Compartilhe:

Comentários estão fechados.