Várias empresas de IA contornam padrão para extrair conteúdo de sites de mídia, diz empresa de licenciamento

Por Katie Paul

(Reuters) - Várias empresas de inteligência artificial estão contornando um padrão comum da web usado por editoras para bloquear a extração de conteúdo de seus sites para uso em sistemas de inteligência artificial generativa, informou a startup de licenciamento de conteúdo TollBit às editoras.

A carta às editoras vista pela Reuters nesta sexta-feira, que não cita o nome das empresas de IA ou das editoras afetadas, surge em meio a uma disputa pública entre a startup de pesquisa de IA Perplexity e o veículo de mídia Forbes envolvendo o mesmo padrão da web e um debate mais amplo entre empresas de tecnologia e mídia sobre o valor do conteúdo na era da IA generativa.

A editora de mídia de negócios acusou publicamente a Perplexity de plagiar suas matérias investigativas em resumos gerados por IA sem citar a Forbes ou pedir sua permissão.

Uma investigação da Wired publicada esta semana descobriu que a Perplexity provavelmente contornou os esforços para bloquear seu rastreador de web por meio do Protocolo de Exclusão de Robôs, ou "robots.txt" -- um padrão amplamente aceito destinado a determinar quais partes de um site podem ser rastreadas.

A Perplexity recusou um pedido da Reuters para comentar a disputa.

A TollBit, uma startup em estágio inicial, está se posicionando como uma intermediária entre empresas de IA ávidas por conteúdo e editoras dispostas a fechar acordos de licenciamento com elas.

A empresa rastreia o tráfego de IA para os sites das editoras e usa análises para ajudar os dois lados a chegar a um acordo sobre as taxas a serem pagas pelo uso de diferentes tipos de conteúdo.

Por exemplo, as editoras podem optar por definir taxas mais altas para "conteúdo premium, como as últimas notícias ou insights exclusivos", diz a empresa em seu site.

A empresa diz que tinha 50 sites ativos em maio, embora não os tenha nomeado.

De acordo com a carta da TollBit, a Perplexity não é a única infratora que parece estar ignorando o "robots.txt".

A TollBit disse que suas análises indicam que "vários" agentes de IA estão ignorando o protocolo, uma ferramenta padrão usada pelas editoras para indicar quais partes do site podem ser rastreadas.

O protocolo "robots.txt" foi criado em meados da década de 1990 como uma forma de evitar a sobrecarga de sites com rastreadores da web. Embora não exista um mecanismo de aplicação legal, historicamente tem havido uma ampla conformidade na web.

Mais recentemente, o "robots.txt" se tornou uma ferramenta importante usada pelos editores para impedir que as empresas de tecnologia absorvam seu conteúdo gratuitamente para uso em sistemas de IA generativos que podem imitar a criatividade humana e resumir artigos instantaneamente.

As empresas de IA usam o conteúdo para treinar seus algoritmos e para gerar resumos de informações em tempo real.

Algumas editoras, incluindo o New York Times, processaram as empresas de IA por violação de direitos autorais em relação a esses usos. Outras estão assinando contratos de licenciamento com as empresas de IA abertas a pagar pelo conteúdo, embora as partes frequentemente discordem sobre o valor dos materiais. Muitos desenvolvedores de IA argumentam que não infringiram nenhuma lei ao acessá-los gratuitamente.

A Thomson Reuters, proprietária da Reuters News, está entre as que fecharam acordos para licenciar conteúdo de notícias para uso por modelos de IA.

OTHER NEWS

33 minutes ago

Android: é perigoso utilizar os teclados Gboard ou Swiftkey?

33 minutes ago

V novém dokumentárním filmu Céline Dion ukazuje záchvat způsobený vzácným syndromem

33 minutes ago

Possível lesão de Murilo faz Leila tomar decisão importante nos bastidores do Palmeiras

33 minutes ago

Renault Scenic E-Tech: Agora elétrico

33 minutes ago

Metroid Prime 4: Beyond equipe de desenvolvimento finalmente revelada

36 minutes ago

Oficial: Busnic assina em definitivo pelo Vizela

38 minutes ago

PF inclui ex-CEO da Americanas na difusão vermelha da Interpol

38 minutes ago

Feira do Livro no Pacaembu aumenta programação em quase 40%

38 minutes ago

Espargaró detalha acerto de Martín e Aprilia e conta: “Tinha tudo fechado com Ducati”

38 minutes ago

Homem mais rico da Geórgia doará US$ 10 milhões à seleção do país por campanha na Euro

41 minutes ago

Wideo: Rosja prezentuje nowy opancerzony transporter BTR-82A

45 minutes ago

Festa dos visitantes esquenta público dos bois de Parintins

45 minutes ago

Banco Central eleva estimativa do PIB para 2,3% neste ano

46 minutes ago

Russell sugere mudanças nas regras da F1 para que a Mercedes possa "recuperar o atraso mais rapidamente

46 minutes ago

Video: Malli juhlistaa kurvejaan tyylikkäällä kolmen kappaleen bikineillä

46 minutes ago

Esta crónica não será lida na Rússia

46 minutes ago

Fans av Tom Hanks sier at hans neste film er en oppfølger til “Forrest Gump”

46 minutes ago

Les Houthis publient une vidéo de leur nouveau missile balistique hypersonique Hatem-2

46 minutes ago

Bruxelas cede aos protestos dos agricultores: ovos e açúcar da Ucrânia voltam a pagar taxas aduaneiras

46 minutes ago

A húszik közzétették új hiperszonikus ballisztikus rakétájuk, a Hatem-2 videóját

46 minutes ago

Tour 2024: Red Bull-BORA-hansgrohe apresenta formação e equipamento

46 minutes ago

Houthis offentliggør video af deres nye hypersoniske ballistiske missil Hatem-2

46 minutes ago

Houthis offentliggjør video av deres nye hypersoniske ballistiske missil Hatem-2

50 minutes ago

Sporting escapa ao grupo da morte na EHF Champions League

50 minutes ago

Chuva e trovoada agravam avisos em seis distritos, que sobem para laranja

50 minutes ago

Não era falso: aqui estão as primeiras 28 telas oficiais de Assetto Corsa Evo

52 minutes ago

Max reage ao resultado do "Derby de Verstappen" na Eurocopa de 2024

55 minutes ago

O novo monitor da Philips tem mais de um metro de comprimento e custa quase 1400 euros

55 minutes ago

Køber fra ‘Storage Wars’ sikrer sig sjældne genstande til en værdi af 300.000 dollars

55 minutes ago

Video: Modell firar sina kurvor i en superstylig tredelad bikini

55 minutes ago

Heidi Klum lánya elbűvöli követőit, amikor merész fürdőruhában pózol

55 minutes ago

Zema recusa encontro com Lula em MG e mantém relação distanciada

55 minutes ago

Houthis publiceren video van hun nieuwe hypersonische ballistische raket Hatem-2

55 minutes ago

Inteligência artificial pode agravar desigualdade de renda entre países, diz publicação do FMI

55 minutes ago

Toffoli: ‘Se tudo vai parar no Judiciário é falência de outros órgãos’, diz no ‘Gilmarpalooza’

1 hour ago

A Grande Conquista 2: Barraqueiro dispara em favoritismo

1 hour ago

Real Madrid ou Barcelona? Frimpong, do Bayer Leverkusen, escolhe em qual clube quer jogar

1 hour ago

Quem é Paulo Bracks? Conheça o novo CEO do Santos

1 hour ago

Abel assume erros após pesada derrota: «Foi um acidente de percurso»

1 hour ago

Álvarez confirma saída do Benfica