Amazon doet naar verluidt onderzoek naar Perplexity AI nadat het ervan werd beschuldigd websites zonder toestemming te schrappen

Amazon doet naar verluidt onderzoek naar Perplexity AI nadat het ervan werd beschuldigd websites zonder toestemming te schrappen

Amazon Web Services is een onderzoek gestart om vast te stellen of Perplexity AI zijn regels overtreedt Bedrade. Om precies te zijn, zou de cloudafdeling van het bedrijf beschuldigingen onderzoeken dat de dienst een crawler gebruikt, gehost op zijn servers, die het botuitsluitingsprotocol negeert. Dit protocol is een webstandaard, waarbij ontwikkelaars een robots.txt-bestand op een domein plaatsen dat instructies bevat over de vraag of robots wel of niet toegang hebben tot een bepaalde pagina. Naleving van deze richtlijnen is vrijwillig, maar gerenommeerde bedrijfscrawlers respecteren deze over het algemeen al sinds webontwikkelaars de standaard in de jaren negentig begonnen te implementeren.

In een vorig stuk, Bedrade Het is gerapporteerd Het ontdekte een virtuele machine die de robots.txt-instructies van zijn website omzeilde. Dit apparaat wordt gehost op een Amazon Web Services-server met IP-adres 44.221.181.252 die “zeker wordt beheerd door Perplexity”. Naar verluidt heeft ze de afgelopen drie maanden honderden keren andere Condé Nast-eigendommen bezocht om ook hun inhoud te distilleren. de voogd, Forbes En New Yorkse tijden Er werd ook ontdekt dat hij verschillende keren hun posten bezocht, Bedrade Hij zei. Om te controleren of Perplexity de inhoud daadwerkelijk scant, Bedrade Het bedrijf voerde titels of korte beschrijvingen van zijn artikelen in de chatbot van het bedrijf in. De tool reageerde vervolgens met resultaten die de artikelen nauwkeurig parafraseerden ‘met minimale attributie’.

nieuw Reuters Het rapport beweerde dat Perplexity niet het enige AI-bedrijf is dat verder gaat dan robots.txt-bestanden om inhoud te verzamelen die wordt gebruikt om grote taalmodellen te trainen. Het lijkt er echter op dat Bedrade Amazon heeft alleen informatie verstrekt over de crawler van Perplexity AI. “De Servicevoorwaarden van AWS verbieden beledigende en illegale activiteiten, en onze klanten zijn verantwoordelijk voor het naleven van deze voorwaarden”, vertelde Amazon Web Services ons in een verklaring. “We ontvangen routinematig meldingen van vermeend misbruik uit verschillende bronnen en we betrekken onze klanten om deze rapporten te begrijpen.” De woordvoerder voegde er ook aan toe dat de cloudafdeling van het bedrijf ons liet weten dat we geen informatie over deze kwestie hebben. Bedrade Zij onderzocht de door het Bulletin verstrekte informatie, zoals zij dat ook doet bij alle meldingen van mogelijk misbruik.

READ  Amazon Amazon investeert 35 miljard dollar in Virginia

Verbijstering woordvoerster Sarah Blatnick zei: Bedrade Blatnick zei dat het bedrijf al op de vragen van Amazon had gereageerd en ontkende dat zijn crawlers het botuitsluitingsprotocol hadden omzeild. “Onze PerplexityBot, die op AWS draait, respecteert het robots.txt-bestand en we hebben bevestigd dat door Perplexity gecontroleerde services op geen enkele manier crawlen die in strijd is met de AWS-servicevoorwaarden”, zei ze. Blatnick vertelde ons dat Amazon de zaak heeft onderzocht. Bedrade Het bedrijf voert alleen mediaonderzoeken uit als onderdeel van het standaardprotocol voor het onderzoeken van meldingen van misbruik van zijn middelen. Het lijkt erop dat het bedrijf nog nooit eerder van Amazon over welk onderzoek dan ook heeft gehoord. Bedrade Ik heb het bedrijf gebeld. Blatnick gaf dat toe BedradePerplexityBot negeert het robots.text-bestand echter wanneer een gebruiker een specifieke URL in zijn chatbot-query opneemt.

Aravind Srinivas, CEO van Perplexity, had eerder ontkend dat zijn bedrijf “het botuitsluitingsprotocol negeerde en er vervolgens over loog.” Srinivas gaf toe Snel bedrijf Dat Perplexity naast zijn eigen webcrawlers ook webcrawlers van derden gebruikt, en dat de bot Bedrade Eén van hen is geïdentificeerd.

Bijgewerkt op 28 juni 2024 om 14:20 ET: We hebben dit bericht bijgewerkt om de Perplexity-verklaring toe te voegen aan Engadget.

Bijgewerkt op 28 juni 2024, 20:27 ET: We hebben dit bericht bijgewerkt naar een verklaring van Amazon Web Services.

You May Also Like

About the Author: Tatiana Roelink

'Webgeek. Wannabe-denker. Lezer. Freelance reisevangelist. Liefhebber van popcultuur. Gecertificeerde muziekwetenschapper.'

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *