Perplexity, AI Karşıtı Site Engellerini Aşarak İçerik Toplamakla Suçlanıyor
Yapay zeka girişimi Perplexity, web siteleri açıkça izin vermemesine rağmen bu sitelerden içerik toplayarak (scraping) veri elde etmekle suçlanıyor. İnternet altyapı sağlayıcısı Cloudflare, Perplexity’nin web sitelerinin robots.txt dosyasıyla belirttiği engellemeleri kasıtlı olarak aştığını öne sürdü.
Cloudflare: "Perplexity kimliğini gizleyerek siteleri kandırıyor"
Cloudflare tarafından yayınlanan rapora göre, Perplexity'nin botları kimliklerini gizleyerek web sitelerini Google Chrome tarayıcısı gibi taklit ediyor ve farklı ağ numaraları (ASN) üzerinden erişim sağlayarak sitelerin aldığı önlemleri aşıyor. “Bu aktivite on binlerce alan adı ve milyonlarca günlük istek üzerinde gözlemlendi,” diyen Cloudflare, bu davranışı makine öğrenimi ve ağ sinyalleri yardımıyla tespit ettiklerini belirtti.
Perplexity: “Bu bot bize ait değil”
Perplexity sözcüsü Jesse Dwyer, Cloudflare’in blog yazısını “bir satış kampanyası” olarak nitelendirdi ve paylaşılan ekran görüntülerinde “hiçbir içeriğe erişilmediğini” iddia etti. Ayrıca, Cloudflare tarafından tanımlanan botun Perplexity’e ait olmadığını savundu.
Robots.txt Engelleri Deliniyor
Yapay zekâ şirketlerinin internetten içerik toplama ihtiyacı bilinirken, birçok web sitesi robots.txt dosyası aracılığıyla AI botlarının erişimini kısıtlamaya çalışıyor. Ancak Cloudflare, Perplexity’nin bu engellemeleri bilinçli şekilde baypas ettiğini doğruladı. Bu durum, AI eğitimi için kullanılan veri kaynaklarının etik sınırlarını yeniden gündeme taşıdı.
Cloudflare: “Perplexity artık güvenilir botlar listemizde değil”
Cloudflare, Perplexity'nin botlarını doğrulanmış botlar listesinden çıkardığını ve ek koruma yöntemleri geliştirerek bu botları engellediğini açıkladı. Ayrıca geçen ay, AI şirketlerinin içerik taramaları için ödeme yapmasını sağlayan yeni bir pazar yeri duyuran Cloudflare, yayıncıların iş modelinin AI tarafından tehdit edildiğini vurguladı.
Geçmişte de benzer suçlamalar vardı
Bu, Perplexity’nin içerik toplama konusunda ilk kez eleştirilmesi değil. Geçtiğimiz yıl Wired gibi medya kuruluşları, Perplexity’yi içeriklerini izinsiz kullanmak ve intihal yapmakla suçlamıştı. Hatta, TechCrunch Disrupt 2024 konferansında CEO Aravind Srinivas, şirketin “intihal” tanımına dair doğrudan bir yanıt verememişti. Read the full article
















