🤖 Perplexity AI 违反 robots.txt 和伪造用户代理,被发现抓取网站
Perplexity AI 是一款由人工智能驱动的搜索引擎,它被发现违反了 robots.txt 文件的明确禁止,并伪造用户代理,抓取网站。博主 Robb Knight 发现,即使他实施了服务器端阻止和 robots.txt 限制,Perplexity 仍然能够访问并总结他的博客文章。
Knight 证实,Perplexity 使用的是标准的 Google Chrome 用户代理,而不是他们声称的“PerplexityBot”用户代理,并且通过无头浏览器访问他的网站。这意味着 Perplexity 正在绕过网站限制,并可能侵犯用户隐私。Knight 正在探索法律选择,包括 GDPR 请求,以解决这个问题。
(HackerNews)
via 老裕泰 - Telegram Channel
Perplexity AI 是一款由人工智能驱动的搜索引擎,它被发现违反了 robots.txt 文件的明确禁止,并伪造用户代理,抓取网站。博主 Robb Knight 发现,即使他实施了服务器端阻止和 robots.txt 限制,Perplexity 仍然能够访问并总结他的博客文章。
Knight 证实,Perplexity 使用的是标准的 Google Chrome 用户代理,而不是他们声称的“PerplexityBot”用户代理,并且通过无头浏览器访问他的网站。这意味着 Perplexity 正在绕过网站限制,并可能侵犯用户隐私。Knight 正在探索法律选择,包括 GDPR 请求,以解决这个问题。
(HackerNews)
via 老裕泰 - Telegram Channel