8 月 7 日 OPENAI 公布自己的不想被OI白报网互联网爬虫 GPTBot,该爬虫是嫖纽爬虫 OPENAI 用来在全网抓爬内容然后训练 AI 模型用的。尽管多数网站允许 GPTBot 抓爬内容,站封站内不过也有些网站并不想给 OPENAI 白嫖,禁止所以在 robots.txt 文件里屏蔽了 GPTBot。其抓取网
比如知名新闻媒体《纽约时报》就在网站上封禁 GPTBot,容蓝禁止该爬虫访问纽约时报网站的点网任何内容,包括首页信息摘要等。不想被OI白报网
互联网档案馆的嫖纽爬虫存档显示,纽约时报大约是站封站内在 8 月 17 日修改 robots.txt 文件屏蔽 GPTBot 的,而在稍早的禁止时候纽约时报则修改了服务条款,明确禁止任何公司抓取其内容用来训练人工智能模型,其抓取网所以之后修改 robots.txt 协议禁止 GPTBot 也倒是容蓝可以理解。

纽约时报与 OPENAI 矛盾还是点网挺深的,上个月纽约时报就表示正在考虑对 OPENAI 提起法律诉讼,不想被OI白报网因为 OPENAI 侵犯了纽约时报的版权。还有两名作者也在 7 月起诉了 OPENAI,因为 OPENAI 拿他们的作品训练 GPT 模型。
对于修改 robots.txt 阻止 OPENAI 抓爬这事儿,纽约时报拒绝置评,OPENAI 则没有回复置评请求。
最后:如果你也想控制 GPTBot 的抓爬,可以在你网站的 robots.txt 文件中加入指令,例如完全禁止 GPTBot 或允许 GPTBot 抓取一部分内容。
具体操作方法请看:如何禁止OPENAI的爬虫(GPTBot)抓爬网站 附该爬虫的IP地址网段
顶: 73218踩: 48841
不想被OPENAI白嫖:纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网
人参与 | 时间:2025-10-30 05:54:19
相关文章
- callisto利维特女装2020冬季敞篷版 宝物等级的斯堪的纳维亚平淡色(callisto利维特女装2020冬季敞篷版 宝物等级的斯堪的纳维亚平淡色)不要告诉别人,
- 齐空域最齐的存货!《碧蓝胡念Versus》贩子开洛饱吹片
- 《三国杀OL》十殿阎罗典范返场!齐新体验等您应战!
- 《怪猎天下》冰本PC版切确解锁时候!无预载需48G
- 穿搭必不可少的服装配饰是什么(夏季不用买很多衣服,学会基础款配饰的时尚搭配法则,简洁显层次感有种布喇格叫钟汉良的儿子,上帝吻了大儿子的脸,却关了小儿子的窗)系遇了,
- 国产动绘《伍六七》本声大年夜碟大年夜卖,啊哈文娱引收音乐赋能IP的新测验测验
- 《暗乌粉碎神2》复刻版少啥样?有玩家本身做了个
- 脸书启禁AI换脸视频 业浑家士却表示结果很有限
- 中文网站排名强化系统(想必武当派能成为江湖龙神,他一共有三位徒弟:三男三女)这都可以,
- 非酋的哀伤!岛国《碧蓝胡念》玩家喜砸54万日元也出抽到目标讲具






评论专区