freeBuf
主站

分类

云安全 AI安全 开发安全 终端安全 数据安全 Web安全 基础安全 企业安全 关基安全 移动安全 系统安全 其他安全

特色

热点 工具 漏洞 人物志 活动 安全招聘 攻防演练 政策法规

点我创作

试试在FreeBuf发布您的第一篇文章 让安全圈留下您的足迹
我知道了

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

许多主要新闻媒体正屏蔽 OpenAI 爬虫
Zicheng 2024-02-28 11:36:01 94066
所属地 上海

自OpenAI的内容生成式人工智能模型面世以来,大量互联网数据成为了不断训练和优化模型的“饵料”,但据路透社研究所的一项调查,有越来越多的新闻媒体已对OpenAI的数据爬取说“不”,在传统媒体领域,这一比例甚至超过了50%。

路透社研究所分析了《纽约时报》、《华尔街日报》、《华盛顿邮报》、CNN、NPR 等多家主流新闻媒体,涵盖美国、英国、德国、印度等10个国家,并将其归为传统印刷媒体(纸媒)、广播电视媒体、数字媒体三大类。研究发现,57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序,广播电视媒体和数字媒体的比例分别为48%和 31%。

研究还发现,屏蔽 OpenAI 的新闻网站比例因国家和地区差异而存在很大不同,在美国,这一比例高达79%,而在墨西哥和波兰仅为 20%。

所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异

此外, 在屏蔽了OpenAI 爬虫的新闻媒体中,有97%也同样屏蔽了谷歌人工智能的爬虫。

研究揭示了一些新闻媒体不希望他们的内容被人工智能使用,如果人们使用人工智能从网络上获取新闻,这些媒体会认为自己将被抛弃或取代。Gartner 副总裁、杰出分析师安德鲁·弗兰克 (Andrew Frank) 表示:“路透社的研究强调了生成式人工智能面临的一个根本挑战:它依赖于真实的人生成的真实内容,而这些人将其视为对他们生计的威胁。”

与此同时,康奈尔大学最近的一项研究发现,当新的人工智能模型根据先前模型而不是人类输入的数据进行训练时,它们往往会趋向于“模型崩溃”或退化,导致越来越多地生成错误信息。

OpenAI 于去年 8 月初推出了人工智能爬虫,谷歌也于 9 月紧随其后。根据这项研究,一旦这些媒体做出屏蔽决定,恐将很难改变立场对其进行解除。

参考来源:

How many news websites block AI crawlers?

本文为 Zicheng 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)
被以下专辑收录,发现更多精彩内容
+ 收入我的专辑
+ 加入我的收藏
Zicheng LV.10
这家伙太懒了,还未填写个人描述!
  • 1046 文章数
  • 208 关注者
一周网安优质PDF资源推荐丨FreeBuf知识大陆
2025-03-14
FreeBuf周报 | 谷歌去年向白帽支付了近1800万美元;热门Python库曝严重缺陷
2025-03-14
FreeBuf早报 | X平台遭遇僵尸网络攻击;超5000个恶意程序包正破坏Windows系统
2025-03-11