调查显示:半数热门新闻网站禁止 OpenAI 爬虫访问

2024-02-28 热点资讯 关注公众号
    【新闻版】
研究:近一半热门新闻网站屏蔽了 OpenAI 爬虫    全球近半数热门新闻网站封锁OpenAI爬虫,北半球国家尤为显著
    据IT之家2月27日报道,一项由路透社研究所最新揭晓的研究揭示了全球新闻网站对人工智能爬虫的态度与策略。研究数据显示,截至2023年底,在覆盖全球10个国家的主流新闻网站中,接近半数(48%)采取了屏蔽OpenAI爬虫的措施,而针对谷歌AI爬虫的屏蔽比例也高达四分之一(24%)。
    深入探究这一现象,路透社研究所详尽分析了包括《纽约时报》、BuzzFeed新闻、《华尔街日报》、《华盛顿邮报》、CNN和NPR在内的15家最具影响力的网络新闻机构的robots.txt文件,它们分别代表了德国、印度、西班牙、英国和美国等国的传统印刷媒体、电视广播公司以及数字原生媒体三大类别。
    研究报告披露了一个引人关注的现象:在传统印刷媒体领域,超过半数(57%)的网站如《纽约时报》已对OpenAI爬虫进行了有效屏蔽,相比之下,电视和广播公司的比例为48%,数字原生媒体则为31%。同样地,对于谷歌爬虫的屏蔽,印刷媒体达到32%,广播公司和数字原生媒体分别为19%和17%。
    同时,康奈尔大学的一项最新研究表明,当新一代人工智能模型仅依赖前代模型数据而非人类输入进行训练时,可能会陷入“模型崩溃”,导致生成质量下滑,错误与误导信息增多。
    爬虫技术在互联网世界中扮演着重要角色,例如Googlebot负责抓取并收录发布商网站至搜索结果,而OpenAI的GPTBot则在网络上收集大量数据用于训练其大型语言模型如ChatGPT,使其能产出准确且实时的,尤其重视高质量新闻来源——大型语言模型对优质出版商的倚重程度较其他来源高出5到100倍。
    此外,该研究还揭示了一项地域性趋势,即北半球国家的新闻机构相较于南半球更倾向于屏蔽人工智能爬虫。以美国为例,79%的主流在线新闻网站屏蔽了OpenAI爬虫,而在墨西哥和波兰,这一比例仅为20%。与此同时,德国60%的新闻网站选择屏蔽谷歌爬虫,而在波兰和西班牙,这一比例却仅有7%。
    值得注意的是,大部分(97%)屏蔽谷歌爬虫的网站同时也对OpenAI爬虫实施了封锁。尽管研究并未给出明确原因,但这一高比例可能暗示OpenAI的爬虫发布时间早于谷歌。事实上,去年8月初,OpenAI启动其人工智能爬虫后,谷歌随即于9月份跟进。进一步观察发现,一旦决定屏蔽,无一家新闻网站撤销对OpenAI或谷歌人工智能爬虫的限制措施。

上一篇:怒亏15亿、巨头撤厂,明星行业大溃逃
下一篇:电鳗:华东医药净利预超28亿 两股东提议2023年度分红10亿引关注
更多更酷的内容分享
猜你感兴趣
网友热议:超过半数美国人反对禁止TikTok

网友热议:超过半数美国人反对禁止TikTok

本文主要讨论了TikTok在美国的新法规,即禁止TikTok在美国全国范围内有效。超过一半的美国人表示对这项措施持负面看法,其中许多人为数据隐私担忧。拜登总统签署了一项《2024年保护美国人数据免受外国对手侵害法案》,并呼吁字节跳动在9个月内向其目标市场出售股份。TikTok表示他们将采取法律行动对抗这一法律。尽管有近一半的支持者,但大部分年龄在35到54岁之间的人认为TikTok的母公司字节跳动可能会对其全球影响力的进一步控制产生负面影响。这项禁令已经得到了美国社会广泛的关注和反响,许多受访者表达了他们的担忧和不满。

热点资讯 05.02
《纽约时报》等顶级新闻网站对SearchGPT网络爬虫进行屏蔽,引发公众关注

《纽约时报》等顶级新闻网站对SearchGPT网络爬虫进行屏蔽,引发公众关注

全球新闻出版商已对OpenAI的新搜索引擎封锁:多个知名媒体网站宣布禁止该网络爬虫。原作者指出出版商可能对其可信度产生疑虑或对流量存疑,因为某些网站已将该工具屏蔽。原作者推测,这是为了阻止在线数据被用于AI模型训练。对此,OpenAI辩称这一行为违反了他们的协议,并诉诸法院。这个案例引发了对新闻出版业安全性的讨论。

热点资讯 08.03
滥用AI技术挑战伦理底线:anthropic爬虫引发多个网站不满

滥用AI技术挑战伦理底线:anthropic爬虫引发多个网站不满

anthropic 公司使用 ClaudeBot 反对 iFixit 网站的使用条款。两家公司均指责对方未获许可即大量抓取其内容。

热点资讯 07.28
调查显示,十大健康问题困扰现代男士。

调查显示,十大健康问题困扰现代男士。

"啤酒肚"困扰多数男性,研究显示其易引发多种疾病。日本专家建议通过随时随地的运动和改变生活习惯来消除它。此外,肺癌成为中国大城市男性发病率首位,戒烟、健康饮食和改善环境是预防的关键。

男性养生 03.16
南方电网黑掉科陆电子?美的投资大幅亏损,这家互联网巨头真的要凉了?

南方电网黑掉科陆电子?美的投资大幅亏损,这家互联网巨头真的要凉了?

科陆电子又被南方电网拉黑,中标的2.56亿元项目因市场禁入措施无法执行。市场行情火爆,且公告未提供解禁原因。这一事件对科陆电子股票造成了严重影响。

热点资讯 11.10
以太坊挑战绝地反击,冲击3100,市场价值投资的杠杆思维解析

以太坊挑战绝地反击,冲击3100,市场价值投资的杠杆思维解析

比特币与以太坊近期走势强劲,前者突破新高,后者突破新高,暗示二者可能面临转势。此外,以太坊已从守转攻,有望突破3,500美元的前高。两者之间存在剧烈汇率波动,有望引发新的投资热潮。综上所述,投资者应考虑从这两个角度寻求机会,同时需谨慎操作风险。

热点资讯 11.10
周末消息前瞻:A股三大悬念将持续影响走势

周末消息前瞻:A股三大悬念将持续影响走势

本周A股涨势猛烈,各大指数涨幅均超过10%,但波动加大,成交量亦创历史新高。值得注意的是,部分个股短期内涨幅过大,或存在异动风险,如中化岩土、华映科技等,后市面临调整压力。此外,互联网平台“直播炒股”现象受到严惩,相关账号被封。

热点资讯 11.10
拼多多 造梦新质商家逆袭之路:科技驱动下的商业模式创新

拼多多 造梦新质商家逆袭之路:科技驱动下的商业模式创新

反思传统商业模式,并尝试转型。查兰如带领村民开启了新一轮的发展之旅,他们选择坚守初心,打造属于家乡的独特品牌,从而在竞争激烈的市场中站稳脚跟。这一系列举措不仅吸引了众多顾客,也让丁集小镇逐渐成为国内婚纱礼服业的新焦点。

热点资讯 11.10
MIUI体验升级,小米平板7 Pro带你步入科技新世界

MIUI体验升级,小米平板7 Pro带你步入科技新世界

天际蓝:正面为窄边框,磨砂处理细腻易留指纹;背面摄像头位于长边框内,具备AlwaysOn技术,加价可选纳米柔光屏版;此次升级满意度如何,请查看原图。

热点资讯 11.10
探寻做小红书的秘密:七项关键因素解析

探寻做小红书的秘密:七项关键因素解析

小红书运营的关键要素包括祛魅平台规则、放弃爆文幻想、企业号流量误区以及高转化笔记特性。祛魅平台规则强调不要过于追求爆款,而应该专注高质量的内容;放弃爆文幻想则告诫要理智看待热度,只有发布合规内容才能获得曝光;企业号流量误区则是盲目相信流量扶持,忽视了用户的参与度和互动性;高转化笔记应注重吸引眼球、激发购买欲望、建立信任和说服力。此外,还可以借鉴同行的成功经验,运用合适的内容形式和媒介来提高流量和转化率。

热点资讯 11.10
奥特曼教你如何通过互联网塑造未来——yc ceo专访录

奥特曼教你如何通过互联网塑造未来——yc ceo专访录

山姆·奥特曼预测的超级人工智能将降临的时刻。他在采访中表示,能源充足和智能充足是实现其他所有愿景的关键要素,而无限能源和无限智能将带来丰富的应用前景。他还分享了他的创业经验和对于未来的展望。他对正在创业的人来说给出了宝贵的建议——尽快拥抱新技术,同时也要关注构建可持续提供价值的产品或服务。

热点资讯 11.10
制作自定义GTA风格的Waymo驾车轨迹:全生成式合成器上线!

制作自定义GTA风格的Waymo驾车轨迹:全生成式合成器上线!

"Machine之心AIxiv专栏"上发布的免费全生成式视角合成方法 "FreeVS" 拥有高效高品质的图像生成能力,并可直接部署于现实测试场景,为现有的“场景重建 - 新视角渲染”方法带来革新性突破。

热点资讯 11.10
直播带货需警惕的七大法律风险:避免经济损失,保障自身权益

直播带货需警惕的七大法律风险:避免经济损失,保障自身权益

"富媒体内容"在夜间背景颜色为#444444的新闻表单中,当不使用自定义框中的图像时,文章段落间有约22px的距离;在暗色主题下,标题和段落的行间距较小,但仍有足够空间以保持可读性。

热点资讯 11.10
尝试新方法:解决OpenAI模型运行速度问题,提高开发效率

尝试新方法:解决OpenAI模型运行速度问题,提高开发效率

OpenAI的AI模型Orion在性能质量提升程度上远小于GPT-3到GPT-4的飞跃,可能影响AI模型的改进速度。为应对这一问题,OpenAI成立了“基础”团队,并计划基于AI合成数据训练Orion,但在后续训练中对模型作出更多改进。同时,OpenAI正在推进Orion的安全测试,并计划于明年年初发布这一模型。此外,OpenAI还通过收购了Chat.com域名,以反映模型开发的变化。

热点资讯 11.10