谷歌被罚款2.5亿欧元,涉及违规收集训练数据的问题再次引起争议。

2024-03-24 热点资讯 关注公众号

据央视新闻3月21日报道,法国市场监管机构日前宣布,已向美国谷歌公司开出一张2.5亿欧元(约合人民币19.7亿元)的罚单,原因是谷歌未经同意使用法国出版商和新闻机构的训练旗下的聊天机器人“巴德”(其升级版名为“双子座”),违反了欧盟知识产权的相关法规。谷歌就此成为了第一家因为训练数据而被罚款的人工智能(AI)公司。对此,学者向澎湃新闻(www.thepaper.cn)表示,谷歌遭到处罚,可能会导致今后出现越来越多类似的诉讼。

在AI技术更新迭代非常迅速的前提下,AI公司在获取训练大模型的数据时,如何界定获取语料的合法性?专家认为,目前数据权益保护问题仍存在模糊地带,但可以出台健全市场和管理的方法应对这些问题。

谷歌被首罚成先例,不排除有更多类似诉讼

报道称,法国监管机构表示,作为和解条件,谷歌对其违规行为不作辩解,并将提出有关措施,以修正产品和服务缺陷。谷歌对此回应称,希望寻求和解是因为“该往前走了”。“我们希望专注于更大的、可持续的方法,把用户和高质量的联系起来,并与法国出版机构进行建设性合作。但需要注意的是,监管机构没有充分考虑我们为解决问题所做的努力,因为在‘探索新路’的过程中,我们无法预测未来的风向。”

谷歌与法国出版机构之间的纷争,始于2019年。当时,法新社等多家法国媒体机构曾向监管机构投诉,称谷歌未经允许,擅自使用这些机构出版的网络。2020年,监管机构要求谷歌与相关出版机构就付费进行谈判,但因为谈判未果,监管机构于2021年向谷歌开出了5亿欧元的罚单。2022年,谷歌与相关媒体出版商达成和解协议。

在此次的声明中,监管机构称,谷歌违反了和解协议中的几项条款,包括与相关出版机构谈判、提供透明信息等。监管机构特别提到,谷歌利用媒体平台和新闻机构的数据,用于训练2023年推出的“巴德”,但未告知相关出版机构和监管机构。为此,监管机构表示,“对谷歌的AI服务感到担忧”。

因为此次争端,谷歌成为首家因为训练数据而被罚款的AI公司。在AI更新迭代迅速的前提下,谷歌的案例对于其他AI公司是一个警示,还是今后会有更多类似的诉讼?复旦大学计算机学院教授、复旦大学上海大数据实验室主任肖仰华向澎湃新闻表示,类似的诉讼可能会越来越多,这些诉讼可以被认为是AI产业发展过程中的必然问题。“AI发展核心在于数据,所以AI公司非常渴求高质量数据。在收集和使用数据的过程中,这些公司会加大数据收集力度,但会有意无意地侵犯其他主体的数据权益。另一方面,数据权益保护目前仍存在模糊地带,包括制度供给、实践案例等。”

从法律的角度看,上海交通大学媒体与传播学院教授陈堂发认为,法国监管机构对于谷歌的处罚具有法律依据,这对其他的AI公司应该具有警示功能,处罚行为表明AI研发及产品使用如果涉及大规模使用他人作品的训练,无疑存在法律风险。

传统媒体与AI公司之间的版权之争

为确保获得使用出版机构作为数据训练的许可,另一家科技公司OpenAI于2023年与美联社、德国媒体巨头Axel Springer等达成有关协议。不过,该公司没有与《纽约时报》就有关问题达成协议,因此在2023年12月被该报起诉。《纽约时报》称,OpenAI和科技巨头微软“非法复制和使用该报独特、有价值的作品”,要求两家公司销毁任何使用到该报版权材料的聊天机器人模型和训练数据。《纽约时报》表示曾与两家公司接洽,提出对他们使用其版权的担忧,并希望探索“友好的解决方案”,比如提出围绕生成式AI产品的商业协议等,但当时的谈判未得出解决方案。

《纽约时报》就此成为第一家就版权问题起诉AI公司的美国媒体。起诉显示,大量由该报刊发的文章被用作训练聊天机器人的数据,且有分析认为,这些聊天机器人正在与传统新闻出版平台竞争,同样希望成为“可靠的消息源”。此外,《纽约时报》还在诉讼中引用一些案例,表明一些在该报网站上需要付费订阅阅读的文章,ChatGPT等聊天机器人可以免费向用户提供。

目前的多项争端,多由《纽约时报》、法新社等媒体机构提起。肖仰华分析称,由于目前媒体界呈现出新媒体挑战传统媒体的局面,再加上生成式AI会侵犯传统出版机构的利益,因此传统媒体在这个问题上更敏感。

对于这项诉讼,OpenAI曾多次回应称“感到惊讶”,“因为双方本处于非常积极和富有成效的谈判中”。OpenAI方面表示,旗下的聊天机器人ChatGPT“不会成为代替订阅《纽约时报》的选项”,称“包括《纽约时报》在内的单一数据源,对大模型的预期学习并不重要,因为大模型是从人类知识的巨大集合中学习”。

OpenAI首席执行官奥特曼还在今年1月的达沃斯经济论坛上表示:“AI不需要从《纽约时报》等出版商那里获取大量训练数据。”2月,OpenAI直言,称《纽约时报》为获取证据使用“欺骗性提示”,甚至“雇人黑入了OpenAI的系统”,但未明确指出所谓“黑客”的身份,以及该报可能违反的反黑客法。OpenAI此举,遭到《纽约时报》反驳,称OpenAI没有否认“在法定诉讼时效期内,未经许可地复制了该报作品”。

社交平台或成监管真空地带

相较于出版物有版权作为制约,AI公司使用社交平台数据训练模型,更容易走进灰色地带。2023年,特斯拉公司首席执行官马斯克表示,其拥有的社交平台“X”(原推特)会使用收集到的公开数据训练大模型,但不会涉及用户的个人隐私数据和私信。不过,马斯克曾公开批评微软等科技公司,称这些公司“非法使用‘X’上的数据训练大模型”,并威胁会就此提起诉讼。

本月早些时候,OpenAI首席技术官穆拉蒂(Mira Murati)接受了《华尔街日报》采访。对于该公司用何种数据训练旗下的文生视频大模型Sora的问题,穆拉蒂表示,“我们使用公开的数据,以及经过许可的数据。”但当被问及其中是否包括脸书、YouTube等社交平台的数据,穆拉蒂只能简单地以“我不确定”作为回应。

在这种背景下,如何界定AI公司是否合法使用和获取了社交平台上的语料?肖仰华认为,AI公司是否能无所顾忌地使用公开或半公开的数据,是一个处于模糊地带的问题。“现有法规已经滞后于大模型训练相关的新型数据权益保护需求。因此有两个比较关键的点,一是健全与完善数据要素市场,二是加强大模型训练语料的安全合规认证与管理。”

在市场的层面,为了减少类似纠纷,同时给AI公司获取语料划定边界,陈堂发表示,“途径之一,就是相对清晰地切割纯粹科研或个人学习欣赏使用AI,与商业性使用AI的具体情形。前者的作品使用具有公益属性可以免于责任,后者的作品使用应当遵从市场法则。”

在总体的AI监管层面,为弥补漏洞,欧盟和联合国先后通过有关法案。3月13日,欧洲议会正式投票通过并批准欧盟《人工智能法案》,包括严格禁止“对人类安全造成不可接受风险的AI系统”,比如有目的地操纵技术、利用人性弱点或根据行为、社会地位和个人特征等进行评价的系统等。

3月21日,联合国大会投票通过了第一个有关AI的决议草案,以确保这项新技术能够惠及所有国家、尊重人权并且是“安全、可靠和值得信赖的”技术。决议还承认“AI系统的治理是一个不断发展的领域”,需要进一步讨论可能的治理方法。


人工智能已经成为一种不可或缺的技术,它不仅改变着我们的生活方式,也在不断地推动各行各业的发展。然而,随着AI技术的快速发展,人们开始注意到一个问题:AI公司在获取训练大模型的数据时,如何界定获取语料的合法性?
对此,学者向澎湃新闻表示,目前数据权益保护问题仍然存在模糊地带,但可以通过建立健全市场和管理的方法应对这些问题。这意味着,对于AI公司在获取训练数据时,应更加谨慎和负责任,不能随意使用他人的作品来训练自己的模型。
谷歌被首罚成先例,未来还有更多类似的诉讼吗?
谷歌是目前被罚款最多的AI公司,其被罚款的原因主要是其未经同意使用法国出版商和新闻机构的训练旗下的聊天机器人“巴德”。尽管这一事件引起了广泛关注,但对于谷歌来说,这并不是最后的结果。在未来,Google有可能面临更多的类似的诉讼。
据报道,法国监管机构表示,作为和解条件,谷歌对其违规行为不作辩解,并将提出有关措施,以修正产品和服务缺陷。这对于谷歌来说,是一次宝贵的机会,可以借此改进产品和服务质量,提高用户体验。
总的来说,虽然人工智能的发展带来了许多好处,但也带来了一些新的问题。我们需要对这个问题有更多的认识和了解,以便更好地解决这些问题。

上一篇:OPPO Watch X第一回盒:瘦了快30斤,我做对了哪些事?
下一篇:一线调研丨“公转铁”如何“转”起来?带来哪些综合效益?一文了解
更多更酷的内容分享
猜你感兴趣
奥康鞋业董事长因涉嫌违法违规涉资数亿被罚款300万

奥康鞋业董事长因涉嫌违法违规涉资数亿被罚款300万

ST奥康因违规资金占用、关联交易及隐瞒大额资金占用和关联交易等问题被上交所谴责。ST奥康法定代表人王振滔及高管王进权、翁衡被处以警告并罚款。这是上海证券交易所以对上市公司违规行为作出的公开谴责。

热点资讯 06.12
微软和谷歌等公司正在利用合成数据训练AI,解决数据荒问题

微软和谷歌等公司正在利用合成数据训练AI,解决数据荒问题

财联社5月12讯,合成数据成为人工智能聊天机器人的重要支撑,但如何获取高质量数据仍是一大挑战。科技公司正在寻找替代解决方案,即生成式人工智能,通过编程让AI系统自己创造出内容。

热点资讯 05.12
Facebook面临的隐私问题及尝试利用欧洲数据训练人工智能模型的进展

Facebook面临的隐私问题及尝试利用欧洲数据训练人工智能模型的进展

Meta宣布计划利用欧洲用户的隐私数据训练人工智能模型,但欧盟严格的数据隐私法则不允许。NOYB组织对此提出了投诉,要求其停止使用个人数据。

热点资讯 06.11
梅西发表歉意:原以为是休息日,因缺席训练被罚引发争议

梅西发表歉意:原以为是休息日,因缺席训练被罚引发争议

梅西通过社交媒体道歉,承认在缺席巴黎圣日耳曼足球俱乐部训练时的行为违反了球队规定。

热点资讯 04.21
金钟:美联储首次降息,中美经济可能有哪些波动?

金钟:美联储首次降息,中美经济可能有哪些波动?

美联储今年首次降息50基点引发市场热议,部分人质疑其应对经济不稳的措施,但也有市场将其视为降低资金成本的信号。不论何种解读,这一决定都将加大金融市场的波动性,带来潜在的风险。

热点资讯 09.19
中秋假期楼市交投平淡,二手房活跃度高

中秋假期楼市交投平淡,二手房活跃度高

衡6万一”的让利活动。此外,一些开发商也推出了购房优惠政策,如首付比例降低、优惠利率、赠品等。然而,无论是新房还是二手房,由于疫情的影响以及市场需求的变化,整体市场表现依然平淡。专家预测,随着九月底的临近,楼市政策有望迎来优化,四季度市场的成交量将有所回升。对于购房者来说,可以关注一下即将到来的购房优惠活动,以获取更多的购房优势。

热点资讯 09.19
揭秘低空经济新探索:应用场景及落地策略

揭秘低空经济新探索:应用场景及落地策略

2024年首次被写进政府工作报告的低空经济,近30个省份和城市的政府工作报告提出大力发展低空经济及通用航空。其中,长三角地区城际间低空航线正在密集开通,昆山到浦东的载客直升机航线仅需飞行不到半个小时。 从2小时缩短到半小时,苏州高新广场直航中心到南通仅需25分钟,无锡硕放机场仅需12分钟。同时,航空运动、空中旅游、飞行培训、应急救援等领域都具有巨大的发展潜力,有望成为低空经济的重要增长点。例如,长沙湘江新区的航空应急救援基地,能快速响应临近事故点开展应急救援任务。

热点资讯 09.19
洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

江南五虎在江浙地区崛起,占江苏白酒市场份额近40%,竞争日益激烈。 黄山归来,犹如一幅画卷,把古老的中国文化装点得独具魅力。

热点资讯 09.19
女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

深圳男子PPT揭露出轨事实,自称曾下跪哀求女友不要举报。

热点资讯 09.19
外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

9月18日,深圳日本人学校10岁学生遭男子刺伤,已被现场捕获。中方继续采取有效措施,保障在外中国人的安全。

热点资讯 09.19
挑战《黑神话》的强劲对手:打造3A级开放世界游戏引擎,却未知其神秘力量

挑战《黑神话》的强劲对手:打造3A级开放世界游戏引擎,却未知其神秘力量

随着《黑神话:悟空》的火热,国内玩家开始调侃欧美玩家的“女拳师”现象,国内一些工作室也试图利用男女话题来吸引眼球。最近一家被称为全女的GHG游戏工作室成立,并承诺将制作出完全由女性参与的3A级别开放世界游戏。然而,由于尚未完成游戏引擎的研发和成本控制,这款游戏可能会成为诈骗的一种手段。对此,我们建议大家保持理性判断,不要轻信不实信息,保护自己的权益不受侵犯。

热点资讯 09.19
大众关闭工厂,狼堡裁员,互联网巨头的严峻挑战与未来展望

大众关闭工厂,狼堡裁员,互联网巨头的严峻挑战与未来展望

沃尔夫斯堡面临前所未有的挑战:汽车电动化、智能化转型和竞争压力加剧导致德国这家百年历史的工业重镇面临倒闭风险。沃尔夫斯堡及其庞大的大众汽车集团总部象征着德国工业复兴,但随着欧洲最大汽车制造商宣布关闭本土工厂,并放弃工作保障承诺,这座城市的12万居民开始担忧未来。沃尔夫斯堡拥有超过4800万辆汽车的生产能力,而在中国汽车市场竞争加剧的影响下,该公司可能会遭受重大打击,需要大幅增加拨备以应对这一冲击。这个消息引发了全球汽车产业的关注。

热点资讯 09.19
罗峰全新造型发布,诺岚山危机,五大强者的降临:一位神秘人物的隐藏身份

罗峰全新造型发布,诺岚山危机,五大强者的降临:一位神秘人物的隐藏身份

米克、亚瑟和涅塔。在这五人当中,涅塔的名字最引人注目,因为他是一名黑帮老大,同时还是一个天才级别的战士。从他的实力来看,他是第五个出场的五大强者之一,绝对不容小觑。 另外,涅塔在预告片中并未完全展示出他的实力,只能猜测他的战斗力应该很强。这次出现在《吞噬星空》动漫中的涅塔,无疑会给观众带来更大的惊喜。 总之,从这次剧情来看,有很多看点,包括主角罗峰的新造型、五大超级强者的登场等,相信这部动漫会有更多的精彩内容等待着观众。

热点资讯 09.19
黎巴嫩爆炸引发猜测:台企生产寻呼机,源头调查仍在进行中

黎巴嫩爆炸引发猜测:台企生产寻呼机,源头调查仍在进行中

黎巴嫩真主党订购台产寻呼机爆炸,以色列事先破坏并伪装成自杀式袭击。

热点资讯 09.19