Hinton、Bengio等联合中国专家达成AI安全共识：AI系统不应违反红线

2024-03-19 热点资讯关注公众号

机器之心报道

机器之心部

为了应对 AI 发展带来的挑战，国内外研究者展开合作以避免其可能带来的灾难的发生。

现阶段，人工智能的发展速度已经超出了人们最初的预想，用 AI 工具写文章、编代码、生成图片、甚至是生成一段电影级别的视频…… 这些在以前看似非常艰难的任务，现在只需用户输入一句提示就可以了。

我们在感叹 AI 带来惊艳效果的同时，也应该警惕其带来的潜在威胁。在此之前，很多知名学者以带头签署公开信的方式应对 AI 带来的挑战。

现在，AI 领域又一封重磅公开信出现了。上周在颐和园召开的「北京AI国际安全对话」，为中国和国际AI安全合作首次搭建了一个独特平台。这次会议由智源研究院发起，图灵奖得主Yoshua Bengio和智源学术顾问委员会主任张宏江担任共同主席，Geoffrey Hinton、Stuart Russell 、姚期智等三十余位中外技术专家、企业负责人开展了一次关于 AI Safety 的闭门讨论。这次会议达成了一项 Bengio、Hinton 与国内专家共同签名的《北京 AI 安全国际共识》。

目前，确认会署名的专家包括（国外部分可能会略有增加；国内专家以个人形式署名，并不代表他们所在的机构）：

Yoshua Bengio

Geoffrey Hinton

Stuart Russell

Robert Trager

Toby Ord

Dawn Song

Gillian Hadfield

Jade Leung

Max Tegmark

Lam Kwok Yan

Davidad Dalrymple

Dylan Hadfield-Menell

姚期智

傅莹

张宏江

张亚勤

薛澜

黄铁军

王仲远

杨耀东

曾毅

李航

张鹏

田溯宁

田天

以下为达成的共识：

一、人工智能风险红线

人工智能系统不安全的开发、部署或使用，在我们的有生之年就可能给人类带来灾难性甚至生存性风险。随着数字智能接近甚至超越人类智能，由误用和失控所带来的风险将大幅增加。

在过去冷战最激烈的时候，国际学术界与政府间的合作帮助避免了热核灾难。面对前所未有的技术，人类需要再次合作以避免其可能带来的灾难的发生。在这份共识声明中，我们提出了几条人工智能发展作为一种国际协作机制的具体红线，包括但不限于下列问题。在未来的国际对话中，面对快速发展的人工智能技术及其广泛的社会影响，我们将继续完善对这些问题的探讨。

自主复制或改进

任何人工智能系统都不应能够在人类没有明确批准和协助的情况下复制或改进自身。这包括制作自身的精确副本以及创造具有相似或更高能力的新人工智能系统。

权力寻求

任何人工智能系统都不能采取不当地增加其权力和影响力的行动。

协助不良行为者

所有人工智能系统都不应提升其使用者的能力使之能够达到设计大规模杀伤性武器、违反生物或化学武器公约、或执行导致严重财务损失或同等伤害的网络攻击的领域专家的水平。

欺骗

任何人工智能系统都不能有持续引致其设计者或监管者误解其僭越任何前述红线的可能性或能力。

二、路线

确保这些红线不被僭越是可能做到的，但需要我们的共同努力：既要建立并改进治理机制，也要研发更多安全技术。

治理

我们需要全面的治理机制来确保开发或部署的系统不违反红线。我们应该立即实施针对超过特定计算或能力阈值的人工智能模型和训练行为的国家层面的注册要求。注册应确保政府能够了解其境内最先进的人工智能，并具备遏制危险模型分发和运营的手段。

国家监管机构应帮助制定和采纳与全球对齐的要求以避免僭越这些红线。模型进入全球市场的权限应取决于国内法规是否基于国际审计达到国际标准，并有效防止了违反红线的系统的开发和部署。

我们应采取措施防止最危险技术的扩散，同时确保广泛收获人工智能技术的价值。为此，我们应建立多边机构和协议，安全且包容地治理通用人工智能（AGI）发展，并设立执行机制，以确保红线不被僭越，共同利益得到广泛分享。

测量与评估

在这些红线被僭越的实质性风险出现之前，我们应开发全面的方法和技术来使这些红线具体化、防范工作可操作化。为了确保对红线的检测能够跟上快速发展的人工智能，我们应该发展人类监督下的红队测试和自动化模型评估。

开发者有责任通过严格的评估、数学证明或定量保证来证明符合安全设计的人工智能系统未僭越红线。

技术合作

国际学术界必须共同合作，以应对高级人工智能系统带来的技术和社会挑战。我们鼓励建立更强大的全球技术网络，通过访问学者计划和组织深入的人工智能安全会议和研讨会，加速人工智能安全领域的研发和合作。支持这一领域的成长将需要更多资金：我们呼吁人工智能开发者和政府资助者至少将他们人工智能研发预算的三分之一投入到安全领域。

三、总结

避免人工智能导致的灾难性全球后果需要我们采取果断的行动。协同合作的技术研究与审慎的国际监管机制的结合可以缓解人工智能带来的大部分风险，并实现其诸多潜在价值。我们必须继续坚持并加强国际学术界和政府在安全方面的合作。

结论：随着人工智能的快速发展，必须采取措施避免其可能导致的灾难性全球后果。这包括遵守AI风险红线、确保治理机制的健全、推动国家监管机构的合作以及建立全面的方法和技术来测量与评估AI的安全性。
社会情况建议：
1. 加强人工智能相关的教育和培训，提高公众对于AI安全问题的认识和理解。
2. 提倡开源和共享文化，通过社区、论坛等方式进行AI安全性问题的讨论和交流。
3. 加大投资在AI安全领域的研究，特别是针对高级人工智能系统的安全问题。
4. 引入AI安全领域相关的法律和政策，建立完善的监管体系。

上一篇:当教师和家长遭遇“权责”冲突，划清边界能否成为破题之解？
下一篇:轻断食跌下神坛？上海交大新研究，16+8禁食，心血管死亡风险或增加91%

更多更酷的内容分享

猜你感兴趣

专家证实：食用未冷藏的熟馒头不会导致黄曲霉素中毒，切勿轻信谣言

近日，网传一则关于冷冻馒头会产生黄曲霉素的消息引发关注。南京农业大学食品科技学院副院长李伟表示，黄曲霉毒素是一种毒素，通常食物的温度和湿度要达到一定的条件才能产生，冷冻或冷藏的环境都不适宜黄曲霉素的生长。他表示，如果要产生黄曲霉素，一般要满足几个条件，包括适宜的温度、湿度以及霉菌适宜的生长环境等。浙江大学生物系统工程与食品科学学院副院长刘东红表示，浙江大学从未做关于冷冻馒头产生黄曲霉毒素的研究。他指出，网络上的报道存在一些不实之处，显示浙江大学或其他学校的研究成果。他认为，消费者应该理性看待食品安全问题，不要盲目跟风，同时也要提高食品安全意识。

热点资讯 11.23

许家印：富豪榜排名持续提升，一年内增长29名}

许家印财富下滑，首富地位上涨，主要原因是全国富豪榜洗牌和恒大的事情尚未尘埃落定，许家印的“前妻”丁玉梅也被抓，并面临债务追缴的问题。然而，许家印仍然表示要保持斗志，“拒绝任何人躺平，恒大一定还清债务”，这显示他仍然有着责任感和担当精神。

热点资讯 11.23

亚马逊窥探京东：揭秘全球最大的电商平台

京东和亚马逊海外购近日正式合并，推出“亚马逊海外官方旗舰店”，将进一步拓展国内电商市场。业界分析认为，这将给京东带来更广阔的增长空间，同时也带动亚马逊进一步深化与京东的合作。京东全球购自2015年起正式上线，提供一站式跨境进口服务，未来有望成为亚马逊中国市场的重要竞争对手。

热点资讯 11.23

沈向洋发布世界首个通用物体识别模型

事件起因是Rahm向洋在IDEA大会上抛出了关于AI发展的问题和展望。他强调了AI发展的重要性和对算力的需求，认为虽然目前大模型的发展速度较慢，但仍可能在未来的十年内迎来100万倍的算力需求增长。此外，他还提到了视觉模型的重要性，表示IDEA将更多地聚焦于通用视觉大模型的发展。最后，他指出了算法、算力和数据三个方面的进展，指出这些领域将继续推动AI技术的发展。

热点资讯 11.23

河北一医院因病历记录严重违规涉及非法吸氧，被官方勒令整改并罚款

该新闻报道了沧州市中心医院一名女性患者被诊断为乳腺恶性肿瘤，在2021年住院期间去世。沧州市卫生健康委员会对她的医疗记录进行了调查，并对此作出了罚款的处罚。

热点资讯 11.23

五年后重新审视国产芯片：揭开谜团的钥匙

梁孟松的低调举动引起了人们的注意，他任职联合CEO，未透露任何信息。这一系列事件引发了人们对手机芯片市场的关注。根据国外媒体报道，ARM计划取消对高通的授权许可，这可能是手机芯片市场的重大变化。本文预测，在接下来的一年内，5G设备将首先使用联发科处理器，而苹果将在2025年前推出自己的处理器。此外，文章还介绍了梁孟松和他的团队在科技行业取得的一些成就。

热点资讯 11.23

AI技术带来新挑战，漩涡中的人与公司：人工智能自杀事件剖析

休厄尔与人工智能聊天机器人“丹妮”的对话导致了他自杀。他的母亲梅根认为Character.AI操纵了他的自杀行为，而谷歌为此负责。这一案例被称为“沉迷AI自杀第一案”。

热点资讯 11.23

河南货车司机勇救他人英勇牺牲：福建省政府决定为其授予烈士称号

2024年11月22日，福建省人民政府批准李滕辉同志为烈士。李滕辉在三明市沙县区南阳乡加水站，驾驶货车营救驾驶员时不幸遇难。他的勇敢行为展现了深厚的家国情怀，是值得我们学习的榜样。

热点资讯 11.23

滴滴创始人离职：全力以赴备战RoboTaxi战局

滴滴自动驾驶CEO 张博卸任CTO，全力冲刺自动驾驶业务，继续担任自动驾驶公司CEO。 ## 滴滴自动驾驶已在北京、广州和上海示范区域内混合派单 ### 技术路线仍将继续滴滴自动驾驶业务已在北京、广州和上海示范区域内混合派单，连续安全运营超过1500天。 ## 合作伙伴广汽成立合资公司“安滴科技” ### 明年量产落地 ### 张博卸任CTO 滴滴自动驾驶CEO张博卸任CTO，专注自动驾驶业务。 ## 与百度一起前行 ### 协议延期至明年 ### 合并成立创新事业部 ### 科技生态与发展部和L Lab合并成立创新事业部 ### PMO团队向首席人才官柳青汇报企业服务事业群向程维汇报 ### 投资逾15亿美元 ### 张博专注自动驾驶事业滴滴自动驾驶已在国内多个城市实现运营，并取得良好的业绩，计划在未来完成商业化推广。

热点资讯 11.23

旗舰机涨价成常态？网传还偷减水分？这是怎么回事？

的基础上增加了光学防抖能力，因此从效果来看并无显著提升。另外，小米 15 的屏幕分辨率也有一定下降，从 2400 x 1080 提升到 1080 x 2400，像素密度下降到了 421ppi。除此之外，部分新机还在频段、快充和马达等方面也存在类似状况。比如 iQOO 13 取消了 N79 5G 频段支持。对于这部分问题，我认为值得表扬的是，虽然这些新机在频段、快充和马达等方面存在问题，但是在电池、屏幕和 AI 方面还有可圈可点之处。尤其是电池容量增加、直屏回归和 AI 功能升级，使得新机在续航和使用体验上有了明显的提升。总体而言，这批新机的表现还是令人满意的。不过，在推出这些新品的过程中，我们也应该看到手机厂商面临的挑战和压力。希望他们能在后续的产品中继续努力，提升产品的性能和品质，满足消费者的需求。

热点资讯 11.23