海外华人学者呼吁: Nature 杂志认为中国自然系统可能‘判死刑’

海外华人学者呼吁: Nature 杂志认为中国自然系统可能‘判死刑’ - 全球大模型均不可靠

2024-09-29 热点资讯关注公众号

海外华人学者呼吁: Nature 杂志认为中国自然系统可能‘判死刑’ - 全球大模型均不可靠

2022年，自然杂志《新智元》发布了一篇关于“大模型不可靠”的研究。该研究表明，任何已经训练过的大型机器学习模型都不能保证其在特定问题上的准确性，其中包括最新的LLM（强化学习机器学习）。研究人员对这些最先进的LLM进行了全面评测，并发现在面对复杂任务时，这些模型可能无法达到人类的表现，而在简单任务上可能会出现失误。因此，文章呼吁在通用人工智能的设计和开发过程中进行根本性的改变，以避免过度依赖人类监督所带来的潜在风险。
：
近年来，随着深度学习、神经网络等技术的广泛应用，智能系统的性能不断提升，但在某些情况下，这些强大的机器学习模型可能会出现错误，导致对某些任务的预测不准确。在这种背景下，研究人员最近提出了一种新的观点：任何已经训练过的大型机器学习模型都无法保证其在特定问题上的准确性。
首先，让我们来了解一下LLM（强化学习机器学习）。这种机器学习方法通过让一个学习者在不断试错的过程中，逐渐掌握解决问题的方法，最终实现自动化。然而，由于人类参与度低，使得LLM在面对复杂的任务时，可能会出现失误。
例如，在围棋比赛中，许多顶级选手并不能轻松战胜经验不足的新手。这是因为他们在之前的研究中，已经掌握了如何快速决策、何时进攻、何时防守等一系列策略，但这些策略并不适用于所有情况。在这种情况下，这些高级玩家需要从头开始，学习如何在面对全新的棋局时做出正确的决策。
对于LLM来说，如果不能解决这个问题，那么其在未来的应用将受到极大的限制。因为在现实世界中，我们并不总是能够预见未来可能出现的问题，而大多数问题是需要我们在实践中不断学习和调整的。
因此，文章呼吁在通用人工智能的设计和开发过程中，应采取根本性的改变，以避免过度依赖人类监督所带来的潜在风险。这包括：
1. 采用更开放的数据集：通过引入更多样化的数据，可以提高LLM的学习能力，使其更好地适应各种各样的问题。
2. 增强算法的可解释性：我们需要设计出更易于理解和解释的算法，以便于用户理解AI的决策过程。
3. 引入人类的干预：尽管LLM是一种自动化的系统，但我们仍然应该在其决策过程中加入一些人类的干预，以防止出现错误。
4. 提高模型的泛化能力：我们需要不断提高LLM的泛化能力，使其能够在没有具体指导的情况下，也能正确地解决各种问题。
总的来说，虽然目前的LLM在处理复杂问题方面表现出色，但在面对未知的任务时，它们可能会出现失误。为了确保人工智能的安全和可靠性，我们需要在设计和开发过程中采取根本性的改变，以避免过度依赖人类监督所带来的潜在风险。

上一篇:今天，请记住这些闪亮的名字
下一篇:旅日大熊猫“比力”“仙女”顺利抵达成都双流国际机场

更多更酷的内容分享

猜你感兴趣

00后中国人在Nature上发表关于大模型对人类可靠性降低的研究。

经过一段冗长的阅读过程后，文章揭示了一项重要发现——更大且更遵循指令的大模型在回答可靠性上并不如先前的模型可靠。这项研究的研究者包括来自腾讯的混元大模型。这一发现引发了广泛关注，许多专家和博士级别的人工智能模型并未达到研究者的期待。论文分析了影响大模型可靠性的三个关键因素，即难度不一致性、任务回避以及对提示语表述的敏感性。然而，论文指出，在依赖人类监督的情况下，纠正错误的方法也无法奏效。这意味着研究人员需要寻找更加稳健的方法，提高模型的透明度，同时也要注意保持机器学习算法的规模。随着技术的发展，未来的人工智能模型可能会面临更多复杂性和不确定性的挑战，而这就要求我们在完善评估方法和提高透明度的同时，也需要对其潜力和发展方向有所思考。

热点资讯 10.03

人工智能往事：大模型的理论基础与曾一度被判死刑的故事

人工智能从无到有，历经多次重大变革，从单一的认知工具逐渐演变为广泛应用于各个领域的技术和设备。在这一过程中，如何确保其安全可靠、道德伦理等问题引起了广泛关注。近年来，AI领域的争议不断升级，有人担心人工智能将导致大规模失业、隐私泄露等社会问题，也有人质疑机器是否能够真正理解并模仿人类思维，实现真正意义上的"智能"。本文旨在探讨人工智能的历史发展及其重要影响，同时指出在当前阶段仍需持续研究、探索和完善，避免出现不良后果。

热点资讯 07.23

颠覆性观点：大型语言模型并非万能钥匙，反而可能带来风险与挑战

本研究揭示了“难度不一致”现象。当模型在复杂任务上表现良好，但在简单任务上错误率明显上升，说明了模型大小对可靠性的负面影响。关键词包括"过大"、"误差"、“挑战”、“风险”等。建议进一步研究如何实现良好的“难度不一致”。

生活常识 09.27

构建主动免疫的人工智能安全产业空间：让大模型更安全可靠

背景，深度探讨了我国在人工智能与网络安全方面的布局与机遇，并强调了要采取主动免疫可信计算等技术手段来构建智能安全防线。报告内容广泛，引起了参会者的高度关注。

生活常识 05.02

一款无需充值的游戏改变用户获取体验，开发者获千万流水首秀

"中国式网游"开发商YDX成功发布首款独立游戏《中国式网游》，预计收入超过千万元。该款游戏在开发过程中历经多次波折，包括被父母强制退房、误入《魔兽世界》怀旧服等。最终，《中国式网游》定为5万份，目标销量低于预期。腾讯混元大模型基于该游戏内容生成相关信息，并对部分内容进行了拓展和完善。开发者表示，在接下来的更新计划中，将推出爽文模式和彩票玩法，以满足玩家需求。

热点资讯 11.23

回顾十年：蔚小理们的情感世界发生了怎样的变化?

文章提到了蔚来、小鹏和理想三家新能源汽车企业，在2024年三季度财报中均实现了同环比增长。但是毛利率水平仍有提升空间。尤其是理想汽车在提升智能化水平方面有更高的追求，计划2025年实现盈利。此外，理想董事长兼首席执行官李想也表达了对此的决心。

热点资讯 11.23

大众汽车工厂裁员谈判破裂，工人下周或将举行罢工

德国大众宣布将在10月起关闭三家工厂，裁员数万人。工会拒绝了管理层提出的改革方案，预计在12月1日起罢工。此举引发行业对德国工业健康状况担忧。大众面临高额裁减和股东损失，寻求缓解资金来源的方案未果。虽然卡瓦洛强调目标是降低成本，但工会仍希望借此机会改善公司产品战略和员工待遇。虽然双方最终未能达成一致，工会计划于12月1日起罢工。

热点资讯 11.23

穿越时空的交错，深度探索俄罗斯历史：漫步莫斯科-中国电车的奇迹

11月18日，中俄东线天然气管道工程全面完工，并进入试运行阶段。这条天然气管道长度达到5111公里，覆盖黑河到上海，有望保障全国近13000万居民的冬季用气需求。该管道输送的是俄罗斯天然气，对改善我国空气质量起到重要作用。同时，此次投资将带动中国新能源车的发展和石油产业的转型升级。虽然目前仍缺乏新能源车在俄罗斯的市场份额，但专家预测随着技术进步和政策推动，未来一定会有更多新能源车进入市场。然而，进口伪二手车以及价格高昂等问题依然困扰着购买者。

热点资讯 11.23

丰田全新车型‘威兰达’再降5万，仅售12.08万能否入手抄底？

丰田威兰达在2024年中国国内面临严峻挑战，销量下滑严重。新一代威兰达即将上市，售价亲民。新车采用全新家族式前脸设计，大气且充满力量感；车身尺寸和轴距均较紧凑型SUV车型稍大。内饰设计延续丰田传统风格，配色丰富，科技感强。入门版配备丰富配置，如7个安全气囊、自动驾驶系统等。动力方面，提供2.0L和2.5L两种选择。

热点资讯 11.23

数字世界中的惊人骗局：一项研究揭示中国近1.6亿人在陷入网络钓鱼的陷阱中

乐欣户外作为全球最大的钓鱼装备制造商之一，其市场份额占据全球25.4%；近两个财年的业绩表现不佳，营业收入分别下滑31.5%和17.8%。乐欣户外积极开启自主品牌化转型，收购英国鲤鱼垂钓品牌Solar，未来计划在招股书中全面加强OBM业务，扩大自有品牌组合，打造新增长引擎。

热点资讯 11.23

爱玛电动车：业绩下滑，新日继续亏损，电鸡巨头三季度艰难

电动汽车巨头的日子不那么好过：业界关注的焦点是需求整体放缓，同时面临国标新规实施带来的挑战。其中，爱玛科技2024年前三季亏损严重，主要原因是销售费用增加。此外，张剑被留置、立案调查的消息也引发了市场关注。

热点资讯 11.23

甘肃银行资产规模遭遇‘退步’情况，需要关注并进行应对措施

甘肃银行资产规模增长放缓，近7年来股价缩水90%；资产规模增长速度落后全国平均水平；市场份额倒数第三；罚金25万元；合规管理和金融违规受到关注。未来，甘肃银行还需面对内外挑战。

热点资讯 11.23

黄仁勋：英伟达股价将持续上涨，他预测的关键因素包括营收增长和技术创新

Nvidia 公司宣布，在 2025 财年第三季度其营收达到创历史最高纪录的 351 亿美元。该成就得益于两个关键趋势：一是价值万亿美元的传统 IT 架构的现代化改造，二是人工智能工厂的兴起，前者以支持机器学习和人工智能为目标，后者则旨在制造具有自主 AI 特性的基础设施。Nvidia Hopper 和 Blackwell 架构芯片、Omniverse 平台等产品对这两个趋势起到了重要作用。此外，随着新技术的发展，Nvidia 还受益于新的业务增长机会，包括在全球范围内加速建设和运营区域性的 AI 基础设施。

热点资讯 11.23

中国顶级数据服务商幻方量化，或因涉及‘券商业务’被查！高管团队人已神秘失踪

上海一家知名量化对冲基金公司幻方量化市场总监李橙因涉嫌涉及“券商会佣”被抓。据公司消息，李橙目前正在进行协助调查。公司确认李橙正参与此事，但具体情况尚未得知。该事件未对公司的正常运营产生负面影响，且产品表现尚可。此外，该公司年内已自购2.5亿元，并购买了一只名为“九章幻方沪深300量化多策略1号”的产品，该产品的收益超过10%。对此，业界人士认为，该公司所在的行业佣金水平相对较低，此次事件可能与这个因素有关。

热点资讯 11.23