·从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。
·算力是门槛。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”
沈向洋
“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”3月23日,2024全球开发者先锋大会在上海开幕,美国国家工程院外籍院士沈向洋在《大模型时代的机遇和挑战》的演讲中分享了对大模型的思考。他表示,人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。物理学是Theory of Everything,而深度学习就是Theory of Anything。
过去这几年,大模型的发展风起云涌,开源社区的活力和生命力非常强大。沈向洋说,文生图使得一言胜千图,一个简单的提示就可以做出了不起的图片。ChatGPT使得一句顶一万句,提出一个问题可以得到很多答案。Sora的出现使得输入几句提示就能产生大片效果。
这三件事让人们产生一个个焦虑,未来开发者的机会在哪里?沈向洋认为是多模态,多模态是通用人工智能的必经之路。以OpenAI代表的技术实际上是对不同模态的理解,“OpenAI的内部有两套体系,一是从文生图延展到文生视频,走的是Stable Diffusion路线,二是文生文,走的是Transformer路线。到现在为止,这两条线路还没完全统一起来,相信接下来中国的开发者、世界的开发者,很快会有这方面的突破。”
沈向洋分享了关于大模型的五方面思考。
第一,大模型的到来,强迫人类重新思考人机关系。“我们受到的冲击,到底有多少是机器智能的发展,有多少是人机交互的震撼。”他认为,不管是什么技术,最终目的是帮助人更好运用机器,不忘初心。
第二,大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数,基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型,利用个性化参数,结合云和端,这是非常有意义的。”
第三,算力是门槛。影响算力的两大因素是模型大小和数据规模,随着参数增加,对算力的需求几乎是几何级的。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”
第四,AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击,带来一本正经胡说八道、深度伪造等伦理问题,很多国家开始立法,这需要共同推动治理、向前发展。
第五,智能的本质。人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”沈向洋表示,“很多人相信scaling law(规模法则),但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”
结论:本文讨论了深度学习和理论物理学之间的区别,并提出了对于大模型发展的一些思考和建议。认为,大模型的发展给人们带来了许多机会,但也带来了一些挑战,比如如何理解和处理与人类价值观和社会规范冲突的问题。
建议:
1. 对于未来的科技发展,我们应该保持开放的心态,接受新事物,同时也要认识到新技术带来的挑战和风险。
2. 在教育和人才培养方面,应该注重培养学生的创新思维和批判性思维,以应对未来科技发展中的各种不确定性。
3. 在政策制定和法规制定方面,应该建立完善的法律法规框架,保护消费者的权益,同时也应鼓励技术创新,促进科技健康发展。
4. 科技应当服务于社会,而不是替代社会,因此,我们需要引导科技发展方向,使之更好地服务人民的生活和社会的进步。
5. 应该加强对新兴科技的研究和理解,以便更好地指导科技发展,同时避免新的科技成果可能带来的社会问题。