·面向未来的通用人工智能,有两条发展路线,一是延续大模型路线,二是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。
·未来的创新将不再是某一个环节的简单创新,大模型创新涉及芯片、互联、框架、数据、模型、评测、部署等环节,可多环节协同、体系化创新,实现全链条优化,弥补单环节劣势。
上海人工智能实验室主任助理、领军科学家乔宇。
“我们正处于专用智能时代到通用智能时代的关键阶段。”3月22日,在2024年上海市产业技术创新大会上,上海人工智能实验室主任助理、领军科学家乔宇表示,面向未来的通用人工智能,有两条发展路线,一是延续大模型路线,用更大的算力扩大模型规模,拓宽能力边界,向产业渗透;二是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。这两条技术路选并非孤立和互相替代的,而是要通过探索新的技术路线解决大模型现有路线中的固有问题。
乔宇表示,2010年左右的深度学习方法驱动了一轮人工智能浪潮。最初十年,人工智能行业针对不同任务开发专用小模型。“那时候大部分研发由应用问题驱动,针对不同问题收集数据、训练模型,所以是分散式、多团队的研发。”
到2020年左右,Transformer+大数据+自监督学习的大模型路线使得智能涌现,一个模型可以应对多种任务。在大模型时代,OpenAI找到了“大工程+大创新”的道路,工业化集中研发才得以产生ChatGPT、GPT-4。
面向未来的通用人工智能,他认为有两条发展路线。
一是延续大模型路线,用更大的算力扩大模型规模,拓宽能力边界,向产业渗透,模型也从语言大模型向多模态大模型、具身大模型的方向发展。多模态大模型是现在的竞争热点,未来的大模型要能和物理世界交流,完成更复杂的任务,所以具身大模型是重要发展方向。
但单纯扩大规模,存在幻觉、效率、可信、安全等瓶颈,“现在让一个大模型做一个奥数题和计算2+2这样简单的算术题,需要的运算量、运算次数是一样的。所以,我们能否把大模型做得更安全、更高效,更好解决现在存在的一些瓶颈?”
这就涉及到了第二条新技术路线的探索,要探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。乔宇表示,基于知识、符号、推理的方法,可解释性和安全性非常强,把这些方法结合起来形成更强大的功能,是未来AI发展的重要趋势之一。
这两条技术路选并非孤立和互相替代的,乔宇认为,要通过探索新的技术路线解决大模型现有路线中的固有问题。与此同时,未来的创新将不再是某一个环节的简单创新,大模型创新涉及芯片、互联、框架、数据、模型、评测、部署等多个环节,可多环节协同、体系化创新,实现全链条优化,弥补单环节劣势。“大工程+创新链+产业链”,这种融合式的创新、与知名高校合作,是未来更重要的趋势。
当前,中国大模型发展面临技术和生态的双重挑战。上海拥有金融、城市、制造等丰富的B端场景,他建议联合领军企业研发垂类模型,加快构建开源生态反馈机制,打造大模型伦理安全评测体系,促进健康发展和规范应用。
结论:
面对未来的通用人工智能,无论是坚持延续大模型路线还是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径,都面临着许多挑战。然而,无论选择哪一条道路,都需要我们积极寻求新的解决方案,利用现有的技术资源进行有效的协同创新。
建议:
1. 强化大模型与新兴技术的融合,例如使用知识计算和符号推理方法解决大模型现有路线中的固有问题,同时加强芯片、互联、框架、数据、模型、评测、部署等环节的合作,实现全链条优化。
2. 加快构建开源生态反馈机制,以鼓励更多企业和机构参与到大模型的发展中来,推动大模型的健康发展和规范应用。
3. 与知名高校合作,共同研发垂类模型,并尽快构建开源生态反馈机制,以此促进大模型伦理安全评测体系的建设,确保大模型的安全、可靠和高效运行。