自2022年11月底openAI首次公测ChatGPT以来,人工智能(AI)迎来新一波浪潮,AI产业飞速发展。
“AI在这段时间的发展可以用‘波澜壮阔’来形容。在此前的很长一段时间里,人们其实对AI持一种保留甚至怀疑的态度,直到ChatGPT发布后,人们才发现人工智能真的能够成为一种生产力。”华东师范大学计算机学院副研究员、前华为荣耀Magic手机首席架构师董道国近日对第一财经表示,“这种生产力仍然局限在小范围内,还没有真正颠覆各行各业,但至少这个趋势已经出现了,目前已是暗潮涌动。”
以下为部分交流:
第一财经:目前国内的大模型能否对标OpenAI的ChatGPT?
董道国:国内大模型的发展蒸蒸日上,但距离OpenAI发布的GPT4等领先大模型,国内还有很长的路要走,还需要更加努力,特别是那种有资金、有实力的大厂,应该再沉下心来继续努力,至少到目前为止这种差距还是比较大的。
第一财经:这个差距具体体现在哪里?
董道国:这是综合性的表现,大模型不仅仅是算法,还要考虑训练数据、算力以及工程化能力。如果仅仅聚焦于对话模型,国内大模型对中文对话的支持还是可以的,但如果把大模型作为AI Agent(人工智能体)的“大脑”作用去发挥的时候,我们的大模型在推理能力上距离ChatGPT还有蛮远的距离,也就是说仅仅看对话模型其实表现也还可以,但是将AI作为一个生产力,国内大模型还有一定差距。
第一财经:作为AI Agent和作为对话的大模型,它们的主要区别是什么?
董道国:基于大模型的对话应用是给普通人用的,面向C端,利用网页的形式和大模型做一些对话沟通;AI Agent作为一种“大脑”,本质上我们不仅是用它里边的知识,更多地是用它的推理能力去做决策,调用工具和外部知识来完成复杂的任务。
第一财经:国内的大模型未来会成为一个超级 APP 吗?
董道国:会有这样一种趋势。包括一些手机公司做AI终端的目的,就是希望手机继续能够承担所有APP入口。国内包括百度、阿里在发力的大模型,其实也是希望能够承担超级APP的那种角色。
我相信未来随着AI的发展,手机所有APP的形式一定会发生根本性变化。目前APP的形式仍然偏规则式,并不人性化。规则式意味着没有人机对话能力,我们只能根据APP设定的布局来使用,按相应的按键,得到APP的回应,这种模式是反人性的。人最希望直接表达自己的需求而得到满足,而不是点来点去。比如我喊出苹果手机的Siri,让它给我定一个闹钟,它就会直接给我定好。未来随着人工智能的发展,这种功能的适用范围会更广阔,使用起来也会更加便捷。
第一财经:目前各个领域,比如医疗、金融领域都在研发自己的垂域大模型,一些企业也会在一些开源大模型基础之上,结合自己的行业经验和数据积累,推出自己领域的大模型。这给我们一种感觉,大模型的技术门槛是不是没有那么高?
董道国:其实如果有私域的数据,并且数据质量比较高的话,基于现有的一些基座大模型去训练自己的私域大模型,我认为技术上并不是很难。但是训练之后的效果到底怎么样,其实还是要打一个问号,要去看具体的工程方法,训练数据集如何构建需要一定的经验积累。
我一直持有一个观点,当一个企业或者一个行业真的去训练自己的私域大模型的时候,还是需要综合考虑一下,到底是要自己去微调一个大模型,还是用现有大模型去构建一个面向自己行业应用的智能体,要看哪一种方案更符合实际需求。现在很多人其实把RAG(Retrieval Augmented Generation,检索增强生成)和训练私域大模型混淆,我其实更倾向于用RAG 的模式去构建面向某个行业的应用场景。
第一财经:两者的主要区别在哪里?
董道国:微调大模型其实就是在改变大模型的参数,也就是把知识输入到这个大模型里面去。而RAG仅仅用的是大模型的推理能力,而知识源于企业内部自己的数据和知识库。换句话说,第一种模式是把知识灌到大模型里,这有一个缺点:大模型仍然有可能输出它不确定的知识或不清楚的信息,从而造成一些幻觉,导致真伪难辨。但是RAG模式通常没使用大模型里的知识,只用了大模型自然语言的理解和推理能力,知识通过检索知识库后送给大模型,让它来根据限定的知识去生成。
第一财经:L0通用大模型和L1垂域大模型,它们目前的商业化进程如何?未来什么样的大模型更容易变现?
董道国:其实如果资金实力比较雄厚的话,那么做L0通用大模型是一件值得去鼓励的事情,但面临应用落地的问题。通用大模型投入很高,变现路径比较长,所以需要持续的资金支持。国家需要这样的L0级大模型出现,所以我觉得这件事情需要由那些有实力的大厂去持续投入。而在一个行业应用里,我认为垂域大模型可能更容易发挥实质性作用。
我倒不建议专门成立一家公司去做垂域大模型,而是应该由已经有明确应用场景的企业,去利用这种通用大模型来优化业务流程,能够马上发挥作用,这种情况更容易成功。如果一个创业团队自己去想象一个行业场景,然后去训练垂类大模型,再销售出去,压力会非常大。所以我一直觉得不应该鼓励过多的创业公司投入到思考应用场景上,应用场景去找技术会比较好。
探索人工智能产业的新一轮浪潮:ChatGPT的兴起与AI大模型的崛起
自从2022年11月OpenAI发布其先进的大型预训练语言模型ChatGPT以来,人工智能(AI)产业迎来了新一轮的蓬勃发展。从起初的保守质疑,到现在的全球瞩目,AI的影响力已经超越了传统的工业领域,影响到了几乎所有行业的日常运营和创新实践。
首先,让我们回顾一下过去的一年,ChatGPT及其相关应用的迅速崛起令人印象深刻。作为首个使用深度学习技术进行大规模语料库训练的人工智能模型,ChatGPT以其强大的文本理解和生成能力,引发了人们的广泛关注和讨论。然而,与当前顶级的OpenAI GPT-4相比,中国及国际AI大企业在面对这一新机遇时仍存在较大差距。
在国内,大模型的研发仍在不断推进,尽管这一过程曲折而又充满挑战。相较于国外领先企业的深思熟虑和长期研发投入,中国的 AI 大模型还处于初级阶段。与ChatGPT相比,国内的大模型在以下几方面表现出明显差距:
1. 技术局限性:国内大模型在自然语言处理(NLP)领域的整体水平仍然相对较低,尤其是在对于中文对话的支持方面。虽然已有部分高校和研究机构针对中文对话展开研究,但由于缺乏充足的数据集和计算资源,这些模型往往只能提供基本的对话片段回复,无法实现更深入的自然语言理解或精准的语义分析。
2. 计算力与工程化能力:AI大模型的核心在于其大规模的训练数据集、高效的计算能力和丰富多样的应用开发环境。相比之下,国内大模型所依赖的数据集往往局限于特定的教育、科研机构,且大多数并未包含大量的商业文本数据或大量真实用户行为样本。此外,大部分国产大模型都依赖于人工调优和定制,这使得其在提升执行效率和准确性方面较ChatGPT有显著劣势。
3. 用户体验与交互设计:AI大模型的用户体验和交互设计直接影响着其在现实生活中的应用场景和用户接受度。现有的AI大模型往往需要依赖语音识别、语音合成等底层技术才能实现简单的自然语言交互,且过度依赖黑盒模型可能导致对话结果难以理解,难以捕捉用户的个性化需求。同时,AI大模型在理解复杂情绪、意图和上下文等方面的能力仍有待提高,这对于市场推广和用户满意度来说是一大挑战。
展望未来,随着ChatGPT的热度逐渐消退,AI大模型在行业应用领域的潜力将进一步显现。目前来看,以下几个方面是中国及国际AI大企在未来加大投入并推动大模型商业化的关键驱动因素:
1. 数据驱动:大量高质量的数据是AI大模型训练的重要条件,尤其在诸如医疗、金融、电商等应用场景中,AI大模型需要能够理解和模拟真实世界的复杂互动关系。因此,针对特定行业的特征数据采集和标注工作将是推动AI大模型走向商业化的一个重要环节。
2. 资金投入与人才支持:大型企业应有足够的资金和技术资源来支持AI大模型的研究和开发,特别是在大模型的跨领域协同研发、大规模训练与优化、应用场景落地等方面。同时,引进和培养一批具有深厚技术功底和广泛商业理解的专业人才是推动AI大模型产业化的重要途径。
3. 市场推广与品牌塑造:在全球化的背景下,AI大模型不仅需要在技术研发上取得突破,更需积极借助市场力量和品牌效应提升自身的知名度和影响力。企业可以通过联合优质合作伙伴、举办发布会、打造品牌合作等方式,积极吸引各行业用户的关注和认可,进一步打开AI大模型的应用边界。
4. 法规与政策支持:各国政府应出台相关的法规和政策,促进AI大模型在不同行业领域的合理合规使用,为大模型的研发、应用和商业化提供必要的法律保障。此外,扶持初创企业和中小企业,通过优惠政策、资金扶持等方式降低AI大模型进入市场的门槛,进一步激发大模型在各领域的创新活力。
总的来说,ChatGPT的成功既是人工智能技术创新的巨大里程碑,也是AI产业融合发展的历史转折点。国内外大企正以全新的视角和策略,共同推动AI大模型的自主研发、规模化应用和商业化进程,为人类社会的智慧进步和社会经济的创新发展注入新的动力。无论是在基础技术、行业应用,还是从市场需求、市场生态,甚至是市场竞争格局上,都将看到AI大模型深刻重塑与革新所带来的重要变革。随着这项先进技术愈发成熟,期待在不久的将来,AI大模型能在更多的行业中发挥更大的价值,为人类的生活质量和经济社会发展做出更大贡献。