华东师范大学计算机学院副研究员董道国：大模型的应用驱动：构建高效的场景找技术，引领数字化生产的新潮流

2024-03-28 热点资讯关注公众号

自2022年11月底openAI首次公测ChatGPT以来，人工智能（AI）迎来新一波浪潮，AI产业飞速发展。

“AI在这段时间的发展可以用‘波澜壮阔’来形容。在此前的很长一段时间里，人们其实对AI持一种保留甚至怀疑的态度，直到ChatGPT发布后，人们才发现人工智能真的能够成为一种生产力。”华东师范大学计算机学院副研究员、前华为荣耀Magic手机首席架构师董道国近日对第一财经表示，“这种生产力仍然局限在小范围内，还没有真正颠覆各行各业，但至少这个趋势已经出现了，目前已是暗潮涌动。”

以下为部分交流：

第一财经：目前国内的大模型能否对标OpenAI的ChatGPT？

董道国：国内大模型的发展蒸蒸日上，但距离OpenAI发布的GPT4等领先大模型，国内还有很长的路要走，还需要更加努力，特别是那种有资金、有实力的大厂，应该再沉下心来继续努力，至少到目前为止这种差距还是比较大的。

第一财经：这个差距具体体现在哪里？

董道国：这是综合性的表现，大模型不仅仅是算法，还要考虑训练数据、算力以及工程化能力。如果仅仅聚焦于对话模型，国内大模型对中文对话的支持还是可以的，但如果把大模型作为AI Agent（人工智能体）的“大脑”作用去发挥的时候，我们的大模型在推理能力上距离ChatGPT还有蛮远的距离，也就是说仅仅看对话模型其实表现也还可以，但是将AI作为一个生产力，国内大模型还有一定差距。

第一财经：作为AI Agent和作为对话的大模型，它们的主要区别是什么？

董道国：基于大模型的对话应用是给普通人用的，面向C端，利用网页的形式和大模型做一些对话沟通；AI Agent作为一种“大脑”，本质上我们不仅是用它里边的知识，更多地是用它的推理能力去做决策，调用工具和外部知识来完成复杂的任务。

第一财经：国内的大模型未来会成为一个超级 APP 吗？

董道国：会有这样一种趋势。包括一些手机公司做AI终端的目的，就是希望手机继续能够承担所有APP入口。国内包括百度、阿里在发力的大模型，其实也是希望能够承担超级APP的那种角色。

我相信未来随着AI的发展，手机所有APP的形式一定会发生根本性变化。目前APP的形式仍然偏规则式，并不人性化。规则式意味着没有人机对话能力，我们只能根据APP设定的布局来使用，按相应的按键，得到APP的回应，这种模式是反人性的。人最希望直接表达自己的需求而得到满足，而不是点来点去。比如我喊出苹果手机的Siri，让它给我定一个闹钟，它就会直接给我定好。未来随着人工智能的发展，这种功能的适用范围会更广阔，使用起来也会更加便捷。

第一财经：目前各个领域，比如医疗、金融领域都在研发自己的垂域大模型，一些企业也会在一些开源大模型基础之上，结合自己的行业经验和数据积累，推出自己领域的大模型。这给我们一种感觉，大模型的技术门槛是不是没有那么高？

董道国：其实如果有私域的数据，并且数据质量比较高的话，基于现有的一些基座大模型去训练自己的私域大模型，我认为技术上并不是很难。但是训练之后的效果到底怎么样，其实还是要打一个问号，要去看具体的工程方法，训练数据集如何构建需要一定的经验积累。

我一直持有一个观点，当一个企业或者一个行业真的去训练自己的私域大模型的时候，还是需要综合考虑一下，到底是要自己去微调一个大模型，还是用现有大模型去构建一个面向自己行业应用的智能体，要看哪一种方案更符合实际需求。现在很多人其实把RAG（Retrieval Augmented Generation，检索增强生成）和训练私域大模型混淆，我其实更倾向于用RAG 的模式去构建面向某个行业的应用场景。

第一财经：两者的主要区别在哪里？

董道国：微调大模型其实就是在改变大模型的参数，也就是把知识输入到这个大模型里面去。而RAG仅仅用的是大模型的推理能力，而知识源于企业内部自己的数据和知识库。换句话说，第一种模式是把知识灌到大模型里，这有一个缺点：大模型仍然有可能输出它不确定的知识或不清楚的信息，从而造成一些幻觉，导致真伪难辨。但是RAG模式通常没使用大模型里的知识，只用了大模型自然语言的理解和推理能力，知识通过检索知识库后送给大模型，让它来根据限定的知识去生成。

第一财经：L0通用大模型和L1垂域大模型，它们目前的商业化进程如何？未来什么样的大模型更容易变现？

董道国：其实如果资金实力比较雄厚的话，那么做L0通用大模型是一件值得去鼓励的事情，但面临应用落地的问题。通用大模型投入很高，变现路径比较长，所以需要持续的资金支持。国家需要这样的L0级大模型出现，所以我觉得这件事情需要由那些有实力的大厂去持续投入。而在一个行业应用里，我认为垂域大模型可能更容易发挥实质性作用。

我倒不建议专门成立一家公司去做垂域大模型，而是应该由已经有明确应用场景的企业，去利用这种通用大模型来优化业务流程，能够马上发挥作用，这种情况更容易成功。如果一个创业团队自己去想象一个行业场景，然后去训练垂类大模型，再销售出去，压力会非常大。所以我一直觉得不应该鼓励过多的创业公司投入到思考应用场景上，应用场景去找技术会比较好。

探索人工智能产业的新一轮浪潮：ChatGPT的兴起与AI大模型的崛起
自从2022年11月OpenAI发布其先进的大型预训练语言模型ChatGPT以来，人工智能（AI）产业迎来了新一轮的蓬勃发展。从起初的保守质疑，到现在的全球瞩目，AI的影响力已经超越了传统的工业领域，影响到了几乎所有行业的日常运营和创新实践。
首先，让我们回顾一下过去的一年，ChatGPT及其相关应用的迅速崛起令人印象深刻。作为首个使用深度学习技术进行大规模语料库训练的人工智能模型，ChatGPT以其强大的文本理解和生成能力，引发了人们的广泛关注和讨论。然而，与当前顶级的OpenAI GPT-4相比，中国及国际AI大企业在面对这一新机遇时仍存在较大差距。
在国内，大模型的研发仍在不断推进，尽管这一过程曲折而又充满挑战。相较于国外领先企业的深思熟虑和长期研发投入，中国的 AI 大模型还处于初级阶段。与ChatGPT相比，国内的大模型在以下几方面表现出明显差距：
1. 技术局限性：国内大模型在自然语言处理（NLP）领域的整体水平仍然相对较低，尤其是在对于中文对话的支持方面。虽然已有部分高校和研究机构针对中文对话展开研究，但由于缺乏充足的数据集和计算资源，这些模型往往只能提供基本的对话片段回复，无法实现更深入的自然语言理解或精准的语义分析。
2. 计算力与工程化能力：AI大模型的核心在于其大规模的训练数据集、高效的计算能力和丰富多样的应用开发环境。相比之下，国内大模型所依赖的数据集往往局限于特定的教育、科研机构，且大多数并未包含大量的商业文本数据或大量真实用户行为样本。此外，大部分国产大模型都依赖于人工调优和定制，这使得其在提升执行效率和准确性方面较ChatGPT有显著劣势。
3. 用户体验与交互设计：AI大模型的用户体验和交互设计直接影响着其在现实生活中的应用场景和用户接受度。现有的AI大模型往往需要依赖语音识别、语音合成等底层技术才能实现简单的自然语言交互，且过度依赖黑盒模型可能导致对话结果难以理解，难以捕捉用户的个性化需求。同时，AI大模型在理解复杂情绪、意图和上下文等方面的能力仍有待提高，这对于市场推广和用户满意度来说是一大挑战。
展望未来，随着ChatGPT的热度逐渐消退，AI大模型在行业应用领域的潜力将进一步显现。目前来看，以下几个方面是中国及国际AI大企在未来加大投入并推动大模型商业化的关键驱动因素：
1. 数据驱动：大量高质量的数据是AI大模型训练的重要条件，尤其在诸如医疗、金融、电商等应用场景中，AI大模型需要能够理解和模拟真实世界的复杂互动关系。因此，针对特定行业的特征数据采集和标注工作将是推动AI大模型走向商业化的一个重要环节。
2. 资金投入与人才支持：大型企业应有足够的资金和技术资源来支持AI大模型的研究和开发，特别是在大模型的跨领域协同研发、大规模训练与优化、应用场景落地等方面。同时，引进和培养一批具有深厚技术功底和广泛商业理解的专业人才是推动AI大模型产业化的重要途径。
3. 市场推广与品牌塑造：在全球化的背景下，AI大模型不仅需要在技术研发上取得突破，更需积极借助市场力量和品牌效应提升自身的知名度和影响力。企业可以通过联合优质合作伙伴、举办发布会、打造品牌合作等方式，积极吸引各行业用户的关注和认可，进一步打开AI大模型的应用边界。
4. 法规与政策支持：各国政府应出台相关的法规和政策，促进AI大模型在不同行业领域的合理合规使用，为大模型的研发、应用和商业化提供必要的法律保障。此外，扶持初创企业和中小企业，通过优惠政策、资金扶持等方式降低AI大模型进入市场的门槛，进一步激发大模型在各领域的创新活力。
总的来说，ChatGPT的成功既是人工智能技术创新的巨大里程碑，也是AI产业融合发展的历史转折点。国内外大企正以全新的视角和策略，共同推动AI大模型的自主研发、规模化应用和商业化进程，为人类社会的智慧进步和社会经济的创新发展注入新的动力。无论是在基础技术、行业应用，还是从市场需求、市场生态，甚至是市场竞争格局上，都将看到AI大模型深刻重塑与革新所带来的重要变革。随着这项先进技术愈发成熟，期待在不久的将来，AI大模型能在更多的行业中发挥更大的价值，为人类的生活质量和经济社会发展做出更大贡献。

上一篇:“AI赢家”不止英伟达！Wedbush上调微软目标价：还能再涨18%！
下一篇:发酵食品孩子能吃吗？这3点好处要知道！

更多更酷的内容分享

猜你感兴趣

AI驱动的化学研究新范式：引领中国化学2035战略发展

格曼）教授的团队利用机器学习技术预测出了一种名为"导电细胞"的新型细胞生物传感器，这种传感器有望被用于疾病诊断或药物开发。以下是关于这个话题的概述：随着大数据和AI技术的发展，化学领域将越来越多地采用机器学习算法来预测复杂的化学反应可能性。美国和中国的一些学者已经成功地使用机器学习技术来预测和优化化合物的合成路径。此外，科学家们也正在努力建立一种基于深度神经网络和符号AI规划化学合成的模型，这可能会大大改善我们对化学过程的理解，并可能开辟新的化学合成方法。

生活常识 11.18

清华大学学者携手AI与机理，共同构建高效代谢模型，革新科研理念与进程

样实现生物化学反应。于是，她开始思考如何利用现代科学技术来模拟真实世界的生物化学反应，这就是数字生命框架的概念。她的研究团队开发出一个先进的计算平台，能够在复杂环境中精准地模拟生物化学反应，从而获得丰富的数据。这个平台帮助他们解析了复杂的生命数字化数据，为未来的医学研究提供了宝贵的数据支持。在未来的研究中，李斐然将继续拓展数字生命框架的应用范围，从微生物到更复杂的细胞，再到人体的各种组织。此外，她还将探索数字化技术如何帮助我们更好地理解生命的奥秘。目前，她已经发表了一系列关于这项工作的研究论文，并且在一些重要的科研会议上担任了演讲嘉宾。由于她在生命科学领域的杰出贡献，李斐然被评为2023年《麻省理工科技评论》中国区“35岁以下科技创新35人”。她的成功不仅证明了数字技术在生命科学领域的巨大潜力，也为其他科学家提供了一个新的思路和视角。

生活常识 08.01

科学家构建新型存内计算技术，将AI模型计算能效提高3倍之多

"双存内计算"架构是针对AI模型推理和训练面临的巨大成本进行的一种技术创新。它的出现极大地简化了硬件结构，提高了性能，并可能应用到边缘计算系统和终端设备部署中。双存内计算通过在存储器内部原位计算减少数据搬运，极大地提高了AI模型推理和训练的效率，对提升芯片算力与能效具有重要作用。此外，这种新型存内计算架构还消除了传统单存内计算架构的数据搬运问题，实现了真正的存储器内计算。

热点资讯 10.28

双轮驱动：展望数字大脑在技术与计算交叉中的愿景

阿姆顿等人(2023)在《神经科学》上发表了名为"大数据驱动的新时代"的文章。他们指出，得益于分子到整个大脑多层次的数据集成和建模，脑科学研究正迈向一个新的时代。其中，新型的大脑科学整合了高质量的研究、多层次数据的集成、跨学科的大规模合作文化，从而推动了科研成果的应用转化。该研究提出，采用系统化的方法对于应对未来十年内的医学与技术挑战至关重要。他们希望通过这篇文章，明确科学的共同目标，并为未来十年的数字大脑研究发展一套新概念。另外，他们也提供了一个科学框架，支持当前及未来的EBRAINS研究基础设施发展，并强调了包括反思、对话及社会参与在内的协作研究方法的重要性。文章最后指出，尽管大数据对脑科学研究有巨大影响，但也要警惕其可能带来的伦理与社会机会与挑战，这也是未来神经科学研究必须面对的问题。

生活常识 07.12

杜特尔特是否引发菲律宾军事政变?，这可能会引发菲律宾的大地震般的局势！

风声，就可能引发紧张的局势。同时，这次政变是否真的会导致菲律宾政府“四分五裂”也是备受外界关注的问题。杜特尔特表示，菲律宾政府目前面临着严重的挑战，“四分五裂”的局面让他感到非常担忧。因此，他呼吁军方采取行动，以免未来类似的事情再次发生。小马科斯曾是菲律宾的主要反对党领袖，但在过去的几次选举中都被击败。然而，最近他的势力有所增长，他的一系列行为引起了人们的广泛关注。这篇文章预测了菲律宾即将发生的政变，并提出了可能会涉及的军事干预和军队改革的可能性。同时，文章也提到了两家人之间的紧张关系和可能的阴谋。最后，文章强调了杜特尔特对国家稳定的重要性和呼吁军方采取行动的必要性。

热点资讯 11.26

默克尔回忆录：普京对权力游戏的认知与趣事

定位：这段文本的主题是德国前总理安格拉·默克尔对她的政治生涯和领导经验的回顾，尤其是与俄罗斯总统普京的关系。摘要： 1. 德国前总理安格拉·默克尔回忆了与普京的"权力游戏"和与奥巴马和特朗普的截然不同的会面。 2. 默克尔在2007年与普京在慕尼黑的一次演讲中留下了深刻印象，这次演讲显示了普京的"自以为是"。 3. 默克尔认为她的前任美国总统、法国总统和英国首相等人都可能有过类似的经历，但与普京的交往受到了最多的审视。关键词：德国前总理安格拉·默克尔普京 “权力游戏” 会面奥巴马特朗普英国脱欧大宗天然气疾病应对危机金融风暴债务危机失业潮口罩疫情世界经济然而，默克尔对担任德国领导人16年来的重大决策似乎没有太大的疑虑。她面临的最大挑战包括全球金融危机、欧洲债务危机、难民潮以及新冠疫情。

热点资讯 11.26

普京给金正恩送礼：一批罕见飞禽走兽抵朝

近日，俄罗斯与朝鲜签署了一系列合作文件，包括包含贸易、经济、科学和技术等领域的协议。在此背景下，俄罗斯总统普京也给朝鲜领导人金正恩送上一份名为“意料之外”的礼物，由俄自然资源部长亚历山大·科兹洛夫代为赠送。这些稀奇动物代表了俄朝友谊，也成为了国际环境下的特殊体现。

热点资讯 11.26

欧洲海底光缆断开：西方媒体疑中伤，引发关注

封锁了对位于黑海中的天然气管道的搜查权。现在看来，这场海啸可能是由于失控的海底光缆造成的。

热点资讯 11.26

其他玩家疯狂囤积红魔石，游戏玩家血本无归的案例分析

近期的云游道人活动，许多商人以手速成功抢占红魔石并卖出高价，导致大量的红魔石滞销。该玩家囤积了大量的红魔石，但并未成功销售。原因是服务器大鬼区没有大老板玩家，因此无需抢购。不过，在道人走后，价格明显上升至1200万左右，库存中的红魔石却无人问津。建议玩家降低标价，以免失去机会；同时考虑通过刷副本或兑换高级兽诀的方式来突破困境。

热点资讯 11.26

魔兽11月28日职业平衡调整对火法与猎人的影响：提升22%，带你深度解析这个职业平衡变动!

《魔兽世界》下周将进行新一轮职业调整，包括法师火法调整和萨满风暴使者流等重点调整，同时强调部分专精的优化以提升战斗体验。改动可能因环境和团队配置而异。

热点资讯 11.26

那些曾经为之疯狂的皮肤，今日已全面被取代：我曾追求过的哪个？

王者荣耀中的皮肤话题热门集中在新鲜面孔如白月光与安琪拉的皮肤，以及稀缺和珍贵皮肤。例如“引擎之心”因其销量冠绝王者史而备受期待，但在赵云强盛时期推出的限量版宝马回城特效，仅个月后便引发了一段时间的争议。其中，无愧为经典之作的“纯白花嫁”及“魔法小厨娘”亦引起诸多玩家的喜爱。而贵族玩家更是将目光锁定在千年等一遇的稀有皮肤，如猴王仙君等，这些都是他们心中永远无法割舍的美好回忆。然而，最终这些画质精美的皮肤并未得到大众的认可，这也是许多玩家遗憾的原因之一。

热点资讯 11.26

狮驼岭三豪门：虬龙之价，逆袭法系梦想的上演

要点： 1. 非常受欢迎的新VIP读者和梦幻资讯，只需花费4万元即可获得； 2. 梦幻资讯售价仅为4万元，是前所未有的低价之一； 3. 四个热门服务器之一的幻雪阁、天龙会和折戟沉沙已成功晋级八强； 4. 刚刚开始打书的小老板，现在拥有10技能的雷鸟人，其中一个特殊技能也是他的得意之作。

热点资讯 11.26

王者S38赛季皮肤即将更新，5款新品值得期待！7款品质极高的皮肤降价至5元

随着S37赛季结束，王昭君传说皮肤仍未上线。分析称已过一年裴擒虎FAMVIP皮肤预计年底上线，敖隐伴生皮肤至今未公开信息。而少司缘将在春节或后续与联动皮肤一起推出。

热点资讯 11.26

小米SU7 排列第四，本月汽车销量表现亮眼

随着电动汽车市场竞争愈发激烈，2024年中国25万-35万元车型销量榜中，特斯拉Model Y凭借36204辆销量夺冠，比亚迪汉紧随其后；而其他主流品牌如丰田RAV4荣放、大众迈腾、本田CR-V、大众探岳、途观L等车型也均有不错的表现，市场份额稳定。同时，极氪7X、宝马3系、领克08新能源等车型也受到消费者的喜爱，销量均超过8500辆。在国内汽车市场，不同价位段车型的竞争日趋激烈，既有传统合资品牌的坚守，也有造车新势力的崛起，更有国产新能源汽车的强势登陆。

热点资讯 11.26