华东师范大学计算机学院副研究员董道国:大模型的应用驱动:构建高效的场景找技术,引领数字化生产的新潮流

2024-03-28 热点资讯 关注公众号

自2022年11月底openAI首次公测ChatGPT以来,人工智能(AI)迎来新一波浪潮,AI产业飞速发展。

“AI在这段时间的发展可以用‘波澜壮阔’来形容。在此前的很长一段时间里,人们其实对AI持一种保留甚至怀疑的态度,直到ChatGPT发布后,人们才发现人工智能真的能够成为一种生产力。”华东师范大学计算机学院副研究员、前华为荣耀Magic手机首席架构师董道国近日对第一财经表示,“这种生产力仍然局限在小范围内,还没有真正颠覆各行各业,但至少这个趋势已经出现了,目前已是暗潮涌动。”

以下为部分交流:

第一财经:目前国内的大模型能否对标OpenAI的ChatGPT?

董道国:国内大模型的发展蒸蒸日上,但距离OpenAI发布的GPT4等领先大模型,国内还有很长的路要走,还需要更加努力,特别是那种有资金、有实力的大厂,应该再沉下心来继续努力,至少到目前为止这种差距还是比较大的。

第一财经:这个差距具体体现在哪里?

董道国:这是综合性的表现,大模型不仅仅是算法,还要考虑训练数据、算力以及工程化能力。如果仅仅聚焦于对话模型,国内大模型对中文对话的支持还是可以的,但如果把大模型作为AI Agent(人工智能体)的“大脑”作用去发挥的时候,我们的大模型在推理能力上距离ChatGPT还有蛮远的距离,也就是说仅仅看对话模型其实表现也还可以,但是将AI作为一个生产力,国内大模型还有一定差距。

第一财经:作为AI Agent和作为对话的大模型,它们的主要区别是什么?

董道国:基于大模型的对话应用是给普通人用的,面向C端,利用网页的形式和大模型做一些对话沟通;AI Agent作为一种“大脑”,本质上我们不仅是用它里边的知识,更多地是用它的推理能力去做决策,调用工具和外部知识来完成复杂的任务。

第一财经:国内的大模型未来会成为一个超级 APP 吗?

董道国:会有这样一种趋势。包括一些手机公司做AI终端的目的,就是希望手机继续能够承担所有APP入口。国内包括百度、阿里在发力的大模型,其实也是希望能够承担超级APP的那种角色。

我相信未来随着AI的发展,手机所有APP的形式一定会发生根本性变化。目前APP的形式仍然偏规则式,并不人性化。规则式意味着没有人机对话能力,我们只能根据APP设定的布局来使用,按相应的按键,得到APP的回应,这种模式是反人性的。人最希望直接表达自己的需求而得到满足,而不是点来点去。比如我喊出苹果手机的Siri,让它给我定一个闹钟,它就会直接给我定好。未来随着人工智能的发展,这种功能的适用范围会更广阔,使用起来也会更加便捷。

第一财经:目前各个领域,比如医疗、金融领域都在研发自己的垂域大模型,一些企业也会在一些开源大模型基础之上,结合自己的行业经验和数据积累,推出自己领域的大模型。这给我们一种感觉,大模型的技术门槛是不是没有那么高?

董道国:其实如果有私域的数据,并且数据质量比较高的话,基于现有的一些基座大模型去训练自己的私域大模型,我认为技术上并不是很难。但是训练之后的效果到底怎么样,其实还是要打一个问号,要去看具体的工程方法,训练数据集如何构建需要一定的经验积累。

我一直持有一个观点,当一个企业或者一个行业真的去训练自己的私域大模型的时候,还是需要综合考虑一下,到底是要自己去微调一个大模型,还是用现有大模型去构建一个面向自己行业应用的智能体,要看哪一种方案更符合实际需求。现在很多人其实把RAG(Retrieval Augmented Generation,检索增强生成)和训练私域大模型混淆,我其实更倾向于用RAG 的模式去构建面向某个行业的应用场景。

第一财经:两者的主要区别在哪里?

董道国:微调大模型其实就是在改变大模型的参数,也就是把知识输入到这个大模型里面去。而RAG仅仅用的是大模型的推理能力,而知识源于企业内部自己的数据和知识库。换句话说,第一种模式是把知识灌到大模型里,这有一个缺点:大模型仍然有可能输出它不确定的知识或不清楚的信息,从而造成一些幻觉,导致真伪难辨。但是RAG模式通常没使用大模型里的知识,只用了大模型自然语言的理解和推理能力,知识通过检索知识库后送给大模型,让它来根据限定的知识去生成。

第一财经:L0通用大模型和L1垂域大模型,它们目前的商业化进程如何?未来什么样的大模型更容易变现?

董道国:其实如果资金实力比较雄厚的话,那么做L0通用大模型是一件值得去鼓励的事情,但面临应用落地的问题。通用大模型投入很高,变现路径比较长,所以需要持续的资金支持。国家需要这样的L0级大模型出现,所以我觉得这件事情需要由那些有实力的大厂去持续投入。而在一个行业应用里,我认为垂域大模型可能更容易发挥实质性作用。

我倒不建议专门成立一家公司去做垂域大模型,而是应该由已经有明确应用场景的企业,去利用这种通用大模型来优化业务流程,能够马上发挥作用,这种情况更容易成功。如果一个创业团队自己去想象一个行业场景,然后去训练垂类大模型,再销售出去,压力会非常大。所以我一直觉得不应该鼓励过多的创业公司投入到思考应用场景上,应用场景去找技术会比较好。


探索人工智能产业的新一轮浪潮:ChatGPT的兴起与AI大模型的崛起
自从2022年11月OpenAI发布其先进的大型预训练语言模型ChatGPT以来,人工智能(AI)产业迎来了新一轮的蓬勃发展。从起初的保守质疑,到现在的全球瞩目,AI的影响力已经超越了传统的工业领域,影响到了几乎所有行业的日常运营和创新实践。
首先,让我们回顾一下过去的一年,ChatGPT及其相关应用的迅速崛起令人印象深刻。作为首个使用深度学习技术进行大规模语料库训练的人工智能模型,ChatGPT以其强大的文本理解和生成能力,引发了人们的广泛关注和讨论。然而,与当前顶级的OpenAI GPT-4相比,中国及国际AI大企业在面对这一新机遇时仍存在较大差距。
在国内,大模型的研发仍在不断推进,尽管这一过程曲折而又充满挑战。相较于国外领先企业的深思熟虑和长期研发投入,中国的 AI 大模型还处于初级阶段。与ChatGPT相比,国内的大模型在以下几方面表现出明显差距:
1. 技术局限性:国内大模型在自然语言处理(NLP)领域的整体水平仍然相对较低,尤其是在对于中文对话的支持方面。虽然已有部分高校和研究机构针对中文对话展开研究,但由于缺乏充足的数据集和计算资源,这些模型往往只能提供基本的对话片段回复,无法实现更深入的自然语言理解或精准的语义分析。
2. 计算力与工程化能力:AI大模型的核心在于其大规模的训练数据集、高效的计算能力和丰富多样的应用开发环境。相比之下,国内大模型所依赖的数据集往往局限于特定的教育、科研机构,且大多数并未包含大量的商业文本数据或大量真实用户行为样本。此外,大部分国产大模型都依赖于人工调优和定制,这使得其在提升执行效率和准确性方面较ChatGPT有显著劣势。
3. 用户体验与交互设计:AI大模型的用户体验和交互设计直接影响着其在现实生活中的应用场景和用户接受度。现有的AI大模型往往需要依赖语音识别、语音合成等底层技术才能实现简单的自然语言交互,且过度依赖黑盒模型可能导致对话结果难以理解,难以捕捉用户的个性化需求。同时,AI大模型在理解复杂情绪、意图和上下文等方面的能力仍有待提高,这对于市场推广和用户满意度来说是一大挑战。
展望未来,随着ChatGPT的热度逐渐消退,AI大模型在行业应用领域的潜力将进一步显现。目前来看,以下几个方面是中国及国际AI大企在未来加大投入并推动大模型商业化的关键驱动因素:
1. 数据驱动:大量高质量的数据是AI大模型训练的重要条件,尤其在诸如医疗、金融、电商等应用场景中,AI大模型需要能够理解和模拟真实世界的复杂互动关系。因此,针对特定行业的特征数据采集和标注工作将是推动AI大模型走向商业化的一个重要环节。
2. 资金投入与人才支持:大型企业应有足够的资金和技术资源来支持AI大模型的研究和开发,特别是在大模型的跨领域协同研发、大规模训练与优化、应用场景落地等方面。同时,引进和培养一批具有深厚技术功底和广泛商业理解的专业人才是推动AI大模型产业化的重要途径。
3. 市场推广与品牌塑造:在全球化的背景下,AI大模型不仅需要在技术研发上取得突破,更需积极借助市场力量和品牌效应提升自身的知名度和影响力。企业可以通过联合优质合作伙伴、举办发布会、打造品牌合作等方式,积极吸引各行业用户的关注和认可,进一步打开AI大模型的应用边界。
4. 法规与政策支持:各国政府应出台相关的法规和政策,促进AI大模型在不同行业领域的合理合规使用,为大模型的研发、应用和商业化提供必要的法律保障。此外,扶持初创企业和中小企业,通过优惠政策、资金扶持等方式降低AI大模型进入市场的门槛,进一步激发大模型在各领域的创新活力。
总的来说,ChatGPT的成功既是人工智能技术创新的巨大里程碑,也是AI产业融合发展的历史转折点。国内外大企正以全新的视角和策略,共同推动AI大模型的自主研发、规模化应用和商业化进程,为人类社会的智慧进步和社会经济的创新发展注入新的动力。无论是在基础技术、行业应用,还是从市场需求、市场生态,甚至是市场竞争格局上,都将看到AI大模型深刻重塑与革新所带来的重要变革。随着这项先进技术愈发成熟,期待在不久的将来,AI大模型能在更多的行业中发挥更大的价值,为人类的生活质量和经济社会发展做出更大贡献。

上一篇:“AI赢家”不止英伟达!Wedbush上调微软目标价:还能再涨18%!
下一篇:发酵食品孩子能吃吗?这3点好处要知道!
更多更酷的内容分享
猜你感兴趣
清华大学学者携手AI与机理,共同构建高效代谢模型,革新科研理念与进程

清华大学学者携手AI与机理,共同构建高效代谢模型,革新科研理念与进程

样实现生物化学反应。于是,她开始思考如何利用现代科学技术来模拟真实世界的生物化学反应,这就是数字生命框架的概念。她的研究团队开发出一个先进的计算平台,能够在复杂环境中精准地模拟生物化学反应,从而获得丰富的数据。这个平台帮助他们解析了复杂的生命数字化数据,为未来的医学研究提供了宝贵的数据支持。 在未来的研究中,李斐然将继续拓展数字生命框架的应用范围,从微生物到更复杂的细胞,再到人体的各种组织。此外,她还将探索数字化技术如何帮助我们更好地理解生命的奥秘。目前,她已经发表了一系列关于这项工作的研究论文,并且在一些重要的科研会议上担任了演讲嘉宾。 由于她在生命科学领域的杰出贡献,李斐然被评为2023年《麻省理工科技评论》中国区“35岁以下科技创新35人”。她的成功不仅证明了数字技术在生命科学领域的巨大潜力,也为其他科学家提供了一个新的思路和视角。

生活常识 08.01
科学家构建新型存内计算技术,将AI模型计算能效提高3倍之多

科学家构建新型存内计算技术,将AI模型计算能效提高3倍之多

"双存内计算"架构是针对AI模型推理和训练面临的巨大成本进行的一种技术创新。它的出现极大地简化了硬件结构,提高了性能,并可能应用到边缘计算系统和终端设备部署中。双存内计算通过在存储器内部原位计算减少数据搬运,极大地提高了AI模型推理和训练的效率,对提升芯片算力与能效具有重要作用。此外,这种新型存内计算架构还消除了传统单存内计算架构的数据搬运问题,实现了真正的存储器内计算。

热点资讯 10.28
双轮驱动:展望数字大脑在技术与计算交叉中的愿景

双轮驱动:展望数字大脑在技术与计算交叉中的愿景

阿姆顿等人(2023)在《神经科学》上发表了名为"大数据驱动的新时代"的文章。他们指出,得益于分子到整个大脑多层次的数据集成和建模,脑科学研究正迈向一个新的时代。其中,新型的大脑科学整合了高质量的研究、多层次数据的集成、跨学科的大规模合作文化,从而推动了科研成果的应用转化。 该研究提出,采用系统化的方法对于应对未来十年内的医学与技术挑战至关重要。他们希望通过这篇文章,明确科学的共同目标,并为未来十年的数字大脑研究发展一套新概念。另外,他们也提供了一个科学框架,支持当前及未来的EBRAINS研究基础设施发展,并强调了包括反思、对话及社会参与在内的协作研究方法的重要性。 文章最后指出,尽管大数据对脑科学研究有巨大影响,但也要警惕其可能带来的伦理与社会机会与挑战,这也是未来神经科学研究必须面对的问题。

生活常识 07.12
中国科学院院士陈润生:大数据成为医学大模型生长的“养料”

在中国科学院院士、我国生物信息学领军人物陈润生的研究中,他指出:“医学数据已成为大模型成长的‘养料’”。这不仅表明了数据在科学领域的重要作用,也展示了大数据在推动科学研究和技术发展中的巨大潜力。

中国科学院院士陈润生:大数据成为医学大模型生长的“养料” 在中国科学院院士、我国生物信息学领军人物陈润生的研究中,他指出:“医学数据已成为大模型成长的‘养料’”。这不仅表明了数据在科学领域的重要作用,也展示了大数据在推动科学研究和技术发展中的巨大潜力。

术目标是在特定领域内提供高度优化的服务。对于每个具体领域的疾病或健康问题,我们可以基于当前的技术知识和经验来构建专门的大模型,例如机器学习算法或神经网络。 在这种情况下,构建专业大模型比建模科学领域的大模型更加直接有效,因为它们具有清晰的目标和实际应用的例子。它可以帮助我们更好地理解和预测疾病的发展,并制定更有效的治疗策略。因此,在未来的发展趋势中,专业大模型将会成为一个重要的发展方向。

热点资讯 11.03
创新空间引领下,埃安UT能否成为下一热销车型?

创新空间引领下,埃安UT能否成为下一热销车型?

埃安UT两厢电动小车迎来正式曝光,主打新能源小车市场,外观圆润可爱,轴距夸张。内饰清新时尚,动力强,预计售价低于同类竞品。

热点资讯 11.13
神盾短刀电池:超越长刀时代的电池革新者

神盾短刀电池:超越长刀时代的电池革新者

吉利银河E5上市85天,交付突破4万台,凭借卓越的安全性、智能配置和优秀的性能,成为销量最快的纯电紧凑级SUV。神盾短刀电池被广泛认可,是目前行业内公认的最新一代“刀片式”电池。它在电池寿命、充电速度和温度控制等方面都有出色的表现,符合现代消费者对于电动车的需求。中国科学技术协会主席万钢先生和中国汽车技术研究中心有限公司首席科学家王芳给予了高度评价,他们一致认为神盾短刀电池的性能和质量堪称一流。因此,可以预见,随着技术的进步和市场需求的变化,神盾短刀电池将会持续引领纯电市场的潮流。

热点资讯 11.13
谁说方程豹不适合年轻人?听说豹子8性价比超高!

方程豹:什么年龄的人都适合,豹子8的性价比到底如何?

谁说方程豹不适合年轻人?听说豹子8性价比超高! 方程豹:什么年龄的人都适合,豹子8的性价比到底如何?

昨晚,方程豹豹8正式上市,售价区间为37.98万元至40.78万元,搭载华为智驾技术的 DMO越野系统,是国货高端SUV市场的一次突破。它的亮点在于非承载式车身结构、华为智驾技术和DMO越野系统。凭借领先的技术实力,豹8具有极高的驾驶便捷性和安全性,能在城市通勤和高速行驶中提供强大帮助,也能在恶劣环境下胜任挑战。豹8的燃油经济性也非常出色,其燃油效率高达8.5L/100km,比大部分同类车型低得多。总的来说,豹8凭借其优秀的性价比,成为了一款值得购买的智能SUV。

热点资讯 11.13
2023万亿债:政策推动下的超预期盛宴?

2023万亿债:政策推动下的超预期盛宴?

亿的比例,用于化解政府隐性债务,相当于给政府发放了一笔“补贴”。这是缓解政府债务压力的一种方式。此外,化债方案还将引导银行等金融机构向政府提供低息贷款,以替代高息贷款,降低地方政府的偿债成本。最后,化债方案还包括一些其他措施,如设立地方债管理机构,加强对地方政府债务的监管等等。 总的来说,化债方案旨在通过低成本贷款来置换高息贷款,帮助地方政府缓解隐性债务压力,并降低自身的偿债成本。这对于保障地方财政健康稳定、促进经济增长具有重要意义。

热点资讯 11.13
蚂蚁减持钱塘征信三年后,高管变动引关注:持股比例或有调整?

蚂蚁减持钱塘征信三年后,高管变动引关注:持股比例或有调整?

钱塘征信获准成为我国第三家持牌个人征信机构,公司注册资本10亿元,有效期至2027年11月8日,董监高人员名单出现部分调整。

热点资讯 11.13
中信证券总经理邹迎光年年度级别行情起点,轻装再战或今轮政策导向

站上年度级别行情起跑线,轻装再战或今轮政策导向:中信证券总经理邹迎光的预判与解读

中信证券总经理邹迎光年年度级别行情起点,轻装再战或今轮政策导向 站上年度级别行情起跑线,轻装再战或今轮政策导向:中信证券总经理邹迎光的预判与解读

财联社11月12日讯,中信证券总经理邹迎光在深圳大会致辞表示,未来五年,中国经济将步入高质量发展阶段,资本市场生态也将迎来根本性重塑。预计2025年,宏观经济将实现平稳健康发展,投资者回报将有所改善,A股的融资渠道将进一步拓宽,市场将迎来年度级别行情的起跑线。展望未来,全球经济形势仍复杂多变,但中国的国际话语权和主动权将明显增强。

热点资讯 11.13
紧随“徽酒老二”步伐,迎驾贡酒的压力山大!

紧随“徽酒老二”步伐,迎驾贡酒的压力山大!

迎驾贡酒面临的挑战主要来自于市场竞争加剧以及销售增长放缓。根据统计数据,2024年第三季度,白酒行业增速放缓成为了一个普遍现象,次高端酒、区域酒受到影响明显。此外,据国联证券研报测算,2024年第三季度白酒行业重点公司营业收入增速为2.41%,其中高端酒、次高端酒及区域酒的收入增速分别为同比增长9.59%、下滑0.38%及下滑15.64%,分别环比下降4.65、8.87、23.32个百分点。区域酒降速明显,使得迎驾贡酒、今世缘、口子窖等酒企业绩不及预期。虽然迎驾贡酒在第三季度实现了营业收入17.11亿元,同比增长2.32%,但归母净利润6.25亿元,同比增长2.86%,仍未达到多数券商预期的水平。

热点资讯 11.13
OPEC降需求预期影响:未来油市走向如何?

优化后: 
OPEC连降两月对未来石油需求的预测影响及减产执行落后成员国的挑战分析

OPEC降需求预期影响:未来油市走向如何? 优化后: OPEC连降两月对未来石油需求的预测影响及减产执行落后成员国的挑战分析

OPEC本月预测全球石油消费量将增长180万桶/日,低于市场预期。中东冲突或不影响需求增长,但OPEC需继续下调。非OPEC产油国的供应将加快增长,且可能会超过OPEC的需求。投资者高度关注特朗普的回归和贸易政策对油价的影响。虽然市场前景充满不确定性,但仍有利消息。

热点资讯 11.13
杨德龙:深度解读巴菲特的价值投资之道,财富密码曝光

杨德龙:深度解读巴菲特的价值投资之道,财富密码曝光

上周,超级周三大不确定性因素已消除,三大不确定性因素已消除。本周,中国央行宣布将扩大货币宽松空间,进一步刺激经济增长。同时,美国大选尘埃落定,特朗普当选为新任总统。未来,股市有望延续此前的趋势,投资者需保持谨慎态度,抓住机会。 全文共100余字,只提取了关键信息,如上周三大不确定性因素已消除、中美大选尘埃落定等,并以简洁明了的语言描述了此次市场的走势特点。整体来看,本次行情较前两波有所不同,具有更大的不确定性。文章指出,尽管当前市场存在一定的风险,但仍存在投资机会,投资者应把握好市场的节奏,保持冷静理性,寻找适合自己的投资策略。

热点资讯 11.13
搜狐2024年第三季度营收达1.52亿美元,增长幅度达到5%

搜狐2024年第三季度营收达1.52亿美元,增长幅度达到5%

搜狐公布2024年第三季度财务报告,总收人为1.52亿美元,同比增长5%,其中品牌广告收入1900万美元,游戏收入1.28亿美元。归母净利润为-1200万美元,低于预期。CEO张朝阳表示:"2024年第三季度,我们实现了超出预期的在线游戏收入和净亏损。"

热点资讯 11.13