大模型谈钱,不寒碜。
前些日子朱啸虎和杨植麟的隔空对话,代表了技术派和市场派的两种观点。朱啸虎不看好大模型创业,认为现阶段大模型公司缺乏场景和数据,估值过高,且面临开源模型的竞争,投资风险大。他更倾向于投资能快速商业化、变现的应用层项目。
杨植麟坚定看好大模型创业,认为这是未来十年唯一有意义的事,并将其视为一个结合科学、工程和商业的系统,需要长期投入和坚持,最终目标是实现AGl。
虽然两者观点看起来针锋相对,但有一点并不冲突,不论是在通向AGI的过程中“沿途下蛋”,还是现在就投资能看到产出的大模型应用公司,今年大模型的商业化,一定是离钱越来越近。
若论国内对大模型商业化最热衷的企业,百度一定是其中之一。据此前报道,2024年百度创始人李彦宏在百度智能云方向的OKR就是,跑通以大模型为核心智能云发展路径,并且在收入和利润方面都有要求。
百度智能云是百度AI能力的输出口,海外市场大模型与云服务结合得比国内更紧密,这也是百度智能云希望努力的方向。
3月21日,百度智能云千帆大模型平台就一口气发布了5款新模型,包括3个轻量级大模型、2个垂直场景大模型,并且千帆ModelBuilder以千帆AppBuilder也同步升级。钛媒体App了解到,百度后续还将发布大模型应用产品,譬如销售、客服、办公等产品。
可以说,目前百度大模型商业化只有一条主线,让尽可能多的一部分人先用大模型,由此改变自己的产品和面向客户的服务。
大模型落地“值不值”
初期大模型的火热,未必能转化为实实在在的订单,在大模型技术和产业的高速发展期,有些厂商已经被历史的车轮碾过,但却丝毫不起一丝波澜。
“惨烈,我觉得是很惨烈,从去年到现在有很多基础模型厂商参与到市场竞争,也有很多的企业资金链受到了一些挑战,也反映出新技术发展过程中的一些矛盾。”百度智能云AI与大数据平台总经理忻舟说道。
这其中一个很重要的因素,就是大模型供需之间的错位,大量企业没有掏出真金白银,而是处在观望阶段。从企业使用大模型的角度,主要关注三个因素,一是效果好不好,二是成本是否足够低,三是效率,因此多数企业并不关心大模型或者小模型,只会结合自己的预期评估大模型落地到自己的场景“值不值”。
百度也提出了自己“效价比”的理念,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即“效价比”
面向大模型如何落地,业内想了各种各样的技术方法,比如RAG、插件、MoE、小型化、大小协同等等各种各样的问题,轻量级模型就是公认的“效价比”突出的方案。
“业界也逐渐形成一个共识,模型不见得是参数规模越大越好。在很多实际的场景当中,用小尺寸的专家模型也能够达到我们通用大模型的效果,小尺寸专家模型的推理成本会更低,更便宜。”百度副总裁谢广军表示。
他还提到,本次发布的三款模型都是开发专家模型的基座模型,主要面向两个场景:一是客户、合作伙伴结合自己的数据,去做垂类场景模型。二是百度也会基于这些小的基座模型,去开发第一方的行业垂类场景模型,比如做教育行业的教辅答题和解题,可以用一个小尺寸的模型加上一些数据,精调出一个效果很好的解题助手模型。
“3+2”,5款新模型
一月初,OpenAI发布了多款新模型,价格下降,性能提升,百度本次也是同样的策略,百度智能云千帆ModelBuilder发布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内,参数量由大到小的三款轻量级大模型。千帆ModelBuilder的概念就是生产平台,提供整个模型训练的工具链,让模型开发变得更简单。
对于轻量级模型,谢广军表示,基座模型本身的效率一定要好,百度基于文心大模型的技术领先优势积累,再把尺寸做小,模型的效果就会做得很好,在很多场景它能够达到大模型的效果。
同时,百度发布的轻量级模型具备再生产能力,比如支持post-pretrain、sft、lora精调能力,基座模型加上精调数据来达到垂直场景下的效果,同时成本更低。
具体来看,ERNIE Speed在推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。
ERNIE Lite的参数量则更小,更适合搭载在低算力的AI加速卡上处理推理任务,作为ERNIE-Bot-turbo模型的升级版,ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%,推理调用成本大幅下降了53%。
参数量最小的ERNIE Tiny则主打极致低成本、低延迟,可用于检索、推荐、意图识别等高并发、低延时等应用场景中,在某对话推荐业务场景中,精调后的ERNIE Tiny在搜索引擎推荐词激发环节,相比ERNIE 3.5,对话轮次增长了3.5%,成本下降了32%。
此外,百度智能云千帆ModelBuilder还推出了ERNIE Character和ERNIE Functions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。
结合企业实际使用大模型的过程,有些企业起初就用最好的模型看最好的效果,再决定投入的资源程度。有些场景需要快速验证,企业可以先上轻量级模型,轻量级模型总结一句话——“轻归轻,可破冰”,在一些场景下完全可用,作为大模型落地的先锋军。
对于注重私有数据的企业和行业,私有数据跟大模型结合也可以先用轻量级模型,不管是知识资产还是数据分析,都可以跑出效果。
“把大模型应用,喂到企业嘴边”
千帆大模型平台上的客户需求主要分为三种,第一类是在AppBuilder开发应用;第二类,直接调用百度的基座模型的,比如直接调用文心4.0、 3.5版本;第三类是生产模型,客户数据和百度基座模型结合做一个新的垂类模型。
AppBuilder去年年底推出,从应用的视角让开发者能够便捷地开发基于大模型的AI原生应用,百度第一方也做了非常多的AI原生应用,也是基于这套平台做的,本次AppBuilder也进一步升级,进一步降低应用开发门槛。
升级后的AppBuilder开放的工具组件多达55个,包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方API工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。
在组件之上,千帆AppBuilder推出的Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过90%。AppBuilder还支持开发者接入自定义工具,实现更复杂场景应用的需求定制。
谢广军介绍,AppBuilder分两个形态,一个是代码态,百度提供SDK,甚至提供底层的组件和能力,这种是大B端的场景下的典型客户画像。另一个是零代码态,以小企业、个人开发者为主,现在零代码态开发者的数量比较多,百度这两条路都要走。
根据百度智能云公布的数据,千帆大模型平台已经服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%
大模型未来一段时间还会不断快速演进,百度AI团队主抓基础模型,智能云团队主抓商业落地,构成了百度自己的大模型商业落地模式。
本文讨论了当前大模型领域的主要观点,特别是对于大模型创业、商业化和落地的一些建议。文章引用了两人的对话,分别代表了不同的观点。朱啸虎主张大模型不应被忽视,而杨植麟更偏向于投资未来的有价值应用。然而,无论哪种观点,都不能否定技术派和市场派的观点的分歧。
尽管双方观点看似针锋相对,但有一个关键点是不变的,那就是无论技术派还是市场派,都需要考虑经济效益。这也意味着任何大模型项目的商业模式都必须产生足够的回报才能吸引投资者或消费者。
虽然国内对此最为热衷的企业是百度,但在其他地区,也有一些企业的做法值得借鉴。例如,阿里巴巴也有其在线销售和客户服务应用的产品线,而京东也计划在未来几年推出一些专门服务于零售业的AI产品和服务。
在介绍了百度智能云的五款新模型后,文章指出“效价比”是一个非常重要的概念。在选择模型时,不仅要考虑模型本身的表现,还要考虑到模型的成本和实现难度。这种观点强调了技术的发展趋势和价值导向,也提醒我们在选择模型时要有明确的目标和预期。
最后,文章提到未来的大模型还有很长的路要走。无论是技术的进步,还是市场的变化,都可能影响大模型的未来发展。因此,我们需要持续关注大模型的最新动态,并积极寻找适合自身需求的最佳解决方案。