真伪较量,国产大模型激烈竞争。

2024-03-25 热点资讯 关注公众号

文|郝 鑫

Kimi有多火爆?凭一己之力搅乱A股和大模型圈。

Kimi概念股连日引爆资本市场,多个概念股随之涨停。在一片看好的态势中,谁都想来沾个边,据光锥智能不完全统计,目前,至少有包括读客文化、掌阅科技、万兴科技等在内的十家上市公司发布公告透露正在了解或接入了Kimi 智能助手。

眼看着Kimi的火越烧越旺,大厂也垂涎三尺,连夜加入了大模型“长文本” 的四国大战。

对标月之暗面Kimi 智能助手的200万字参数量,百度文心一言将在下个月开放200万~500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍;阿里通义千问宣布升级,开放最高1000万字的长文本处理能力;360智脑正在内测500万字,功能正式升级后将入驻360AI浏览器。

四家中国大模型公司把长文本能力“卷”出了新高度。作为参考,目前,大模型最强王者OpenAI的GPT-4 Turbo-128k可处理文本能力约为10万汉字,专攻长本文的Claude3-200K上下文处理能力约为16万汉字。

但同样都是“长”,有人是孙悟空,有人是六耳猕猴。

一位大模型行业的人士向光锥智能表示:“确实有一些公司用RAG(检索增强)来混淆视听。无损的长文本和RAG,两项技术各有优势,也有结合点,但归根到底还是不同的技术……很容易就用‘长本文’来混淆视听。”

“百度、阿里、360,大概率都使用了RAG方案”,该业内人士表示道。

无论是RAG还是长文本,一味地“长”并不能代表所有。如同上一轮,大模型厂商“卷”参数,大模型参数不是越大就越好,文本长度,也不是越长,模型效果就越好。除了上下文长度,记忆能力、推理能力、算力都是共同的决定性因素。(详细观点请参考《卷完参数后,大模型公司又盯上了“长文本”?》一文)

进入2024国产大模型落地元年,大模型应用千千万,为什么是长文本能率先掀起波澜?基于长文本的特性,又能解决哪些AI应用落地的实际问题呢?

长文本,真的越长越好吗?

自ChatGPT诞生以来,国外一直在持续不断地涌现出新的AI应用,产生流量的同时,也令人看到了商业化的可能性。

据风险投资公司a16z近期发布的《GenAI 消费应用 Top100 报告》显示,用户月访问量最大的应用网站中,类ChatGPT的效率助手占据了榜单前十的大壁江山,ChatGPT的每月网络访问量接近20亿次,第二名Gemini的每月访问量约为4亿次。

但同样AI应用活跃而繁荣的场景却并没有在中国成功上演。在月之暗面的Kimi 智能助手凭借流量和人气出圈之前,国内能够达到一定体量的应用只有两个,一个是百度推出的文心一言App,另一个是字节跳动推出的豆包。

据相关数据统计,截至2023年9月,百度文心一言App的月活量达到最高峰值710万;同年12月,字节豆包月活达到200万,2024年1月在此基础上翻了一番达到400万。

文心一言凭借百度的大模型先发优势和搜索流量优势,一度成为国内流量最大的AI应用;而豆包背靠抖音流量转化池,虽然发布时间稍晚一步,但在后期实现了反超。

在这样背景之下,Kimi的爆火显得尤为特殊,某种意义上可以说,Kimi是国内第一个靠产品能力和用户自来水破圈的AI应用。

月之暗面创始人杨植麟曾告诉光锥智能,其团队发现正是由于大模型输入长度受限,才造成了许多大模型应用落地的困境,这也是月之暗面聚焦长文本技术的原因所在。

站在用户角度来看,好不好用是检验AI应用产品最关键的指标,而这都依赖于Kimi背后的长文本技术。

若将长文本的能力进一步拆解,大致可以包括长度、记忆、理解、推理几个能力。

越来越长的文本长度,可以进一步提升现在AI应用的可用性和专业性。

对普通用户而言,与AI助手简短的闲聊能够引起兴趣,但不能解决问题,特别对于法律、医学、金融等一些专业领域,需要前期“喂”给大模型特定的数据和知识,才能精准地输出答案;对企业而言,更需要一个“专家型”的助手,大量的企业数据、行业数据都需要提前导入,没有损耗地输入和输出,从而保证最后的分析结果具有可参考性。Claude就是一个典型的例子,凭借长文本的优势与ChatGPT走出不同的路线,收获了大量的2B垂直行业的企业用户。

多轮对话和记忆能力可以直接应用到现在大部分的场景中,比如游戏场景中的NPC,通过长文本输入给予其角色设定,玩家每一次的对话都会被记录,并且能够生成个性化的游戏档案,避免了重新登录而需要反复唤醒的问题;在执行Agent(智能体)任务场景,能够增强记忆能力,辅助Agent形成清晰的行动步骤,避免出现Agent打架的现象。

长文本的理解和推理能力体现在两个方面,一类是对想象类的应用理解生成,一类是对逻辑类应用的生成。例如在对AI小说的应用中,长文本的能力体现在能够理解用户输入的prompt,对其想象性的扩写;在编程、医疗问答等领域,则需要调用其逻辑的推理能力,合理化地续写编程,根据用户描述推理病状。

月之暗面副总裁许欣然曾表示,大模型无损上下文长度的数量级提升,将进一步打开对 AI 应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

所以,长文本从来都是一项综合性的能力,而非越长就越好。相反,过分追求长,可能引发算力匮乏的问题。

大模型公司卷“投流”,一天获客成本20万

流量狂飙、宕机后五次扩容;日活用户数达百万,月环比增长率107.6%;赶超微信、杀进App Store免费版应用第五名,月之暗面交出了一份漂亮的成绩单。

但这也只是一个开始,多位业内人士在今年刚开年曾向光锥智能透露,走过高速技术迭代的2023年,大模型来到了产业落地和商业化的下半场。

去年,各家已经相继亮剑,智谱、百川、面壁不同程度上都开启了商业化。月之暗面稍慢,目前还未公布商业化的方案,但急切地开始了商业化加速进程,B站、抖音等社交平台都能看到Kimi助手投流的广告。

尽管,各家都从未将2C的变现路线排除在外,但是延续2016年AI 1.0时代的思路,多数还是将2B作为了首要的突破口。有了技术,去找技术和产业落地方向,探索落地方案似乎成为了理所应当。

月之暗面则是大模型公司的另类,去年10月份第一次公开露面后,就瞄准了2C的应用市场。杨植麟曾表示,长文本是月之暗面根技术,在这技术之上可以分裂出不同场景和领域的2C应用。

在Kimi效应爆发前,就有很多普通和企业用户反馈,“Kimi是国内最好的AI助手,没有之一”,从一开始就注重产品效果和用户体验的Kimi,现在爆发似乎带有一定的必然性。

商业化压力之下,大模型公司大概率会选择2B、2C两条腿走路。对比其他大模型公司,月之暗面则又提供了另一种商业化的路径参考,其他玩家从先2B再2C,以2B拉动2C,而月之暗面则属于先2C后2B,再以2C的产品拉动2B的单子。

毕竟,除了国外的ChatGPT,之前在国内根本看不到2C产品增长的案例。Kimi靠近半年的积累,凭一己之力在2C撕开了一道口子,众多大厂或许是看到了2C更多的可能性,才急于下场向市场证明自身具备长文本能力。

但回到商业化赚钱的本质,仍要思考如何将一时的流量转化成实打实的付费率。

光锥智能观察发现,现在大部分的大模型公司在推产品时还是互联网推流的那一套,旧瓶装新酒,抖音、B站、小红书投流推广,在线下的写字楼电梯、机场、地铁打广告。

一通操作下来的实际转化率有多少尚未可知,但为获客花出去的都是真金白银。据新浪科技报道,有投资人透露,目前Kimi用户获客成本达到12元~13元。根据下载量预估,Kimi近一个月来日均下载量为17805。按此计算,Kimi每天的获客成本至少20万元。

现在市面上大部分的AI助手都是免费下载使用,基于网络负外部效应,当用户越来越多的时候,其资源的耗损就越来越大。此次的Kimi宕机事件就是最好的例证,顺时暴涨的用户量给算力和服务器都造成了压力,与之带来的还有大量的token成本的消耗。

对大模型公司而言,规模化、付费率和成本的三方拉扯问题,短时间内无法得到解决,即使是流量吊打其他应用的ChatGPT也面临盈亏平衡的困境。

据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。OpenAI预测,对于压缩成本后的GPT-3.5模型和GPT-4模型,若月付费率每月提升0.25%或不能持续;若月付费率每月提升0.5%或能扭亏。

月付费率不断提升听起来很性感,但现实却是“未老先衰”,爆发性的增长还未迎来,增长停滞先一步到来。

对大模型厂商,特别是创业公司来说试错的机会并不多,不能刚从技术的坑出来,又一头扎进投流的坑,跟风长文本不能解决所有问题,跑出商业化模式才是。


结论:中国的AI巨头们正纷纷入场投入大模型,准备打造自家的AI助手,竞争激烈。然而,过度依赖“长文本”可能会导致计算力短缺、拥堵等问题,这无疑会给大模型厂商带来巨大压力。不过,无论是一味地“长”还是一味地“减”,AI助手的核心应该是提高效率、解决实际问题,这是评价其价值的关键。
建议:
1. 在加大技术研发的同时,确保AI助手能够在有限的内存和计算能力下提供高效率服务。
2. 合理规划产品的商业模式,既要关注用户的体验,也要考虑到公司的成本支出,防止大规模投放时陷入盈利困境。
3. 要充分认识到技术的局限性,不能盲目追求“长文本”,应该找到适合自己的商业道路,同时寻求与其他AI公司的合作和共享资源,以便实现更好的收益。
4. 创业公司应积极尝试新的商业路径,如构建全方位的AI解决方案,通过优化算法和数据收集策略,寻找合适的投资机会,而不是盲目跟风或者只能依赖传统盈利模式。
5. 在推进商业化的过程中,应该保持警惕,避免大机器冲击传统AI市场,而忽视AI应用的社会价值和用户需求,这对于AI产业的发展至关重要。

上一篇:先进封装火热背后,材料市场不容忽视!
下一篇:电连技术:公司对英伟达有部分产品的研发送样
更多更酷的内容分享
猜你感兴趣
丰田中国产量下降21.7%,凸显国内汽车市场竞争激烈

丰田中国产量下降21.7%,凸显国内汽车市场竞争激烈

丰田公布5月生产、销量数据:连续四个月下滑,中国市场份额受挤压 来源:快科技

热点资讯 07.01
中国式突围:大模型竞争的新时代挑战与机遇

中国式突围:大模型竞争的新时代挑战与机遇

浪潮信息提出“以应用为导向,以系统为核心”的战略路径,支持以开源开放、多元多模的方式激发生态创新,以应对即将到来的企业大模型落地潮。此做法可以助力中国人工智能技术走出差异化的道路。

热点资讯 04.24
仇保兴:AI大模型在国际竞争中的生产力决定因素

仇保兴:AI大模型在国际竞争中的生产力决定因素

仇保兴在2024新京智库春季峰会上指出,人工智能近年来突然爆发,主要是源于两个发展阶段:符号主义时期的低下发展和连接主义时期的过早突破。当前中国人工智能技术发展仍面临与美国相当大的差距,并存在人工智能投资泡沫等挑战。

热点资讯 04.14
文心一言日调用破5亿,大模型生态激烈竞争引关注

文心一言日调用破5亿,大模型生态激烈竞争引关注

百度首席技术官王海峰宣布,文心一言已经超过了3亿用户,并且日调用次数也达到了5亿。同时,百度也展示了文心大模型4.0 Turbo的最新版本,可以支持网页、APP和API使用,以满足更多企业和用户的需要。这一举措旨在使大模型变得更加有用,吸引更多的开发者和用户。此外,王海峰强调,大模型的发展还需要技术和资金的支持,同时,耐心和专注也是决定比赛结果的关键因素。

热点资讯 06.29
蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来打算收购奥迪在比利时沃斯特的工厂,以降低关税并提升产品在欧洲的销售能力。尽管面临国内市场竞争和欧洲不确定性的风险,但收购被认为是一个合理的决策。目前,该工厂已在挪威、德国、荷兰、瑞典和丹麦等地启动运营,并已成功交付首批用户。

热点资讯 09.19
港媒揭示:美国持续投入巨额补贴仍未能撼动中国稀土的地位

港媒揭示:美国持续投入巨额补贴仍未能撼动中国稀土的地位

场上的领导地位不可动摇。在稀土资源开发方面,中国将继续占据主导地位,这得益于其丰富的资源储备和多年的技术积累。然而,西方国家为了摆脱对中国的依赖,正在采取一系列措施,包括投资建设稀土工厂以增强供应链自主性,但成效有限。面对稀土价格波动这一难题,中国政府增加了稀土开采配额并遏制了市场供应过剩,这让其他国家的稀土项目发展受到了影响。同时,一些企业也面临着资金困境和市场竞争压力。综合来看,中国将继续掌控全球稀土市场,并有望在未来发挥更大的影响力。

热点资讯 09.19
Marvell联合创始人周秀文逝世,科技界损失一位重要人物

Marvell联合创始人周秀文逝世,科技界损失一位重要人物

周秀文于9月18日在印度尼西亚雅加达出生并学习汽车配件店零件组装知识,然后在美国攻读了电机工程学士和博士学位,并在加州大学伯克利分校获得硕士和博士学位。其团队创建了Marvell Technology公司,希望制造出能产生“奇妙”效果的设备。周秀文去世的消息引发广泛关注,尽管传统观点认为这种方法不切实际,但Marvell很快成为了许多全球领先的科技公司的重要合作伙伴。

热点资讯 09.19
国产光刻机进展为何落后于国际大厂?关键并非此点

国产光刻机进展为何落后于国际大厂?关键并非此点

中国的工业部发布了最新的光刻机技术——第六代光刻机,相较于第二代和第三代设备,具有较强的迭代升级空间。此款设备被广泛认为是阿斯麦15-20年前的产品,主要用于55-65纳米的工艺。尽管相比七纳米工艺存在一定差距,但随着技术的不断升级,其发展空间依然很大。未来几年,先进的国产光刻机将有机会大规模应用,而十年内,有望实现大规模生产。关于这个问题,有些人将其归咎为引进阿斯麦的技术,但实际上,这两款设备都是公认的第四代光刻机,与第三代和第二代并无区别。我国通过不断迭代升级,已经达到了可以生产7纳米工艺的水平,这使得我们无需过分纠结于光刻机的细节参数。重要的是,光刻机的研发和生产已经得到了广泛认可,且完全满足了市场需求。所以,我们应该理性看待此类问题,积极寻找更有利于国内光刻产业发展的解决方案。

热点资讯 09.19
电子通讯市场的一次重大震动:中国消费者对美国产品态度的转变

电子通讯市场的一次重大震动:中国消费者对美国产品态度的转变

黎巴嫩多地发生涉及通讯设备爆炸事件,致死30多人,伤者3000多;中国有警惕,电子武器化提防。[[2]()]。

热点资讯 09.19
详尽解读五老星的五大能力:死神仅为一例!

详尽解读五老星的五大能力:死神仅为一例!

五老星五名老人听命于神秘人物伊姆,同时具备不死之身、魔法阵和心灵感应等能力,可能是由伊姆赐予的共同能力。这些能力分别可以让五位老人在各种情况下迅速恢复生命力、建立或破坏防御性魔法阵以及进行心灵沟通。

热点资讯 09.19
娃哈哈、农夫山泉供应商遭遇“烂苹果”危机

娃哈哈、农夫山泉供应商遭遇“烂苹果”危机

事件是安德利果汁公司供应商遭遇“烂苹果”危机,引起公众关注。该公司主要客户为统一、娃哈哈、农夫山泉等企业,而汇源却否认与该事件有关。公司位于礼泉县工业园区,入驻了17家企业。经市场监管局抽检发现,公司的同类型果汁产品质量存在问题。目前,公司正在进行整顿,暂停部分产品出库。

热点资讯 09.19
华为新挑战:竞争加剧!三折屏卷轴屏能否满足你的需求?

华为新挑战:竞争加剧!三折屏卷轴屏能否满足你的需求?

华为折叠屏手机的预约人数已达642万,预计2024年第二季度全球折叠屏智能手机出货量同比增长48%。 三星计划在2025年推出卷轴屏智能手机,屏幕将比MateXT更大,最高可达12.4英寸,并采用屏下摄像头。 由于中国手机厂商的进入,三星折叠屏市场份额逐渐下滑,今年一季度全球出货量暴跌42%,市场份额同比降25个百分点。 另外,小米公司获得了一项“手机及其主体”的外观设计专利,展示了小米三折叠手机的设计。

热点资讯 09.19
郑钦文确认参加2023年联合杯,引领中国国家队阵容连续两年征战世界大赛

郑钦文确认参加2023年联合杯,引领中国国家队阵容连续两年征战世界大赛

中国选手郑钦文将于2025赛季引领国家队参加联合杯。 联合杯是中国与多个国家和地区球队之间的混双比赛,将于今年举行。郑钦文将带领中国女子组合参加比赛。她将在第一轮对阵西班牙选手塞雷娜·威廉姆斯,如果获胜,她将成为第一位进入女单八强的亚洲球员。

热点资讯 09.19
内蒙古车祸:一辆小车与收割机相撞,造成一人死亡和四人受伤,目击者称该车似为逆向行驶

内蒙古车祸:一辆小车与收割机相撞,造成一人死亡和四人受伤,目击者称该车似为逆向行驶

一位名叫刘欣荣的中央广播网记者经过采访得知,9月18日在内蒙古赤峰市阿鲁科尔沁旗的一农田市场附近发生了一起交通事故,现场可见一辆小车和一辆收割机发生了碰撞,导致其中一辆收割机受损严重,同时一名乘客被困车内无法自行离开。据当地政府通报,事故发生的原因是车主在送孩子上学的路上发生了意外。目前,事故已造成1人死亡4人受伤,相关部门正在进一步调查中。

热点资讯 09.19