Kimi一夜成名后,各大厂商纷纷展开激烈竞争。

2024-03-23 热点资讯 关注公众号

《科创板日报》3月23日讯(记者 张洋洋)月之暗面不再“晦暗”。近期,由这家公司创作的大模型应用kimi,吸引了大量目光。kimi产生的效应已经从大模型圈外溢至资本市场,kimi概念股在本周应运而生。用户激增,巨大流量突然涌入,甚至让kimi服务器一度宕机。

kimi在这一轮大模型应用当中突围,核心优势在于长文本读取和解析能力。颇为巧合的是,就在22日晚间,阿里高调宣布通义千问开放1000万字长文本能力。360当晚紧随其后,宣布360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

而据《科创板日报》了解,百度也将在下个月开放200万-400万的长文本能力。

阿里巴巴、百度等互联网巨头纷纷布局并升级自家的大模型产品,强化长文本处理能力,正让业界重新审视长文本处理在大模型领域的必要性和重要性。而随着kimi的崛起,这也让大模型的讨论焦点从大模型本身转移到了应用端,2024年是否会成为AI大模型应用落地元年?

▍长文本是必要的吗?

相较于其他大模型应用,kimi的长处在于长文本分析联网搜索、文档处理和等功能上,尤其在深度解析厚重书籍方面,其性能远超远超其他模型。3月18日,月之暗面甚至一口气将无损上下文长度提升了十倍,直达200万字级别。

据目前的用户体验来看,kimi也不是全能选手。有用户反馈表示,对于一些较为困难的任务,包括结构化信息处理和图像中潦草文字的识别,对话连续性上,kimi仍显示出一些短板。在生成能力和语音能力上,目前kimi还未加入这些模态。

尽管如此,长文本能力的重要性不言而喻。目前,市面上的大模型应用,GPT-4Turbo-128k公布的文本范围约为10万汉字,Claude3200k上下文约16万汉字。

一家AI上市公司大模型架构业务人士告诉记者,由于模型训练结构的限制,以往大模型的文本范围都不算长,但复杂任务和行业知识通常是长篇巨制,这种情况下,只能拆分输入提问,但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文,满足理解和问答的需求,长文本能力在此时是具备优势的。

而国内大厂们,则正在长文本领域快速布局。

《科创板日报》记者从知情人士方面了解到,百度在下个月将对文心一言进行升级,届时也将开放长文本能力,文本范围在200万-500万。目前,文心一言的文本最高上限在3.2万。

而阿里已经先行一步。22日晚间,阿里的通义千问官宣升级,向所有人免费开放1000万字的长文档处理功能。用户可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

360紧随其后,其在当晚宣布,360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

kimi成功在前,阿里、百度、360先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗?

上述大模型架构人士表示,长文本能力目前在训练和效果上仍存在一些难点,比如如何避免遗漏细节。事实上,文本长度也可以通过RoPE等算法技术去拓展,但是此时会严重丢失细节,这就导致输出效果不准确。因此,核心标准是看输出结果的精准性连贯性,并不是文本长度越长越好。

另外一名大模型行业人士也告诉记者,长文本实际是大模型的基础能力,只要算力资源足够,理论上长文本可以追求无限长,“但是如果使用场景根本用不上长文本,那么此时的长文本就没有任何意义”。

▍2024年是大模型应用落地元年吗?

kimi的火爆,一定程度上也反应了当下国内大模型的发展阶段,从打基建开始走向应用落地。那么,2024年是否会成为AI大模型应用落地元年?

澜舟科技CEO周明认为,从长远来看,人工智能在逼近AGI。而经过去一年的发展,大模型已经具备了落地的能力,企业侧也积攒了很多业务落地场景。加上国家政策的推动,2024年将会是大模型落地元年。

零一万物联合创始人祁瑞峰也表达了类似的看法,但他是聚焦在B端场景。目前,生成、理解、摘要和对话等应用仍占据主导,但随着新一代模型推理、决策和执行能力的提升,有望更快地将AI技术植入企业业务系统,真正开启大模型赋能的腾飞。

电商是AI应用最具代表性的领域之一。魔珐科技目前是阿里妈妈、淘宝直播生态官方指定的3D超写实虚拟直播服务商,旗下有一款3D虚拟人直播AIGC产品“有光”。

魔珐科技CEO柴金祥在接受《科创板日报》记者采访时表示,电商是公司AI产品应用的最主要一个行业。从已有的使用效果来看,多个知名头部美妆品牌在使用魔珐科技提供的3D虚拟人后,午夜6小时的直播时段内累计年GMV增量高达数千万。3D虚拟直播午夜超级直播广告投放高于行业均值2倍以上,ROI大于5倍。

尽管2024年被寄予厚望,但是各方仍然保持着审慎乐观的态度。

祁瑞峰认为,在C端市场,目前成本还很高,商业模式还未完全跑通。即便是对于现在已经可以创收的B端市场,周明也认为,要想做好产品标准化和完整交付,训练和部署成本、行业适配能力、幻象问题、数据安全四方面的问题,还有待解决。

梦饷科技CTO曾均涛在接受《科创板日报》记者采访时表示,虽然AI在电商行业的应用,想象空间非常大,梦饷也在通过GPT大模型重构业务场景,包括解决模特图片生成、素材差异化、服装秀、AI创作助手、聊天室导购等问题。

“但是现在的阶段,基础设施并不完善。”曾均涛告诉记者,梦饷在去年为创做了AI创作平台,虽然能生成模特图,但是成图率并不高,还是需要技术升级和内部做技术提示词、算法模型的调优,这个平台到现在还没有开放,“现在大家都在找应用场景,估计2024年开始能够看到更多AI、大模型带来的变化”。

在42章经创始人曲凯看来,2024年仍会是技术上不断突破的一年,很难真的做到大规模的落地和有非常多的场景,不过,不管是在B端还是C端,今年有望看到更多应用开始跑出来。与此同时,应用端的项目今年也将更受投资人青睐。

“去年大家投了非常多资金和精力在大模型本身,要想将这个故事持续下去,就需要有落地,因此会在应用端继续探索,找到PMF(Product Market Fit,产品市场匹配)。”曲凯说。

(财联社记者 张洋洋)


经过几轮的浪潮涌动,大模型应用无疑已经成为人工智能领域的热门话题。而在这股热潮之下,各类大模型公司的竞争更加激烈,其中Kimi凭借长文本处理的能力脱颖而出。这不仅是因为它的长文本阅读和解析能力强,更是因为它能够通过复杂的模式将大型文本处理得更高效。然而,面对如此强大的竞争对手,我们是否有必要过度依赖它们呢?让我们来探讨一下这个问题。
首先,我们需要明确的是,Kimi的成功并非偶然。近年来,各种大模型都在纷纷研发出更先进的技术,例如能够处理大规模文本数据的深度学习模型。然而,要达到这样的水平,关键还是在于研究者们的投入和积累。在短时间内提高大模型的处理能力并不是长久之计,只有深入理解模型的本质和原理,才能真正做到自主优化。
其次,我们不能忽视的是,即使是Kimi这样的大模型,也需要人类的参与和指导。特别是在复杂的任务中,机器无法替代人类的专业判断和经验。此外,Kimi的长文本处理能力也有其局限性,它无法理解非语言信息,也不能应对突发事件。这些都是目前大模型无法解决的问题。
因此,尽管大模型有着巨大的潜力,但我们也不能过分依赖它们。在未来,我们需要充分利用现有的技术和人才,以及传统的思维方法,这样才能在人工智能的道路上走得更远。同时,我们也应该加强对大模型的理解和使用,使其更好地服务于我们的生活和社会。

上一篇:揭秘 Cerebras Wafer Scale Engine 3:AI 算力新秀
下一篇:对Temu的预估还是保守了
更多更酷的内容分享
猜你感兴趣
中国技术崛起,德系日系韩系车厂竞相争夺市场份额

中国技术崛起,德系日系韩系车厂竞相争夺市场份额

随着合资汽车品牌的滑坡,国内外主机厂正纷纷拥抱中国本土技术,以应对日益激烈的市场竞争。同时,电动汽车逐渐成为一种科技趋势,这也促使许多国际车企认识到了合作的重要性。他们将在中国生产车辆时引入当地的技术和软件,从而提升竞争力。

热点资讯 05.06
电商巨头为何纷纷取消预售?原因深度解析

电商巨头为何纷纷取消预售?原因深度解析

暂停预热。同时,预售也让电商平台具备了更快响应市场变化的能力。如今,各大电商平台放弃预售的原因主要有以下几点: 1. 成功案例影响减弱:随着其他电商平台加入预售模式的趋势,淘天的成功故事已经不再那么引人注目。 2. 管理难度加大:随着商品量的激增和物流压力的增大,商家原有的库存管理系统已无法满足日益增长的需求。 3. 市场需求改变:传统预售模式依赖于用户的定金支付意愿,但用户行为的复杂性和不确定性使得这一模式的稳定性受到质疑。 4. 资金回收困难:由于预售涉及到一次性支付大量款项,且部分消费者可能存在资金紧张的情况,这使得商家在利用预售来筹集资金时遇到了难题。 5. 监测和决策效率降低:相较于传统的营销手段,预售无法提供实时的数据支持和反馈,对于电商平台的运营决策产生了影响。 总之,虽然预售模式给电商行业带来了一些积极的变化,但在当今竞争激烈的市场环境中,各大电商平台逐步放弃预售模式,转而采取更为灵活、多元化的营销策略。这是因为预售模式既存在成功案例,也可能面临诸多挑战,而且其对资金流动、市场需求以及市场监测和决策的影响有限。

热点资讯 05.15
《歌手2024》第三期歌单发布:彩排反馈与最后一轮竞争激烈?

《歌手2024》第三期歌单发布:彩排反馈与最后一轮竞争激烈?

随着《歌手2024》第三期临近,各参赛选手的表演歌单已公布,其中还有部分歌手彩排照在网上流传。网友评价该曲单涉及保守与激进选择,部分歌手的选择引起争议。此次赛制有望借鉴前几季经验,减少淘汰歌手,实行返场演唱。

热点资讯 05.24
地震威胁下美光DRAM产能受限,内存厂商纷纷暂停报价

地震威胁下美光DRAM产能受限,内存厂商纷纷暂停报价

美光的报价目前还没有恢复

热点资讯 04.07
美国副国务卿声称:中国是重大挑战, 冷战不再具有重要性

美国副国务卿声称:中国是重大挑战, 冷战不再具有重要性

根据您提供的文本,我们可以提取出以下几个关键信息: - 中国是美国“史上最大挑战”,被视为美国面对的最大挑战。 - 坎贝尔对中国提出的挑战进行回应,并将其定义为“军事实力或经济主导地位的较量,以及影响21世纪和全球力量平衡的规则之争”。 - 双方之间的分歧主要集中在国防开支上,认为增加国防开支不能解决问题。 - 主席麦考尔强调中国威胁的存在,并对中国提出了“军事实力或经济主导地位的较量,以及影响21世纪和全球力量平衡的规则之争”的观点。 总结起来,文本突出了中美之间存在的战略挑战和分歧,同时也强调了中国在这一过程中所承担的责任。

热点资讯 09.19
中国象棋协会对王天一等人的处罚决定曝光,撤销特级大师称号,终身禁赛进行公示

中国象棋协会对王天一等人的处罚决定曝光,撤销特级大师称号,终身禁赛进行公示

中国象棋协会决定永久封禁王天一和王跃飞,并禁止二人参与任何象棋比赛和活动。此外,他们还将接受严厉处罚,包括终身禁赛和技术等级称号的撤销。中国象棋协会将展开全面清理,并要求社会各界对此保持监督。

热点资讯 09.19
炽烈之声:聆听一代代中国军人的誓言

炽烈之声:聆听一代代中国军人的誓言

这一代代中国军人向生死宣誓,始终忠于党,为人民和国家付出。他们挑战恶劣环境,克服困难,忠诚勇敢地履行职责。

热点资讯 09.19
明天下午至晚上海台“普拉桑”将影响浙江沿海地区,建议关注并做好防范措施

明天下午至晚上海台“普拉桑”将影响浙江沿海地区,建议关注并做好防范措施

今年第14号台风“普拉桑”预计于19日下午到晚上在浙江温岭到舟山一带沿海登陆(热带风暴级或强热带风暴级,9-11级,23-30米/秒)。请注意,大风将持续到20日。

热点资讯 09.19
金钟:美联储首次降息,中美经济可能有哪些波动?

金钟:美联储首次降息,中美经济可能有哪些波动?

美联储今年首次降息50基点引发市场热议,部分人质疑其应对经济不稳的措施,但也有市场将其视为降低资金成本的信号。不论何种解读,这一决定都将加大金融市场的波动性,带来潜在的风险。

热点资讯 09.19
中秋假期楼市交投平淡,二手房活跃度高

中秋假期楼市交投平淡,二手房活跃度高

衡6万一”的让利活动。此外,一些开发商也推出了购房优惠政策,如首付比例降低、优惠利率、赠品等。然而,无论是新房还是二手房,由于疫情的影响以及市场需求的变化,整体市场表现依然平淡。专家预测,随着九月底的临近,楼市政策有望迎来优化,四季度市场的成交量将有所回升。对于购房者来说,可以关注一下即将到来的购房优惠活动,以获取更多的购房优势。

热点资讯 09.19
揭秘低空经济新探索:应用场景及落地策略

揭秘低空经济新探索:应用场景及落地策略

2024年首次被写进政府工作报告的低空经济,近30个省份和城市的政府工作报告提出大力发展低空经济及通用航空。其中,长三角地区城际间低空航线正在密集开通,昆山到浦东的载客直升机航线仅需飞行不到半个小时。 从2小时缩短到半小时,苏州高新广场直航中心到南通仅需25分钟,无锡硕放机场仅需12分钟。同时,航空运动、空中旅游、飞行培训、应急救援等领域都具有巨大的发展潜力,有望成为低空经济的重要增长点。例如,长沙湘江新区的航空应急救援基地,能快速响应临近事故点开展应急救援任务。

热点资讯 09.19
洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

江南五虎在江浙地区崛起,占江苏白酒市场份额近40%,竞争日益激烈。 黄山归来,犹如一幅画卷,把古老的中国文化装点得独具魅力。

热点资讯 09.19
女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

深圳男子PPT揭露出轨事实,自称曾下跪哀求女友不要举报。

热点资讯 09.19
外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

9月18日,深圳日本人学校10岁学生遭男子刺伤,已被现场捕获。中方继续采取有效措施,保障在外中国人的安全。

热点资讯 09.19