Kimi推出了能输入200万字的长文,我们计划在今年推出多种模态产品。

2024-03-19 热点资讯 关注公众号

界面新闻记者 | 于浩

界面新闻 | 文姝琪

3月18日,月之暗面宣布其对话式AI助手产品Kimi智能助手现已支持200万字的无损上下文输入。在去年10月发布时,Kimi可支持的无损上下文输入长度为20万字。

与此同时,月之暗面还为Kimi智能助手提供了更多数据源。据月之暗面工程副总裁许欣然介绍,当面对一个问题时,Kimi智能助手会尝试不同的方向搜索并据此做出回答;在回答速度上也有提升,许欣然表示,基于infra层的优化,Kimi智能助手生成速度较去年10月份提升了三倍。

目前,Kimi智能助手已上线了网页版、安卓、iOS、小程序应用。据SimilarWeb数据显示,Kimi智能助手网页版于今年2月的访问量为291.9万,同比上月增长104.99%。 

上下文窗口一直是各家大模型公司技术角逐的重点。

在长文档问答、长文本摘要等多种应用场景中,上下文窗口尤为重要。在接受腾讯科技专访时,月之暗面CEO杨植麟曾将大模型形容作计算机,long context(长上下文)形容作计算机的内存。在他看来,这是将新计算范式变成更通用的基础。 

提升上下文长度也存在一些技术路线。如基于检索增强的RAG(retrieval augmented generation)方法、滑动窗口方式,但是这些方法在提升上下文长度的同时往往也会带来诸如智能水平下降、成本提升等负面效果。 

至于月之暗面的解决办法,杨植麟此前曾表示主要在两方面,一是创新网络结构,二是进行工程优化。许欣然在沟通会现场进一步称,上下文长度的无损提升需要在数据、Infra、模型训练、产品等层面协同合作才能实现,此次团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发。

随着上下文长度提升,Kimi智能助手的使用场景也被扩展。在读论文、分析财报等传统使用场景中,可以更精准地满足用户需求,此外,还扩展出桌上角色扮演游戏(TRPG)主持人等全新使用场景。 

kimi智能助手对《甄嬛传》剧本的分析

值得一提的是,上下文长度提升后也为模型评测带来难题。以往测评某一大模型产品的上下文长度时会采用“大海捞针”的方式,即将一个与文本无关的句子隐藏在大量的文本中,然后通过自然语言提问的方式(Prompt),观察AI能否准确提取出这个隐藏的句子。 

但随着业内都按照特定指标进行专项训练之后,大海捞针式的测评方法逐渐失去了原先的参考意义。当大模型上下文长度进一步提升后,评测的维度也会变得更加丰富。许欣然直言,目前在学术界这仍是一个有待探讨的开放式问题。

尽管月之暗面科技有限公司在长文本处理方面取得了进展,但其他AI企业在自然语言理解、多模态交互等技术领域的发展也不容忽视。Sora所展现出的视频生成能力使得Diffusion Transformer架构(DiT)初步成为业内共识,如生数科技、爱诗科技都表态称要在今年内追赶Sora。 

对于多模态方面的进展,此次沟通会上月之暗面并未对外披露。月之暗面联合创始人周昕宇表示,在Sora发布之前月之暗面就已经有多模态方面的研发,目前正在按照固有节奏推进,预计在今年将会有相关产品发布。

在成立不到一年的时间里,月之暗面已完成两笔大额融资,今年年初完成超10亿美元融资之后,公司估值更是来到了25亿美元,但其公司规模仍在80人左右。对此周昕宇回应称,人才密度比人数更重要,未来会按照需求进行人员扩张,“招的每一个人都要提高团队平均水平。”


经过三年的技术积累和持续的研发,月之暗面最近又取得了重要的突破。他们的对话式AI助手产品Kimi智能助手现在已经支持了200万字的无损上下文输入,并且在回答速度上有显著提升。这种技术的进步不仅使Kimi能更好地理解和处理长文档问题,而且还可以大大缩短用户的等待时间。
然而,虽然Kimi智能助手的成功让我们感到骄傲,但也引发了一些关于如何提升上下文长度以适应更大范围的需求的问题。杨植麟曾经提到,为了提高上下文长度,他们需要不断创新网络结构和进行工程优化。但是他也指出,对于如何更好地评估和改进一个AI模型的效果,现有的评测方法还有待进一步研究。
随着上下文长度的提升,Kimi智能助手的应用场景也在不断拓宽。除了传统的阅读论文、分析财务报告等场景外,他们还在尝试新的使用场景,比如桌上角色扮演游戏中的主持等。
尽管月之暗面公司在自然语言处理和多模态交互等领域取得了进展,但仍然有很多挑战需要克服。他们可能会继续寻求新的融资渠道,以支持公司的持续发展。同时,我们也期待看到他们在未来的研究成果中取得更多的突破。

上一篇:红色“泼天”!冰岛火山三个月来第四次喷发,会影响全球气候吗?
下一篇:突发两大利空!A股午盘跳水,日本央行首次加息,外资砸盘超70亿
更多更酷的内容分享
猜你感兴趣
Kimi智能助手可以无限次地存储和处理200万汉字的无损输入。预计在今年内,它还将推出多种模态模型。

Kimi智能助手可以无限次地存储和处理200万汉字的无损输入。预计在今年内,它还将推出多种模态模型。

月之暗面在北京办公室宣布在大模型长上下文窗口技术上取得突破。月之暗面创始人表示,大模型无损上下文长度数量级提升将有助于AI应用场景想象以及更好地理解和实现复杂的任务,未来也将推出自研的多模态大模型并推进商业化进程。

热点资讯 03.19
国产大模型正在快速成长,提高了Kimi的输入效率。

国产大模型正在快速成长,提高了Kimi的输入效率。

国内AI创业公司月之暗面在大模型长上下文窗口技术上取得突破,Kimi智能助手“长文本”输入量提升10倍,将进入内测阶段。长文本能力成为公司未来发展的重要驱动力,有望深度赋能下游内容端需求,为新质生产力提供持续输出。相关公司包括昆仑万维、华策影视、因赛集团、易点天下、中文在线、风语筑、巨人网络、捷成股份、视觉中国等。此外,办公软件如金山办公、福昕软件、多模态如万兴科技、美图公司(与海外团队联合覆盖)、虹软科技、光云科技等领域也将受益于这次长文本能力突破。

热点资讯 03.21
开放式人工智能研究团队计划在秋季推出最新推理AI产品——草莓,引领未来智能革命!

开放式人工智能研究团队计划在秋季推出最新推理AI产品——草莓,引领未来智能革命!

OpenAI计划今年秋季推出代号为草莓的人工智能产品,该产品是一个聊天机器人,目标是解决以前聊天机器人都不能解决的数学问题,并被训练来处理编程相关的问题。

热点资讯 08.28
一线推送最新消息!200万字的长篇小说,Kimi智能助手已正式上线。快来阅读,感受文字的魅力吧!

一线推送最新消息!200万字的长篇小说,Kimi智能助手已正式上线。快来阅读,感受文字的魅力吧!

月之暗面展示了其在大模型长上下文窗口技术上的最新突破,Kimi 智能助手可支持长达 200 万字超长无损上下文,于即日起开启产品“内测”。该突破有助于打开对AI应用场景的想象力,包括完整代码库的分析理解、可以自主帮我们完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。而通往通用人工智能(AGI)的关键之一是无损的长上下文。

热点资讯 03.19
华为三折叠手机是否将于近期发布?小米荣耀的布局动作是否值得关注?

华为三折叠手机是否将于近期发布?小米荣耀的布局动作是否值得关注?

小米2022年12月21日提交三折叠手机外观设计专利

热点资讯 09.19
新款电动车强制性国标发布,新增多项标准让你出行更安心

新款电动车强制性国标发布,新增多项标准让你出行更安心

工业和信息化部等多部门对《电动自行车安全技术规范》进行公开征求意见,做了很多改进和提升,提高了防火阻燃性能、防范非法改装行为,优化了电动车额定功率和最高转速的测试方法,提升了产品实用性,包括降低火灾事故风险、减少非法篡改行为、动态安全监测、提升续航里程等。此次新修订的标准旨在提升电动自行车产品的安全水平,促进行业的规范化发展,保护人民群众生命财产安全。

热点资讯 09.19
IBM裁员人数超过1000人,其中大部分集中在50-55岁的职场精英群体

IBM裁员人数超过1000人,其中大部分集中在50-55岁的职场精英群体

本文报道称,根据一位IBM内部员工透露的信息,该公司的美国总部近期秘密进行了大规模裁员,受影响的数千人。裁员的原因与传统裁员不同,本次裁员未经正式通知。该员工表示他的经理告诉他必须签署保密协议才能讨论具体细节。据悉,IBM在全球约有288,000名员工,且在2023年末,已经裁员3,900人。该公司正在考虑调整人力配置以满足AI需求,并在印度和其他地区招聘新职位以确保员工数量稳定。该裁员可能导致约5,200个职位减少,涉及4亿美元的费用。目前还不清楚在这次裁员中哪些职位会被关闭或转至印度。此外,由于泄露事件的影响,一些招聘信息已被替换为招聘其他地点。至于新职位的具体位置和时间,公司方面尚未给出明确答复。该公司股价在过去三个月内上涨了33%。

热点资讯 09.19
2023年中国MCU市场规模持续扩大至282亿美元,领先全球

中国MCU市场规模稳步增长至282亿美元,占据全球主导地位

2023年中国MCU市场有望突破282亿美元,引领全球消费电子趋势

中国MCU市场增长强劲,已超全球平均水平,未来前景广阔

2023年中国MCU市场规模持续扩大至282亿美元,领先全球 中国MCU市场规模稳步增长至282亿美元,占据全球主导地位 2023年中国MCU市场有望突破282亿美元,引领全球消费电子趋势 中国MCU市场增长强劲,已超全球平均水平,未来前景广阔

新冠疫情期间加剧芯片供应紧张,推动MCU价格上涨;厂商逐渐转向成本更低、性能更强的Arm生态系;但取代率上升可能促使MCU价格继续下滑。预计未来几年MCU平均单价会跌至0.88美元。整体来看,MCU价格将持续波动。

热点资讯 09.19
越南欲通过新铁路项目加强与中国老挝的合作

越南欲通过新铁路项目加强与中国老挝的合作

越南政府成立特别工作组,负责实施连接越南与中国和老挝的铁路投资项目。

热点资讯 09.19
重庆紧急发布高温红色预警,最高温预计将达40摄氏度以上!

重庆紧急发布高温红色预警,最高温预计将达40摄氏度以上!

重庆市气象局发布高温红色预警信号,预计未来15小时内,重庆市13个区县海拔400米以下地区将出现高温天气,并伴有强烈日照和酷热感,需注意防暑降温。 详细信息:重庆气象局发布高温红色预警信号,预计未来15小时内,重庆市13个区县海拔400米以下地区将出现高温天气,并伴有强烈日照和酷热感,需注意防暑降温。

热点资讯 09.19
蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来打算收购奥迪在比利时沃斯特的工厂,以降低关税并提升产品在欧洲的销售能力。尽管面临国内市场竞争和欧洲不确定性的风险,但收购被认为是一个合理的决策。目前,该工厂已在挪威、德国、荷兰、瑞典和丹麦等地启动运营,并已成功交付首批用户。

热点资讯 09.19
港媒揭示:美国持续投入巨额补贴仍未能撼动中国稀土的地位

港媒揭示:美国持续投入巨额补贴仍未能撼动中国稀土的地位

场上的领导地位不可动摇。在稀土资源开发方面,中国将继续占据主导地位,这得益于其丰富的资源储备和多年的技术积累。然而,西方国家为了摆脱对中国的依赖,正在采取一系列措施,包括投资建设稀土工厂以增强供应链自主性,但成效有限。面对稀土价格波动这一难题,中国政府增加了稀土开采配额并遏制了市场供应过剩,这让其他国家的稀土项目发展受到了影响。同时,一些企业也面临着资金困境和市场竞争压力。综合来看,中国将继续掌控全球稀土市场,并有望在未来发挥更大的影响力。

热点资讯 09.19
Marvell联合创始人周秀文逝世,科技界损失一位重要人物

Marvell联合创始人周秀文逝世,科技界损失一位重要人物

周秀文于9月18日在印度尼西亚雅加达出生并学习汽车配件店零件组装知识,然后在美国攻读了电机工程学士和博士学位,并在加州大学伯克利分校获得硕士和博士学位。其团队创建了Marvell Technology公司,希望制造出能产生“奇妙”效果的设备。周秀文去世的消息引发广泛关注,尽管传统观点认为这种方法不切实际,但Marvell很快成为了许多全球领先的科技公司的重要合作伙伴。

热点资讯 09.19
国产光刻机进展为何落后于国际大厂?关键并非此点

国产光刻机进展为何落后于国际大厂?关键并非此点

中国的工业部发布了最新的光刻机技术——第六代光刻机,相较于第二代和第三代设备,具有较强的迭代升级空间。此款设备被广泛认为是阿斯麦15-20年前的产品,主要用于55-65纳米的工艺。尽管相比七纳米工艺存在一定差距,但随着技术的不断升级,其发展空间依然很大。未来几年,先进的国产光刻机将有机会大规模应用,而十年内,有望实现大规模生产。关于这个问题,有些人将其归咎为引进阿斯麦的技术,但实际上,这两款设备都是公认的第四代光刻机,与第三代和第二代并无区别。我国通过不断迭代升级,已经达到了可以生产7纳米工艺的水平,这使得我们无需过分纠结于光刻机的细节参数。重要的是,光刻机的研发和生产已经得到了广泛认可,且完全满足了市场需求。所以,我们应该理性看待此类问题,积极寻找更有利于国内光刻产业发展的解决方案。

热点资讯 09.19