大模型指数更新了,你只需10分钟就能掌握飞行和下棋技巧,还能成为一名中医高手。 升级版的大模型已经来到,只需要短短的10分钟,你就可以掌握开飞机和玩策略游戏的技能,并且能成为一名中医高手。

2024-03-18 热点资讯 关注公众号

智东西(公众号:zhidxcom

 | 香草

 | 李水青

智东西3月18日报道,今天,国内大模型明星创企月之暗面(Moonshot AI)宣布智能助手Kimi上下文窗口提升至10倍,即日起支持200万字超长无损上下文。

▲Kimi升级至200万字上下文

200万字是什么概念呢?为了更直观地向我们展示,月之暗面工程副总裁许欣然在今日举办的沟通会上,接连掏出一摞摞厚重的打印纸,包括《甄嬛传》剧本、英伟达年度财报、《倚天屠龙记》、《中医内科学》等。这其中,最长的也不过百万字左右。

▲许欣然展示百万字书籍的打印厚度

Kimi智能助手于去年10月面世,当时支持20万汉字无损上下文输入,创造了消费级AI产品所支持的上下文输入长度纪录。而如今,在短短5个月时间里,其上下文长度就提升了一个数量级。

与此次升级同步,月之暗面团队还发布了一则“低调”的更名通知:Kimi Chat、Moonshot大模型分别改名为Kimi智能助手、Kimi大模型,以后只要记住Kimi就够了。

▲Kimi更名通知

即日起,Kimi的200万字升级开启内测,用户可登陆网页版首页申请体验。

体验地址:kimi.ai

一、

10

分钟速成开飞机、打德扑,

挖出长篇小说深层次细节

许欣然谈道,相比20万字长度,更长的文本输入首先能带来的变化就是解锁更多超长任务、复杂任务。过去只能整理50份简历,现在可以线性增长至500份。

月之暗面团队提出“10分钟速成定律”,指的是Kimi快速学习一个新领域的能力。人类要10000小时才能成为专家的领域,AI只需要10分钟,就能接近任何一个新领域的初级专家水平。

例如,上传几十万字的德州扑克的教程文档,再提出一个比赛开局,Kimi就可以分析比赛场上的局面,并提供出牌策略的指导。

▲Kimi速成打德扑

输入近百万字中医诊疗手册,同时描述病人的病症和提出分析步骤,Kimi立刻化身中医,给出了病因判断、治疗方法、药材配比等。

▲Kimi速成中医

丢给Kimi一本260M的开飞机手册,再向它提出多个飞机驾驶方面的疑问,它都能一一解答。

▲Kimi速成开飞机

除了中英文,Kimi还能直接阅读代码库文件,然后用中文写出详细清晰的代码库设计文档,即便是毫无注释的陈年老代码也能快速梳理出结构。

▲Kimi读代码

值得一提的是,虽然对于长文本大模型,大家都比较期待其“大海捞针”压力测试的表现,但许欣然指出,一个指标一旦开始被观测,研发团队自然就会专门针对测评基准进行优化。这样一来,指标就失去了参考价值,变成了无尽的“刷榜”游戏。

另一方面,“大海捞针”测试本身其实就相当于Ctrl+F检索,对模型能力本身的要求并不高。比起定向检索,用户更需要的应该是对复杂文本的理解能力,看大模型能从长文本中学到什么。

在这方面,升级后的Kimi也进化了不少。

以经典电视剧《甄嬛传》为例,只要输入剧本,Kimi就能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及和他们孩子的真相,堪比一个看了好几十遍电视剧的“甄”学家。

▲Kimi读《甄嬛传》剧本

二、用户量月增

100%

,复杂需求倒逼硅基生命“自卷”

当然,除了基础的文本阅读、记忆、理解等场景外,升级至200万字的Kimi必然会开辟新的应用和场景。这需要极大的想象力。

许欣然谈道,就好比内存容量的迭代,基础要素的每次提升都会带来突破想象力的新应用。

在月之暗面团队看来,无损的长文本能力也是一种基础要素,随着长度的提升,大模型的能力从简单问答、常识背诵等基础任务逐渐升级至角色扮演、长文检索、领域知识理解等。未来,必然有无限可能性还在等待着Kimi去探索。

▲无损长文本能力增长带来的任务复杂度提升

而这条AGI探索之路,也离不开用户的共创。月之暗面联合创始人周昕宇谈道,出于用户共创的考虑,Kimi的定位比起“聊天机器人”更像一个“智能助手”,因为普通对话对大模型自身迭代的帮助有限。

Kimi自发布以来,有许多应用场景都是用户自己开拓的。如通过一定的提示词,让Kimi变身专业翻译工具、跑团主持人等。

▲Kimi变身专业翻译工具

还有用户直接将Kimi的读论文能力封装成了工具,并开发了专门的论文网站。用户只需点击网页上的Kimi按键,就能得到论文的基本信息,包括解决了什么问题、相关研究、如何解决等。

▲Kimi读论文工具

许欣然称,根据网站分析工具SimilarWeb数据,Kimi用户量在春节后飞速增长。此外据非官方统计数据,其用户量每个月增长率超100%。

▲SimilarWeb数据显示Kimi用户量在春节后飞速增长

正是因为用户对Kimi发出的指令越来越复杂,因此团队也一直致力于提升Kimi能遵循的指令的复杂度、信息检索能力。同时由于用户的使用场景从工作逐渐扩展到生活的方方面面,团队在网页端之外补齐了微信小程序、iOS端以及安卓端等。

许欣然透露,Kimi充分发挥其作为“硅基生命”的优势,夜间也没在歇着,持续不断地自我进化中。

三、相同硬件条件下响应速度提

3

倍,年内将发多模态大模型

在沟通会上,许欣然和周昕宇向智东西等少数媒体透露了目前在做的需求池以及未来的发布计划。

如用户呼声很高的提示词教程,目前已经在准备当中,预计一个月左右发布。此外团队也一直在进行多模态能力的研发,今年内将会推出多模态大模型。音频处理能力、海外版同样在需求池内。

目前,Kimi智能助手仍完全免费。但随着用户群体的扩大和使用量的增长,难免会出现算力不足的情况。许欣然透露,今年上半年预计开启商业化模式。

与此同时,月之暗面的Infra(基础设施)团队也在持续提升能效比,据称比起刚发布时,Kimi在完全相同的硬件条件下响应速度提升了3倍。

由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”、“降采样”等技术捷径,攻克了很多底层技术难点,才取得了新的突破。

结语:长文本为

AI

带来更多可能性

随着Kimi智能助手上下文窗口提升至200万字,我们见证了AI领域的又一次飞跃。在数字指数级增长的背后,体现了大模型对复杂任务处理能力的显著提升。

无论是速成开飞机、打德扑,还是深入分析长篇小说的深层次细节,Kimi都能够迅速适应并提供专业级的指导和分析。这得益于月之暗面团队对长文本大模型的深入研究和不懈追求,也离不开用户对其需求产生的驱动。


本文介绍了一款名为Kimi的大模型,它已经从最初的基础功能升级到了能够处理长文本,可以完成更加复杂的任务,比如阅读长篇小说、解析复杂的专业文献等。这种进步源于其背后的长期研究和技术创新。在大规模的计算资源下,Kimi智能助手的反应速度提高了3倍,这意味着更多的数据可以通过其快速处理。这对于人工智能的发展具有重要意义。总的来说,尽管面临巨大的挑战,但Kimi智能助手将继续推动AI的进步,并为用户提供更加智能化的服务。

上一篇:Infinix Note 40 系列手机发布:首发自研电源管理芯片Cheetah X1
下一篇:侯毅突然“退休” 盒马迫近出售?
更多更酷的内容分享
猜你感兴趣
瞬间掌握:只需手机微信,就能实时观察能力最强的高速公路监控画面

瞬间掌握:只需手机微信,就能实时观察能力最强的高速公路监控画面

事件关注爆点是"手机微信可直接查看高速监控画面",事件起因是原本的沟通方式存在问题。

生活常识 04.15
提升乒乓球技能,你需要掌握的五个关键要点:重心转换和练习

提升乒乓球技能,你需要掌握的五个关键要点:重心转换和练习

"重心转换教学是提升乒乓球技能的关键,通过实践和指导,学员能在休假期间更好地应对比赛,展示所学技艺。"

热点资讯 04.18
轻松掌握一门科目的5分钟速读技巧

轻松掌握一门科目的5分钟速读技巧

"驾驶入门教程:如何快速掌握科目一技能?"

热点资讯 04.19
教你轻松开启手机地震预警功能:仅需10秒钟!

教你轻松开启手机地震预警功能:仅需10秒钟!

"地震预警功能很重要。建议在紧急时刻开启此功能以避免可能的灾害。"

生活常识 04.14
商城业主持刀威胁执法人员:网友称北京山卖菜大爷

官方回应:北京山卖菜大爷持刀威胁执法人员事件真相如何?

商城业主持刀威胁执法人员:网友称北京山卖菜大爷 官方回应:北京山卖菜大爷持刀威胁执法人员事件真相如何?

今日在北京市新市街道综合执法中心发现一起涉事情况,一名大爷醉酒后忘记车停位置寻求帮助,与值班人员发生争执并试图取走对方的手机和店内刀具,结果被制止并将物品归还给店铺。警方已经介入调查,相关人员已被带走。此事仍在调查中。

热点资讯 09.18
法国与欧盟遭受削弱,新一届欧委会提名名单曝光:背后是马克龙的决定

马克龙主导新一届欧委会提名名单,法国与欧盟地位被削弱?

法国与欧盟遭受削弱,新一届欧委会提名名单曝光:背后是马克龙的决定 马克龙主导新一届欧委会提名名单,法国与欧盟地位被削弱?

新一届欧委会中的反对派别将是唯一面孔 这是关于欧洲战地

热点资讯 09.18
石班瑜逝世:他与周星驰的合作足迹深厚,留下了许多经典

石班瑜逝世:他与周星驰的合作足迹深厚,留下了许多经典

石班瑜于9月17日上午在北京去世,享年66岁,他的代表配音作品有《赌侠》《极道学园》《古惑仔》等,石班瑜曾是“周星驰御用配音”。

热点资讯 09.18
苹果即将在中国台湾厂批量生产4纳米A16处理器,这标志着未来移动设备性能的大飞跃

苹果即将在中国台湾厂批量生产4纳米A16处理器,这标志着未来移动设备性能的大飞跃

苹果公司将利用台积电的4nm工艺在其位于美国亚利桑那州的晶圆厂进行生产移动处理器。这一消息标志着台积电在亚洲地区的布局即将完成,也预示着苹果将向半导体行业注入更多的资本和技术。此外,考虑到苹果对于高质量制造和环保要求,这也将推动半导体产业的进步和发展。未来,台积电将在美国亚利桑那州凤凰城建设三座晶圆厂,分别负责制造4nm、3nm和更先进的制程技术的芯片。这一举措表明台积电将继续加强其在亚洲市场的地位,并在未来几年继续投入资源进行创新和投资。

热点资讯 09.18
以色列释放5000部手机进行军事行动

或者:

以色列秘密安置了5000部爆炸装置,未引起公众关注

以色列释放5000部手机进行军事行动 或者: 以色列秘密安置了5000部爆炸装置,未引起公众关注

黎巴嫩寻呼机大规模爆炸事件,外界普遍认为以色列为袭击策划者。真主党订购5000台寻呼机中安置爆炸物,消息人士指其阴谋暴露。黎巴嫩安全领域高级消息人士证实真主党近几个月引进的AP924型寻呼机为诱发此次爆炸原因。调查发现以色列情报机构在生产阶段修改炸弹内部电路板,导致无人察觉。近3000名黎巴嫩居民受伤,其中真主党武装人员及伊朗驻黎巴嫩大使受伤。

热点资讯 09.18
专家预测:气候变暖催生更多罕见水龙卷现象

专家预测:气候变暖催生更多罕见水龙卷现象

水龙卷是由强烈风切变引导上升气流形成的旋转空气柱,常呈现出漏斗云形态。在极端不稳定的大气环境下,以及近地面存在强风切变时,水龙卷往往会出现。

热点资讯 09.18
阿联酋AI公司G42与英伟达签署合作协议:中国将获得AI芯片采购许可

阿联酋AI公司G42与英伟达签署合作协议:中国将获得AI芯片采购许可

美国批准英伟达向阿联酋提供H100和H200加速器,为AI布局增添信心;G42由于美国出口管制政策受限无法购买英伟达GPU,押注于美关系以推动技术成长并摆脱石油依赖;G42数据中心采用西方供应商硬件构建,仅保留中国部件以防黑客入侵。微软投资15亿美元与G42合作拓展Azure云业务,加强两国关系。

热点资讯 09.18
岳欢:是否存在中国势力对韩国的威胁?韩国民众疑虑加剧

岳欢:是否存在中国势力对韩国的威胁?韩国民众疑虑加剧

支付宝

热点资讯 09.18
56岁谢广坤老来得子,在豪华酒店大办百日宴,赵四拖着一大箱子随礼

56岁谢广坤老来得子,在豪华酒店大办百日宴,赵四拖着一大箱子随礼

唐鉴军老来得子喜庆十周年的百日宴上发生笑料:众明星前来祝福却仅收到数百元红包。

热点资讯 09.18
惊现美丽海南,全新物种——金樽水玉杯引人瞩目!

惊现美丽海南,全新物种——金樽水玉杯引人瞩目!

中国科学家发现了新物种“金樽水玉杯”,它是一种小型全菌根异养草本植物,生长于热带雨林中。这一发现标志着海南热带山地雨林保护状况良好,并提供了丰富的植物物种多样性资源。

热点资讯 09.18