| 邓咏仪
| 苏建勋
国产大模型的"超超超大杯"正式来了——
3月18日,月之暗面正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。
Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。
而月之暗面也是国内大模型创业公司的头部玩家,在近期刚刚宣布完成超过10亿美金的新融资。
而长文本是月之暗面攻坚的技术,可以简单理解为大模型单次可以处理的数据长度。
Kimi智能助手在2023年10月发布时,就已经支持约20万汉字无损上下文输入,当时已经是国内大模型将长文本这一技术拉到世界第一梯队的的技术水准。而这次更新,也是在短短半年内,再次将长文本技术提升到另一个层次。
如今,业内普遍将将大模型看做是新时代的计算机,以计算机来进行类比:计算机依靠CPU进行计算;内存则存放了临时计算的数据,决定其运行速度。
“如果说参数量决定了大模型支持多复杂的‘计算’,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的‘内存’,两者共同决定模型的应用效果。”月之暗面创始人杨植麟此前解释道。
简单来说,如果大模型单词处理的文本长度有限,那么进行多轮对话时,模型就经常会出现“忘词”等场景,上下对话无法连贯地进行下去,这也会大大影响所应用的场景。
如今,对话窗口提升到200万字是什么概念?这意味着,在大多数需要大量专家知识的领域,大模型都能胜任了,成为一个初级专家。
媒体沟通会现场,月之暗面就展示了一些超长无损上下文的使用场景示例。比如阅读长达80集的《甄嬛传》剧本,理解“甄学”:
来源:月之暗面
又或者,用户上传几十万字的经典德州扑克长篇教程后,让 Kimi 扮演德扑专家为自己提供出牌策略的指导。
来源:月之暗面
再传一份完整的近百万字中医诊疗手册,让Kimi针对的用户问题给出诊疗建议,同样ok
来源:月之暗面
并且,随着如今大模型厂商成立已经一年多时间,各大模型厂商在落地层面都渐渐跑出自己的方向。如月之暗面,就坚定地走To C路线,做超级应用,而长文本就成为不少C端用户使用Kimi智能助手的原因。
比如,许多Kimi智能助手的早期用户就直接用Kimi处理各类文件。一个场景就是简历——此前曾有用户让Kimi分析多份简历,让Kimi从多维度进行分析。而在长文本提升到200万后,一个公司 HR 可以基于业务需求,就可以快速从最近的 500 份简历中,让 Kimi 快速找出有某个行业从业经历,同时从计算机类专业毕业的求职者,更加高效地筛选和识别合适的候选人,大大提高了信息处理效率。
而在发布会后,月之暗面也透露了未来的一些规划。
当前,月之暗面的团队为80人左右,团队还是会在坚定AGI路线的前提下,坚持在超级应用以及场景上继续拧探索。月之暗面(Moonshot)创始人周昕宇就表示,:“如果要做 AGI 通⽤⼈⼯智能的话,需要与⽤⼾共创。如果只是闲聊的话,对模型的反馈会⽐较弱。所以我们希望Kimi可以帮⼤家来做很多对智商要求⽐较⾼的事情,这样模型的上限会更⾼。”
并且,月之暗面当前也有在多模态领域进行探索。团队表示,在OpenAI的Sora发布前,月之暗面就已经对这个领域有所投入,预计今年内也也会对外发布新成果。
结论:此次月之暗面推出的Kimi智能助手的长文本功能将进一步提升大模型的性能,使其更适合用于各种场景,包括但不限于金融、医疗、教育、法律等领域。此外,月之暗面还透露未来将继续深化在人工智能领域的探索,并计划在未来年内对外发布更多新产品。总的来说,这是一个有着巨大潜力和发展前景的产品。