近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描绘他的通用人工智能(AGI)梦想。Kimi能否如愿“登月”?
一看目标是否远大。
通用人工智能,指具备与人类同等智能或超越人类的人工智能。短短几年前,大部分人还认为通用人工智能是一个遥不可及的目标。一年多前,美国公司OpenAI的ChatGPT产品引爆人工智能大模型热潮,让不少人觉得通用人工智能实现在望,大模型赛道出现百舸争流盛况。截至2023年年底,我国累计发布了200多个人工智能大模型。大模型的巨大投入和高风险,让一些业内人士持观望批评态度。甚至有人认为国内大模型与美国差距太大,跟不上,白烧钱,不如采取底层技术搭美国便车、用开源大模型做应用层创新的跟进策略。
盲目烧钱一哄而上,诚然不可取。然而树无根不长,人无志不立。如果将实现通用人工智能比作登月工程,ChatGPT并未登上月球,而是跟其他大模型一样处于火箭原型测试阶段。大模型爆火一年多来,中美之间的实际差距在缩小,我们完全没必要轻言放弃。瞄准人工智能领域的第一性原理,通用人工智能就是核心,第一个拿到AGI门票的公司可以从那一刻起降维打击,实现赢家通吃。月之暗面公司以初生牛犊不怕虎的精神志指“登月”,堪称目标远大,值得期许。
二看特长是否突出。
人工智能也需要差异化竞争。月之暗面公司精准把握用户需求和应用场景,打造出具有记忆点的产品Kimi智能助手,引领了人工智能的“长文本”时代。OpenAI官方去年11月发布的GPT-4 Turbo支持128k上下文,大约相当于10万汉字。而Kimi智能助手在去年10月首次亮相时,就可支持20万汉字的无损上下文长度,是大模型产品里这一单项能力的冠军。仅仅5个月后,月之暗面公司就宣布把Kimi的这一能力提升到了全新的数量级200万汉字。
升级后,过去人类要10000小时才能成为专家的领域,现在交给Kimi智能助手,只需要10分钟。有一个演示鲜明地展现了Kimi高超的“吃瓜”智能。使用者将《甄嬛传》剧本传给Kimi,再问它哪些细节表明甄嬛的孩子是果郡王的?Kimi能在不同时间段、各个场景的故事情节中,深入挖掘出相关线索并一一列出,堪比一个看了几十遍电视剧的“甄”学家。
文本长度受限带来的“碎片化”输入,常常降低人工智能的“智能”。一篇英语长文如果让大模型来翻译,受限于输入长度要分割成几块,就可能出现前后不一致,比如“chair”在第一段输入时被译成“主席”,在第二段输入时被译作“椅子”。Kimi的长文本输入就解决了这个问题,比起“聊天机器人”,更像一个“智能助手”。Kimi远超同侪的长文本能力解锁了更多可能,包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。这也让“长文本”有望成为“登月”的第一步。
当然,目标远大、特长突出,只是“登月”的必要条件,而不是充分条件。展望未来,最成功的AGI公司必将超越现在的所有人工智能公司。它不一定是OpenAI,也不一定是月之暗面,但中国公司需要“登月”这样目标远大的理想,国产大模型也需要“登月”这样富有竞争力的技术储备。
结论:经过一年的研发,月之暗面的AI模型Kimi凭借其强大的长文本处理能力,成功实现了从科幻概念到现实应用的转变,开启了一条新的道路。虽然Kimi的训练数据量和模型规模远超目前市面上的大模型,但是它的突破性和潜力无疑值得期待。
同时,也应注意,虽然Kimi取得了显著的进步,但人工智能的商业化之路仍面临许多挑战。一方面,我们需要克服现有的数据难题,另一方面,我们也需要面对如何保障人工智能的安全性和可控性的问题。此外,我们需要明确,“登月”不仅仅是科技的成功,更是对于教育、医疗、环保等各行各业的巨大贡献。
在此基础上,我有以下几点建议:
1. 加强技术研发,特别是在深度学习、自然语言处理等领域,不断提升AI的能力。
2. 建立完善的法律法规体系,保障AI的合法合规运行。
3. 提升公众对AI的认知度,让更多的人了解和接受AI的应用。
4. 合理规划AI的发展路径,避免过度集中发展某一特定领域。
5. 鼓励国际间的交流与合作,共同推动全球AI技术的进步。