自从生成式AI爆火之后,各个厂家都推出了自己的生成式AI产品。但大多数都是基于简单的文字生成,少有处理文件和联网的功能。前段时间Kimi Chat启动200万字长文本的内测,经过体验后,我有一些不一样的心得。
请问:你知道Kimi Chat吗?
产品出来时,我写过一篇「测评文章」,许多读者阅读后表示用了起来。Kimi Chat不仅能搜索资料,还能处理PDF、doc、xlsx、PPT等格式文件,最大支持100MB,处理上限为20万字。
我注意到,各种讨论中,大家对Kimi有不同反应。
有人觉得不错,称其为国产之光;也有人觉得没有达到预期,处理一些较长的、长期坚持一个对话时,会出现幻觉。
不过,3月18日,他们在上下窗口技术上,又取得一项新突破,现在Kimi能处理长达200万字的“长文本”输入,并且开启了内测。
没错,短短5个月再次升级。
想要申请200万字上下文功能的内测非常简单,只需登录Kimi Chat官网,点击对话框下方第一条提示,加入内测队列,几个小时后,就会收到新的通知。
嗯,经过体验我学到一些新知识,也有一些不同心得。
01
从哪里分享呢?就从「200万字」的话题开始吧。
你可能遇到过这类情况:
当用AI工具处理一篇文章、一个网页链接、一个PDF文件时,它却跟你说,太长了,超出处理限值,请上传一个字数更少的文档。
咦,然后,你会疑惑的检查下文档大小,发现明明符合要求,怎么就不行了呢?别急,其实AI工具计算方式和你想的不一样。
在计算机科学和自然语言处理(NLP)领域中,它们以“token”作为计量单位,token和普通的文字字符是不同的概念。
什么是token呢?
简单讲:一个单词、一个数字、或一个标点符号。
比如:
拿句子“The quick,brown fox jumps over the lazy dog。”来说,分词后,可以得到The、quick、brown、fox等;在英文里,“I love apples”这句话分词后会变成“I”、“love”、“apples”三个tokens。
处理文本数据时,自语言技术首先会进行“分词”(tokenization),把整个文本拆分成一个个tokens,这样做的目的,是它可以更好地分析、理解文本的具体含义。
我研究了一下,ChatGPT、Gemini、Claude国外AI模型,把一个汉字算作1到3个token,他们用一种叫字节对编码(BPE)的方式来分解文字。
国内像文心一言、智谱AI更倾向于用WordPiece分词策略,做法是将单词分成更小的部分,即“子词”,以便更好地理解罕见的词和词根。
简单来说,将复杂的拆成简单的小块,让模型学得更好。
所以,当你看到某AI模型声称能处理10万字,实际处理不了这么多,因为一个汉字可能等于多个token,导致实际处理的字数比看上去的少。
明白这些你也就理解了,为什么有时文本看起来没达到上限,却说超过模型处理的能力了。
目前AI领域,比20万汉字上下文高的只有谷歌的Gemini 1.5 Pro(100万token),它主要针对情境学习能力,以及Claude 3定制版(100万token)。
月之暗月团队再一次将Kimi能力升级到200万字,的确是一项重大突破。那么,问题来了:停留在20万字时,你会用Kimi做什么呢?
02
我问了一圈,得到不少答案。一位朋友说:问想不起来的事儿。
我没太懂,让他解释一下。他说:
前天,读到一篇文章,讲一个女孩在街上被人杀害,周围有很多人看到了,但没有人出手相助。他问这是什么情况,意味着什么?
于是这个问题交给AI。
AI告诉他,心理学中,该现象被称为“旁观者效应”,即紧急情况下有多个目击者,个人采取行动的可能性会降低。AI还提供一些历史上的案例作为参考。简而言之,提供深刻的见解和背后的理论支撑。
另一个朋友说:问灭火器口诀含义。什么?口诀?
他说,前天消防安全培训,讲师提到一个口诀叫“提拔握压”。当时没懂啥意思,人多也没敢提问,于是,回家后想到用AI来解答疑惑。
他问AI,「提拔握压」口诀具体什么意思,操作灭火器要注意哪些要点,以及常犯的错误有什么?结果AI帮他解决了疑惑。
袄,我懂了。很多工具可以帮助我们解决问题,即使在人多不好意思问的情况下,回头也能找到答案。
还有一个朋友说:帮我出谋划策比较多一些。
前几天,没有经过总经理签字的情况下,把一个文件送去了应急局;但总经理明确提到他不同意按照我已经报上去的信息上报材料。现在材料送去了应急局了,总经理又提出这个事儿,怎么处理比较好?
于是,他把问题甩给了Kimi。
Kimi告诉他,一,承认错误,向总经理说明情况;二,尝试联系应急局,看看是否能暂时搁置那份文件;三,如果做不到,赶紧与总经理讨论,商定共同立场,以便在应急沟通时一致对外。
四,制定一个预防措施,以后遇到此类问题怎么改正流程;五,处理时,要保持积极乐观的态度,不要因为领导生气而抱怨。
嗯,按照此逻辑执行,领导相当满意,成功躲过一劫。
原来可以这样。还有一个朋友说,他前两天用Kimi搞定了一份安全检查表。
他的职业是安全管理,在一家化工厂工作。最近因为社会上火灾事故频发,对火灾隐患的监管变得更加严格了。所以,他要制定一个专门针对危险化学品生产企业的火灾隐患排查表。
于是,直接把需求给了AI。告诉它需要一个包含车间、检查项、检查标准、检查记录、整改措施、整改负责人和完成日期等信息的表格。结果AI直接做好给了出来。
的确,每个人用法都不同。
我平时阅读文章、整理别人文章的大纲、要么查找某个公司财报,有时也会让它帮我把一些问题条理化。
前几天接到一个小活儿,内部写的文案有点啰嗦,想把整个公司介绍PPT修改下,我就把文案甩给了Kimi,分分钟搞定。
所以,不难看出,针对AI,20万字以内的处理能力,大家做的事情相似,包括搜索、提问、结构化,以及做表格等操作,还有一些朋友会用它写Midjourney的提示词等。
03
那么,当AI具备200万字处理能力时,你会怎么看呢?
不妨从工作的角度想想该问题。
一个HR朋友说,最近BOSS直聘找工作的属实多,我每天平均回复在50家以上,要筛信息,看履历,看项目经验,真头疼。
想象一下,一份简历大概500到800字,如果用AI,按1000字算,一次性能吃进去2000个简历;让AI从2000份简历中筛选候选人,听起来是不是挺方便?
人力资源评估这类事情,已经有海外大厂在做了,AI 评估会更全面,而且不带个人感情,这不一定是最好的办法,至少给了更多选择的可能性。
我最近看商业周刊,还翻一些外文书,但之前用AI帮忙读书总被字数限制弄得头大,有时,ChatGPT也不能直接处理,我不得不把书一分为二给AI。
就拿国外很火,但国内还没上的《AI产品经理》一书来说,之前让Kimi来帮我读,因为字数太多直接被卡壳了;不过,昨天解锁200万字能力后,再次一次性给它,不仅迅速搞定,还帮我把全英文翻译成了中文,效率的确高不少。
还有一点,200万字的AI学习能力的确很强。
拿编程来说:一般人想成为软件开发专家,得下不少功夫,学好几种语言,弄清楚算法和数据结构,才能对开发流程了如指掌。
但是,有能力处理200万字的AI,情况完全不同,它能迅速吸收、分析海量编程资料、教程和代码,很快掌握各种编程知识和技巧,还能针对具体问题提出更好的解决方案,这种学习和应用速度,对我们人类来说是难以想象的。
我试着把将要出版的第三本书的素材交给它,让它帮我重新理一下思路,没想到表现出乎意料,迅速分析并给出结构。
可能有些人用过之后就没再继续深究,但我觉得,这种能处理大量文字的技术,对于这些互联网上班的人来说,工作方式又面临一次变革。
为什么?AI 对我们的影响,有三种级别:
一,影响很低,可以不当回事;二,威胁到一部分脑力工的职位;三,彻底改变,甚至让很多工作消失,
如果到达第三阶段,你会怎么办?
有人会拿蒸汽机初期的故事来比喻,记得当时纺织工人因为害怕失业而砸毁机器。但是,随着技术广泛应用,他们最终还是面临着被淘汰的局面。
在我看来,之前机器主要取代体力劳动,让人们转向脑力工作。AI出现情况就不一样了,它正在把我们从脑力工作中挤出去。
04
那问题来了,AI是不是要我们回到体力劳动呢?
我觉得并非如此。
AI学得快,处理信息也厉害,但有些事情还搞不定。比如:AI能查法律条文、分析案子,但它不能在法律上帮你辩护。
在美国,律师们已经说了,如果AI想上法庭那就违法了,这些限制并非AI做不到,而是,人类给AI设定了一些规矩。
为什么要设定规矩呢?因为责任问题、传统惯例、或出于伦理考虑。至少一段时间内,AI进入不了这些领域,但只是暂时的。就拿律师助理来说,如果AI做的比人好,那助理迟早被淘汰。
这就像大规模生产导致的产能过剩。所以,我们接下来要竞争的,是那些看不见摸不着的东西。
什么是看不见的呢?
第一点:隐性知识(Tacit Knowledge)。AI只能作为纸上谈兵的咨询师,它可以告诉你香蕉多好吃,它却没吃过香蕉,乔布斯在1992年演讲时,这样形容过某些咨询公司。
所以可以肯定,AI当中也存在看不见的知识。你只有不断总结个人经验,才能获得一些竞争性优势,至于这种优势有没有价值,就另当别论了。
时不时,我就碰上一些网友反复问的那些老问题。
比如:现在自媒体还能不能做?还有没有前途?其实,这问题和写作的根本道理挺像,大家都在写东西,有的人甚至用AI帮忙写。
每个人的,都有自己的风格,有的文章像纸上谈兵,一看就不再看了;但有些一看就知道亲身实践出来,这种东西AI模仿不来;所以,虽然AI也有它自己的知识体系,但对我们来说,也有看不见的东西。
因此,隐性知识(Tacit Knowledge)是竞争力之一。
第二点:学会提出好问题和保持怀疑的能力。
提问有啥难的?确实,用5W2H、黄金圈法则这样的技巧提问,看起来能得到你想要的答案。AI也能进行因果分析。
但你知道吗?AI获取信息的方式不是直接体验,它提供给你的答案是根据数据模拟出来的,建立在统计学之上。
比方说,你打算在某个地方开家咖啡馆,让AI帮你分析那里的人流、消费水平、竞争对手数量,还有营销策略。AI给出了答案,你真的敢信吗?
它没有亲自去过,只是通过数据推算出来的。所以,反提问、质疑能力未来会成为一个人的基本功。
第三点:你可能要占领一定高地。
什么是高地?与别人拉开距离遥不可及的东西。影响力算,作品也算,优势也算。
要建立优势,得思考怎么做出与众不同的事,找到独特位置。这个过程需要时间,也要不断的尝试和实践。
当你和别人做同样的事时,再怎么努力也只是在维护系统中权力者地位,而自己想要获得更多掌控力的可能性,却在减小。
我观察到,有些朋友纠结于原地,是因为他们从未考虑过在哪些方面构建起「可以持续积累的优势」。
真正好的机会往往不会有太多人和你争,因为大多数人没办法坚持超过五年,这类机会,在短期内看起来平平无奇,不怎么样,不能立刻给你积极的反馈。
而且,超过5年以上的机会,参与者安全感是匮乏的,他们在没有信心时,总愿意问别人怎么看来获取信心,其实,时间上能跨越五年以上的机会是靠心力积累出来的。
因此,如果你还没找到自己的优势所在,不妨思考下,如何构建起「结构性优势」和「可以持续积累」的能力。
隐性知识(Tacit Knowledge)、学会提出好问题和保持怀疑的能力,以及结构性不断累积的影响力,我想,是AI不可替代的稀缺能力。
总结而言:
阳光明媚时修屋顶。
想办法把经历的事情,工作的思考沉淀下来,去挖掘它们和人生的关系,让AI帮你优化,你得到的数字资产,会比别人更具壁垒性。
对于线上从业者,未来要靠影响力和专业实力吃饭了。
专栏作家
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
这篇文章从「200万字」的话题开始吧,我的朋友说:说到底,文章好坏就是一篇文章中的字数多寡,但文章的意义是什么并没有详细的界定,如果文章的整体的逻辑到一个标题开始,希望能,