免费的大模型很神奇，可以为我们带来翻天覆地的变化。

2024-03-23 热点资讯关注公众号

全民Long-LLM时代终于到来。

本月，中国初创AGI（通用人工智能）公司月之暗面宣布旗下大模型工具Kimi Chat正式升级到200万字参数量，与五个月前该大模型初次亮相时的20万字相比，提升十倍。Kimi Chat的升级彻底引爆市场，同时也引起长文本大模型（Long-LLM）细分赛道更加激烈的竞争。

（图源：阿里通义千问）

昨日，阿里旗下的大模型工具通义千问宣布迎来重磅升级，向所有人开放最高1000万字的长文本处理能力，更重要的是，这项升级完全免费。此项升级对于专业领域的意义重大，例如金融、医疗、科研等从业人员，都能利用这项功能更快速地提取出核心关键词，节省文档归整、资料整理的时间。

不仅是阿里，百度文心一言也迎来了长文本处理能力的升级。据官方资料显示，文心一言将在下个月开放免费的200万-500万字长文本处理功能，较此前最高2.8万字的文档处理能力提升上百倍。

此外，360也在本月正式上线了360 AI搜索，通过大模型重塑，结合长文本技术在海量搜索结果中理解并生成精准的答案提供给用户。而这款APP，也同样是完全免费的。

（图源：TechTalks）

长文本一直以来都是大模型工具「内卷」的方向，如何在超百万字的文档里做出有效的信息整理、观点归纳，都是技术上的难点。当然，正如半导体行业与消费电子产品市场之间的关系一样，很多消费者能感受到手机、电脑等产品性能正在飞跃式成长，但落实到实际体验上，似乎没有太多的变化。

而在生成式人工智能（GenAI）领域里，「卷」参数会是一个虚无缥缈的噱头，还是造福人类的行为，还很难回答。

大模型是如何拿下长文本技术的？

在弄清楚「卷」参数到底有何意义之前，我们首先需要了解AI企业们到底在「卷」什么东西。

与衡量手机性能以跑分分数为准一样，大模型也有属于自己的「性能基准」——token，这是一个大模型专用的输入、输出基本单位。在OpenAI给出的准则里，1k token等于750个英文单词、500个中文汉字。

（图源：OpenAI）

同理，token数字越大，能够处理的篇幅就越长。ChatGPT-4目前的参数量为8k-32k token、Anthropic公司推出的Claude为100K token，而中国初创企业月之暗面推出的Kimi Chat则是达到了惊人的400K token。具体到实例，Kimi Chat能够在20秒左右读完1篇20万字的长篇小说、通文千义也能在数秒时间里读完80万字的《三体》。

（图源：雷科技制图/通义千问）

参数量剧增所带来的好处自然是大模型对于更长的拥有更快速的理解能力，这能够帮助用户从中提炼到所需的摘要、信息点，又或是直接生成整篇的总结。语言大模型之所以能够快速「引爆」整个市场，正是得益于这种速度惊人的理解能力。

（图源：雷科技制图/Kimi Chat）

但要彻底攻克长文本，大模型光靠堆砌token参数量并不能完全解决这个问题。超大数量的token的确能够快速阅读完长文档，但段落与段落间的也更容易出现「断裂」的情况，这与缺少模型的预先训练有关。目前拥有超大token的AI方案提供商，通常在Transformer预测词之前投喂词元模型，使整体结论更加完整。

（图源：Code-Llama）

比如Code-Llama，标称16K token参数量，但实际上是由一个个4K token窗口连接而成，最终产生出16k token总模型。而这就十分考验大模型工具在窗口之间的推理能力。试想一下，在专业领域中，长文都有紧密的逻辑性与关联性，假如大模型推理失误，则有可能出现最终生成的摘要牛头不对马嘴，这对于大模型工具的商业、个人应用，都是致命的打击。

当然，大模型的推理能力是可以通过训练得到进步的，这就不难解释为何阿里、百度都选择优先将长文本模型功能免费开放给个人用户，毕竟更多用户加入，模型推理能力的进化速度才能加快。

（图源：百度文心一言）

但免费应用也是一件好事情，长文本的快速阅读一直以来也是用户在大模型各项实际应用场景最关注的一项，比如正在写毕业论文的学生党，可能将超长的论文喂给大模型工具，让其快速提炼、总结，甚至找出论文中的研究结论。

长文档能力拓展，用途比我们想象中要多

阿里的通义千问将长文本档能力的拓展方向瞄准在专业领域的理解上，尤其是金融、医学等，对于这些行业的从业人员而言，从前需要花上几天或是十几天才能读完的文章，如今只需花上十几秒就能看完其中的精华之处。

但大模型长文本的能力远不止于此。

（图源：育碧）

不久前，知名游戏公司育碧公开的全新「NEO NPC」技术，正是Long-LLM（长文本大模型）升级后衍生的新方向。众所周知，3A游戏大作的灵魂往往与其精彩的剧本离不开关系，其中各式各样的游戏角色，也因其丰富的背景故事和鲜明的个性深受玩家喜好。大模型从1k token进化到100k token，甚至是400k token，能够让游戏剧本完整地覆盖到每个游戏角色里，让他们的对话、行为，既符合游戏的世界观，又能保证一定的灵活性。

这项能力同样可以应用在我们生活中最离不开的功能——搜索。

（图源：雷科技制图/360AI 搜索）

本月初，360在北京举行了一场活动，旗下全新360 AI 搜索和360 AI 浏览器率先亮相。360 AI 搜索的核心在于“理解”、“提炼”、“总结”，即抛开传统搜素引擎将所有与之相关的为用户一一呈现的做法，主动介入搜索结果，在数以万计的匹配信息里提炼出最有效的信息。

360 AI 浏览器则是变成彻底的「AI工具」。周鸿祎解释道，360 AI 浏览器的定位是学习、生产力工具，它能帮助用户快速阅读书籍、文章，了解视频等。此外，360 AI 浏览器未来还将拥有续写功能，这同样基于大模型长文档的理解。

更重要的是，更长的文档理解有助于加速AI快速过渡到AGI（通用大模型）时代。正如前文所说，Long-LLM较之前最大的变化在于对超长文本的理解、记忆、总结能力，这些能力可以是大模型更加「拟人」，即记住样本的真实喜好从而判断其行为，又或是根据真实世界的物理规则，生成完全符合实际的。

Long-LLM能改变世界，但算力难以解决

早在去年底，大模型长文本技术就已经进入到火热阶段，但却鲜有AI企业将这项技术应用到大模型工具中，更别提免费向大众开放了。

OpenAI CEO Altman在接受公开访问时也表示，由于算力不足，GPT-4的32K token短期内无法向大众开放。要知道，OpenAI可是当前人工智能市场里获投资最高的头部企业之一，连它都空有技术却无法落地，不免让人对Long-LLM的未来感到担忧。

在算力不足的前提下有没有办法「投机取巧」呢？当然有。

目前主流节省算力的长文本技术通常有三种，分别是短文档重复检索、分组检索和模型本身的优化。前两种方案在技术原理上相对一致，都是将重复的进行「记忆」，节省理解时间，减少算力消耗；而模型本身的优化则要复杂许多，相当于用短文档推导出长文档，这非常考究模型本身的结构优化。

（图源：英伟达）

不过，无论采用哪种方法，其精度仍有待加强，这就是为何我们仍在期待更强大的计算卡出现，比如前不久GTC 2024上，英伟达发布的最强计算显卡Blackwell GB200。关于这颗当前最强AI加速卡的详细解析，雷科技在早前的文章里已有报道，欢迎各位订阅查看。

在当前，算力仍是阻碍Long-LLM成长的一大关键因素，但随着英伟达、英特尔等硬件供应商不断加码，这项技术在未来也将成为AI领域发展的风向标之一。

写在最后

如果说OpenAI的Sora展现出其在AGI时代关于视频领域上的想象，那么Long-LLM则是奔向全场景通用智能的基桩。

大模型长文本技术能让AI助手记住用户的所有你与它谈论过的话题，这让你们之间能够创造真实的回忆，而不是像从前一样，在开始新对话之后，前面的「AI」就忘记了刚刚发生过的任何事情。这使得它能够变成更好的AI智能客服，毕竟即便是真人，也难以记住与每位咨询者发生过的对话。同样的，Long-LLM还能化身数字人主播、创造数字偶像等等。

或许，在大模型长文本技术的支持下，AGI时代将在不久后真正到来。

结论：
全球各大互联网巨头纷纷推出了自家的长文本大模型，包括阿里云的大规模预训练模型Kimi Chat、百度文心一言、360 AI搜索以及腾讯QQ等多个产品均展示了他们强大的长文本处理能力，对于专业领域的人士来说，这也是一个极大的大数据技术，并且会，但这不仅将会有许多的AI。针对全文大模型，例如（LLM大模型训练平台，在这个大模型和AI大模型技术。将来，让他们能够应对，其他。新一代长文本自动，实时等。

上一篇:一图看懂 OPPO Watch X
下一篇:对话厦门和储能源董事长：未来三年，新型储能装机有望年化新增100GWh

更多更酷的内容分享

猜你感兴趣

周鸿祎揭开360安全大模型的神秘面纱：免费使用，彻底告别付费时代！

周鸿祎在ISC.AI2024第十二届互联网安全大会上宣布360安全大模型正式免费，这是人工智能发展引发的产业革命背景下，企业对安全性需求的升级以及对新技术运用的探索。安全大模型应与安全业务深度融合，模型不是产品，而是能力。360安全大模型集合了360多年沉淀和全部功力，已在多个业务场景落地实践，其中包括捕获0day、APT猎杀等高阶终端能力，并取得了重大突破。

热点资讯 08.01

百模大战：大佬们的态度发生了翻天覆地的变化？

智能相对论：百度创始人、董事长兼首席执行官李彦宏，在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上，首次表达了对AI大模型的看法。他认为，没有应用，光有基础模型都是无价值的；要跳出移动时代的思维逻辑，避免掉入“超级应用陷阱”，不是只有10亿DAU的应用才叫成功。此外，他也提醒大家要避免过度竞争基础大模型，而是应该聚焦场景应用，推动大模型的技术发展。据多家大佬介绍，未来的大模型重点将是在场景应用上取得突破，而不是单纯追求技术研发。今年，各大巨头都在积极开发应用场景，并通过开源模式、自研基础模型等方式来满足这一需求。例如，Google正在开发GPTs，以帮助解决自然语言处理问题。

热点资讯 07.08

刘典：大模型开启‘价格战’，基础服务正式免费或大模型“价格战”来临，基础服务免费可期-刘典动态

技术研发与应用落地，提高了用户体验；从负面角度来看，部分厂商过度优惠可能导致行业利润下滑，引发供需矛盾。整体上，由于技术成熟、市场竞争加剧以及资源优化等因素，大模型短期内价格可能会进一步下降，但长期来看将有利于产业健康发展。

热点资讯 05.22

智能算法驱动的‘免费’大模型：场景应用中的机会在哪？

虎嗅智库举办主题为"AI应用在大模型变'免费'之后的发展趋势探讨"的线下会议，吸引了来自喜马拉雅珠峰AI产品总监吕睿韬、昆仑万维科技股份有限公司解决方案总监黄智彬、商汤科技 Copilot 产品负责人贾安亚等嘉宾出席。讨论议题包括大模型逐渐开源或免注册对企业AI应用的影响，注册门槛放宽对公司算力的压力，场景探索的特点、趋势和重点行业；AGI（人工智能生成）和场景之间的关系等。此外，参会观众还关注了AI及大模型技术的需求方、技术研发方和相关研究机构的看法。

热点资讯 04.21

小米手机逆袭：挑战苹果，下一战更激烈？

小米手机打破苹果地位，重回全球第二；小米强调注重中低端市场的价格优势，但在高端市场仍有待突破；预计小米将在年内推出三折叠手机，并有望在年底实现顶配价格低于15000元；苹果取代华为成为全球销量第二，遭受到来自小米的竞争压力。由于疫情的影响，iPhone 16系列首销成绩并不理想，但小米仍有希望冲击更高的销售业绩。

热点资讯 09.20

黎南部真主党军事目标被攻击，军方已经采取了措施。

以色列国防军击落黎巴嫩南部真主党目标，破坏其军事能力与基础设施。

热点资讯 09.20

第14号台风“普拉桑”于上海奉贤沿海二次登陆

今年第14号台风“普拉桑”今在上海沿海二次登陆，最大风力9级，最低气压995百帕。

热点资讯 09.20

AI先驱李飞飞引领空间智能转型：构建世界的模型

李飞飞创立AI公司“World Labs”，致力于研究空间智能。该公司的目的是应对大自然五亿年才解决的超级难题——贝壳财经记者了解到，深度学习算法的前身——卷积神经网络算法的崛起来自于2015年，当时谷歌DeepMind成功地在ImageNet上创建了一个新的类任务，这标志着深度学习作为机器学习的一种形式得到了广泛的认可。起因： 1. 李飞飞放弃学术界的工作，投身到AI公司“World Labs”的研发中。 2. 该公司旨在解决大自然五亿年才解决的超级难题——贝壳财经记者了解到，深度学习算法的前身——卷积神经网络算法的崛起来自于2015年，当时谷歌DeepMind成功地在ImageNet上创建了一个新的类任务，这标志着深度学习作为机器学习的一种形式得到了广泛的认可。关注点： 1. 李飞飞创立AI公司“World Labs”以解决大自然五亿年才解决的超级难题。 2. 该公司的目标是探索空间智能，这是人工智能领域的一大关注点。

热点资讯 09.20

美公司与行业专家担忧中国在核聚变领域的崛起，挑战美国主导地位

据CNBC报道，美国在核聚变领域一直保持领先地位，但在最近的几年里，中国在该领域取得了显著进展，有望在未来与美国竞争。目前，中国在核聚变领域投入超过美国，而美国在清洁能源方面正面临丧失领先优势的风险。中国在核聚变领域的快速发展引发了美国方面的担忧。此外，据报道，中国已经启动了一系列支持该领域的项目，并计划在未来几年内进一步提高该领域的投入。中国的进步将对全球核聚变领域产生重大影响。

热点资讯 09.19

台风“普拉桑”已登陆浙江岱山，中心风力10级！

今年第14号台风“普拉桑”登录浙江岱山，并预测后续将影响杭州湾地区。

热点资讯 09.19

云南永善幼儿园开学不满23天即停办拒退款，负责人称将等待‘东山再起’后再还款

云南永善县稚慧岛幼儿园开学23天后突然停办，原因在于拒绝退费引发家长不满。当地已成立联合工作组开展专项调查，幼师违规收费引起家长投诉。相关幼儿园家长们先前与园方签署了“特别教育协议书”，约定一次性支付三年定位费。目前，涉事幼儿园负责人为确保“东山再起”，仍未偿还剩余定位费。家长建议家长向公安机关报案，以免损失扩大。

热点资讯 09.19

究竟：传呼机竟成炸弹？全球十大厂商仍在使用！

黎巴勒黎巴勒利

热点资讯 09.19

北斗数字化应用的新模式加速增长：规模化与高质量并存

北斗系统于2020年完成三号系统的部署，使全球服务范围进一步扩大。近年来，北斗应用产业发展迅速，特别是北斗专用列车的成功发射，展示了北斗在交通工具领域的应用潜力。北斗系统的发展受到多种轨道混合组网模式的影响，同时也与其他新兴技术如5G、云计算、大数据、人工智能等深度融合。在未来，北斗的应用前景广阔。

热点资讯 09.19

大疆Osmo Action 5 Pro：值得一看的运动相机选择？

这款全新的大疆DJI Osmo Action 5 Pro在性能上有了很大的提升，特别是在电池续航和画质方面表现优秀，使得其成为我目前最好的运动相机之一。同时，其内部47GB可用存储空间也成为了我应对日常拍摄需求的重要保障。当然，虽然它是一款顶级的运动相机，但在一些细节上，如麦克风布局和屏幕大小等，仍存在改进的空间。总的来说，我非常推荐大家尝试一下这新款的大疆Osmo Action 5 Pro。

热点资讯 09.19