开源Grok并非是对OpenAI的回应。马斯克有更宏大的计划。

2024-03-19 热点资讯 关注公众号

每经记者:文巧    每经:兰素英

3月18日,马斯克旗下大模型公司xAI兑现诺言,正式对Grok-1大模型开源。随后在X平台上,马斯克还不忘嘲讽OpenAI一番,“我们想了解更多OpenAI的开放部分”。

据悉,Grok-1模型参数大小为3140亿,是迄今为止业界开源参数最大的模型。

马斯克的开源举措引发了业界的广泛关注和热烈讨论。表面上,这一举动像是针对OpenAI的一记“回击”,但从更深的层次来看,还隐藏着马斯克的战略谋划和考量。

据xAI去年公布的文档,尽管Grok-1在各个测试集中呈现的效果要比GPT-3.5、Llama2要好,但距离Palm-2、Claude2和GPT-4仍然差了一大截。

因此有分析认为,在强敌环伺,且Grok难以匹敌顶尖大模型的情况下,马斯克选择开源是必然之举,其考量之一可能是将模型迭代进化的任务交给社区。

开源还是闭源,一直是AI浪潮之下一个极具争议性的话题。有AI专家此前在接受《每日经济新闻》记者采访时认为,开源已是大势所趋。从商业角度来看,开源不仅能够避免少数财力雄厚的科技公司控制前沿模型,对于AI创业者来说,也进一步降低了门槛和成本。

马斯克的“阳谋”:让开源社区迭代模型

3月18日凌晨,马斯克旗下大模型公司xAI宣布正式开源3140亿参数的混合专家(MoE)模型Grok-1以及该模型的权重和网络架构。截至发稿,在Github上,该开源项目已经揽获31.6k星标,足见其火爆程度。

图片来源:Github

值得注意的是,这是迄今为止业界开源参数最大的模型,超过GPT-3.5当时1750亿的参数量。

DeepMind工程师Aleksa Gordié预测,Grok-1的能力应该比Llama2要强,但目前尚不清楚有多少数据受到了污染,二者的参数量也不是一个量级。

从Grok-1的模型细节来看,值得注意的一点是,该基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调。而在X平台上可用的Grok大模型就是微调过的版本,其行为和原始权重版本并不相同。也就是说,xAI目前开源的Grok-1模型并不包括X平台上的语料。

据xAI去年公布的文档,从Grok-1的整体测试效果来看,Grok-1在各个测试集中呈现的效果要比GPT-3.5、70亿参数的Llama2和Inflection-1要好,但距离Palm-2、Claude2和GPT-4仍然差了一大截。

图片来源:xAI

基于此,有分析认为,马斯克开源Grok-1的一个考量是,尽管该模型表现尚可,但“比上不足,比下有余”,并未具备打败顶尖模型如GPT-4的能力,更别说未来的GPT-5。

在大模型角逐的当下,尽管Grok依托X平台的数据,但其无论是在能力上,还是知名度上都不具备与OpenAI、谷歌、Anthropic等公司匹敌的优势。尤其是今年以来,谷歌发布了Gemini,Anthropic发布了Claude3,大型语言模型的竞争更加激烈,在这样的情况下,马斯克选择开源路线也是必然之举。

模型开源让研究者和开发者可以自由地使用、修改和分发模型,打开了更多开放合作和创新的可能性。因此,一次性开源可以将迭代进化的任务交给社区。

正如月之暗面CEO杨植麟在此前接受腾讯采访时表示,“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

再加上马斯克频繁讽刺OpenAI并不Open,外媒Venture Beat认为,Grok-1的开源显然对他来说也是一个有益的立场。

不过,针对让社区来实现迭代这一目的,有业内人士在X平台表示,Grok-1的问题可能是模型参数太大,这需要巨大的计算资源,所以开源社区可能无法对Grok-1进行迭代。

另有评论认为,Grok-1没有对特定任务进行微调,这提高了用户使用它的门槛。AI工具饱和的市场可能更需要针对特定用例的工具。

开源乃大势所趋,初创公司迎来新机会

开源和闭源是当前AI浪潮之下的一个极具争议性的话题。

纽约大学坦登工程学院计算机科学与工程系副教授Julian Togelius在此前接受《每日经济新闻》记者采访时曾认为,开源是业界大势所趋,Meta正在引领这一趋势,其次是Mistral AI、HuggingFace等规模较小的公司。谷歌今年2月罕见地改变了去年坚持的大模型闭源策略,推出了“开源”大模型Gemma,似乎也是对Togelius言论的验证。

从技术视角来看,开源代码可以提高透明度并有助于推进技术发展,也能帮助了解模型弱点,这样才能更好地部署模型,从而降低风险。另一方面,也有不少反对开源的一派认为,开源AI会被不良行为者操纵从而造成风险。

从商业角度来看,Julian Togelius认为开源对防止权力集中很重要,能够避免少数财力雄厚的科技公司控制前沿模型。此外,还有分析认为,对于创业者来说,开源大模型则进一步降低了创业门槛,降低了大模型的开发成本,让更多创业者在基础模型方面处于同一起跑线上。

例如,目前许多开源模型都是基于Meta的开源模型Llama2而开发。据报道,截至2023年底,HuggingFace上开源的大模型排行榜前十名中,有8个是基于Llama2打造的,使用Llama2的开源大模型已经超过1500个。

Grok-1的权重和架构是在宽松的Apache 2.0许可下发布的,这使得研究者和开发者可以自由地使用、修改和分发模型,这种开源方式可以适应多种不同的任务和应用场景,更适合那些想要用开源模型打造自己专有模型的开发者。因此,有分析认为,Grok-1的开源也为许多AI初创公司提供了另一个选择。

例如,AI初创公司Abacus AI的CEO就在X平台上表示,将开始研究Grok-1,并在几周内进行更新/发布。

图片来源:X平台

对话搜索引擎公司Perplexity CEO Aravind Srinivas也在X平台上发文称,将会基于Grok的基础模型进行对话式搜索和推理的微调。

图片来源:X平台

随着开源力量的不断壮大,马萨诸塞大学洛厄尔分校计算机科学教授Jie Wang曾对《每日经济新闻》记者表示,未来各个主要参与者可能都倾向于采用半开源的方式,类似Meta开源Llama2系列大模型的方式,即开源模型的某些部分,以便研究人员和开发人员了解模型的架构和训练过程,但保留最重要的部分,例如用于训练和预训练模型权重的完整数据集。

Grok-1走的也是这样的路线。

知名机器学习研究者Sebastian Raschka认为,“尽管Grok-1比其他通常带有使用限制的开放权重模型更加开源,但是它的开源程度不如Pythia、Bloom和OLMo,后者附带训练代码和可复现的数据集。”

图片来源:X平台

每日经济新闻


马斯克旗下的大模型公司xAI近日发布了一款新的深度学习模型——Grok-1。这款模型是由他的自动驾驶子公司XAutomotive提供的,它是一个混合专家模型,具有大量的文本数据进行训练,不具备针对性的任务训练功能。
与其他大模型相比,Grok-1的参数量大得多,是至今为止业界公开参数最大的模型。但马斯克表示,相比于顶尖的模型,Grok-1仍有一定的差距。他认为,虽然Grok-1的性能还可以,但它并不能击败顶尖的模型,比如OpenAI的ChatGPT-4。
同时,马斯克还在自己的博客上嘲讽OpenAI,他表示,他们一直在问:“OpenAI想获得更多OpenAI的开放部分”。这也反映了马斯克对开源的看法,他认为开源已经成为大势所趋。
此次Grok-1的开源引起了业界的关注,一些专业人士认为,这无疑是对开源社区的一种激励。开源可以让研究者和开发者自由地使用、修改和分发模型,提高了研究效率。但对于拥有强大技术实力的公司来说,开源意味着更高的风险,因为他们需要面对公众的监督和审查。
总的来说,Grok-1的开源是大势所趋,无论是科研机构还是企业,都应该拥抱开源,以共享知识和技术。同时,马斯克的做法也可能引发更多的辩论,我们需要继续关注此事的发展。

上一篇:青海都兰现藏狐,表情包狐狸的脸为何又大又方?藏狐:这可不是随便长的
下一篇:铁木终于开花,比“铁树开花”难多了!
更多更酷的内容分享
猜你感兴趣
马斯克状告OpenAI八天后,Grok开源。

马斯克状告OpenAI八天后,Grok开源。

马斯克旗下的AI大模型Grok在本周开源,引发了科技圈和AI圈的热议。马斯克贴脸嘲讽OpenAI偏离了初衷,并质疑OpenAI全然是微软的好伙伴。尽管更多人参与了进来,但目前还不清楚马斯克的真实动机。

热点资讯 03.18
马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

特斯拉CEO马斯克宣布其人工智能公司xAI的大模型Grok将于本周开源,以寻求OpenAI和谷歌的替代方案。这一决定意味着公众将可免费尝试使用该公司大模型技术背后的代码。马斯克是大模型开源的倡导者,他认为OpenAI应该开放源代码。

热点资讯 03.11
消息来了:马斯克宣布Grok开源!

消息来了:马斯克宣布Grok开源!

马斯克的新款大模型Grok-1参数量达到3140亿,远超OpenAI GPT-3.5。这款大模型采用混合专家(Mixture-of-Experts,MOE)架构,门控网络机制使得每个领域专家负责特定任务。目前,Grok-1项目的评分约3400颗星。

热点资讯 03.18
OpenAI回应马斯克诉讼,道出马斯克退出OpenAI的内幕

OpenAI回应马斯克诉讼,道出马斯克退出OpenAI的内幕

马斯克起诉OpenAI后,OpenAI发表博客文章回应,揭示马斯克离开的直接原因及内部争论。文章显示,马斯克曾承诺资助OpenAI,但在讨论创建营利性实体时扣留资金,并建议将OpenAI并入特斯拉。此外,早在2016年,OpenAI就在争论是否继续选择开源。

热点资讯 03.06
70后农行女性高管晋升至高层,预示着银行业改革与发展新趋势

70后农行女性高管晋升至高层,预示着银行业改革与发展新趋势

张曼获湖南农行派重任官,时值长沙银行半年后新行长人选揭晓,张曼晋升为副行长,成为湖南省万亿上市银行董事长人选,由她提名成为董事会董事候选人。此前张曼加入长沙银行前是中国农业银行的员工,期间担任过多个职务,包括副行长等,此次晋升为总经理。

热点资讯 09.19
东方甄选创始人董宇辉今年或将陷入口碑危机:丈母娘是否被冤枉?

东方甄选创始人董宇辉今年或将陷入口碑危机:丈母娘是否被冤枉?

今年初,董宇辉成为东方甄选最高薪酬雇员之一。他在2024财年年度收益高达3.41亿港元,包括年薪、奖金、期权和新公司分润。自7月25日分手后,他自立门户已55天。但近日舆论场对其进行猛烈批评,被指责“没有文化”,并有人称对其进行了“绞杀”。在此期间,他面临各种商业挑战,如稳住人设、守住口碑和带领“与辉同行”前行等。目前,他的抖音账号粉丝数量超过51.7万,“与辉同行”账号粉丝数超过165.7万,显示出良好的发展势头。尽管如此,东方甄选主账号却掉了24.3万粉丝,这无疑给与辉同行带来了竞争压力。在完成一系列直播带货数据后,于近日新增了一家名为“与辉同行”的品牌公司,实现了业绩增长。与辉同行目前的销售额和粉丝数量均超过了东方甄选,与竞争对手相比有着明显优势。在未来的发展中,他还将继续努力稳定形象,提升口碑,并带领“与辉同行”走向更广阔的舞台。

热点资讯 09.19
科沃斯:过去26年的逆袭之路——如何成为中国及全球的领先智能扫地机器人制造商

科沃斯:过去26年的逆袭之路——如何成为中国及全球的领先智能扫地机器人制造商

科沃斯推出全球首款恒压活水洗地机器人地宝X8 PRO PLUS,打破传统洗地模式。此款产品采用滚筒式结构,通过内置恒压系统提供持续的水源,解决了高清洁度和长寿命的问题。此外,它还配备高性能多维视觉模组和业内首个扫地机器人自研大语言模型,实现了智能交互和自主避障,为用户提供便捷高效的生活体验。这一创新突破标志着科沃斯在扫地机器人领域的领先地位,同时也引领了行业的未来发展方向。

热点资讯 09.19
从大小杨到曾志伟:网站编辑成长历程与自我评价

从大小杨到曾志伟:网站编辑成长历程与自我评价

曾志伟率领公司员工全力支持大小杨哥开设的分公司,并为其捧场,以期借此打开新的市场局面。其背后其实是一场互帮互助的好事。曾志伟的入场既是为了捞取后者的人气,也是为了扩张公司的影响力。最终,被挖墙角的不仅是大小杨哥所在的分公司,还有曾经在其中大放异彩的明星们。

热点资讯 09.19
梦幻西游中西栅黑的绰号-麻狼蹲着尿尿与七星地煞奖励2级神秘石

梦幻西游中西栅黑的绰号-麻狼蹲着尿尿与七星地煞奖励2级神秘石

黑总改名为“麻狼蹲着尿尿”,西栅老街黑总的160法暴神链号已被转会至超级联赛。 内容总结:黑总改名成“麻狼蹲着尿尿”,黑总的新号已在超级联赛报名中。

热点资讯 09.19
深一度:深度解读手机通信技术——寻找寻呼机的历史与现实威胁

深一度:深度解读手机通信技术——寻找寻呼机的历史与现实威胁

黎巴嫩发生多个区域的无线通信设备爆炸事件,伤亡人数超过4000人,死亡人数增多至11人。爆炸可能是由装置故障、电池过热等原因引发。目前,真主党方面怀疑是有人通过传呼机发送恶意信号或指令导致电池过热引发爆炸。该情况引起了外交与安全部门的高度关注,目前尚不清楚爆炸的具体原因。

热点资讯 09.19
梦幻西游:150四蓝字扇子与120第一3伤害戒指,价值远超预期的32万交易揭示

梦幻西游:150四蓝字扇子与120第一3伤害戒指,价值远超预期的32万交易揭示

这位热爱游戏的老玩家在鉴定了一把蓝字扇子后被震惊,发现竟然有疾风荡魄、珍宝、绝杀和必中四种蓝字,对此感到十分兴奋。同时,他也发现了新出的80级超简易戒指具有双速度和敏攻双属性,并且其价格预计会受到市场需求的影响。中秋节当天,一位狗托玩家炸出了11技能的谛听,他立即通过传音方式表达了自己的快乐心情,并成功以32.5万的价格售出了该戒指。

热点资讯 09.19
感受新款iPhone 16系列与手表耳机的细微差别:手机真机与图片观感大不相同

感受新款iPhone 16系列与手表耳机的细微差别:手机真机与图片观感大不相同

样触发拍照模式。对于第三方品牌来说,虽然苹果在智能硬件市场一直具有强大的影响力,但是在智能设备的设计与创新方面却始终表现得相对较弱。此次发布的全系新产品中,消费者可以看到大量模仿自家产品的元素,这也是为何众多科技媒体都将此次发布会称为"战场上的传统秀"。 这次苹果发布会,无论是新品还是之前的老款产品,都被展示得各有特色,而且在很多细节之处都有着独特的设计感。比如iPhone 16系列的新配色方案,既没有了上一代的简洁清新,也没有牺牲细节美感,而是通过色彩的对比使得整体更加活泼明亮。而这些变化,在保证外观美观的同时,也为用户带来了更好的视觉体验。 此外,苹果的全新AR技术也在发布会上得到了深度展示。通过全新的眼镜式AR设备,用户可以在家中就能体验到前所未有的沉浸式体验。这种设备不仅能够提供丰富的视觉信息,还可以让用户参与到游戏或者娱乐活动中去,大大提升了用户的参与感和乐趣。 总的来说,苹果发布的新品及新技术都展现了其强大的创新能力,并且在细节之处充满了创新设计。这对于科技行业来说无疑是一个好消息,也是消费者期待已久的表现。

热点资讯 09.19
朝鲜农村出行需办理通行证: 健康的上网与信息交流方式探讨

朝鲜农村出行需办理通行证: 健康的上网与信息交流方式探讨

朝鲜农村与中国的惊人相似,农民出行需具备证明文件、通行证以及家庭口粮供应制度,其中粮食分配约为每日700克。农村串门还需携带口粮,以免对邻居造成不便;女性也有类似的工作量和待遇差异。朝鲜农村仍采用农业为主的生活方式,大部分时间由政府规划,并分配给农民。

热点资讯 09.19
吉利星愿启动预售,挑战友商市场地位

吉利星愿启动预售,挑战友商市场地位

吉利新推出的紧凑型纯电代步车星愿,外观圆润可爱,内饰精致科技感强。该车预计售价在7.88万至10.78万之间,提供高低功率两种电机供消费者选择。电池容量分别为30.12kWh和40.16kWh,最大续航里程分别为310km和410km。

热点资讯 09.19