开源Grok并非是对OpenAI的回应。马斯克有更宏大的计划。

2024-03-19 热点资讯 关注公众号

每经记者:文巧    每经:兰素英

3月18日,马斯克旗下大模型公司xAI兑现诺言,正式对Grok-1大模型开源。随后在X平台上,马斯克还不忘嘲讽OpenAI一番,“我们想了解更多OpenAI的开放部分”。

据悉,Grok-1模型参数大小为3140亿,是迄今为止业界开源参数最大的模型。

马斯克的开源举措引发了业界的广泛关注和热烈讨论。表面上,这一举动像是针对OpenAI的一记“回击”,但从更深的层次来看,还隐藏着马斯克的战略谋划和考量。

据xAI去年公布的文档,尽管Grok-1在各个测试集中呈现的效果要比GPT-3.5、Llama2要好,但距离Palm-2、Claude2和GPT-4仍然差了一大截。

因此有分析认为,在强敌环伺,且Grok难以匹敌顶尖大模型的情况下,马斯克选择开源是必然之举,其考量之一可能是将模型迭代进化的任务交给社区。

开源还是闭源,一直是AI浪潮之下一个极具争议性的话题。有AI专家此前在接受《每日经济新闻》记者采访时认为,开源已是大势所趋。从商业角度来看,开源不仅能够避免少数财力雄厚的科技公司控制前沿模型,对于AI创业者来说,也进一步降低了门槛和成本。

马斯克的“阳谋”:让开源社区迭代模型

3月18日凌晨,马斯克旗下大模型公司xAI宣布正式开源3140亿参数的混合专家(MoE)模型Grok-1以及该模型的权重和网络架构。截至发稿,在Github上,该开源项目已经揽获31.6k星标,足见其火爆程度。

图片来源:Github

值得注意的是,这是迄今为止业界开源参数最大的模型,超过GPT-3.5当时1750亿的参数量。

DeepMind工程师Aleksa Gordié预测,Grok-1的能力应该比Llama2要强,但目前尚不清楚有多少数据受到了污染,二者的参数量也不是一个量级。

从Grok-1的模型细节来看,值得注意的一点是,该基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调。而在X平台上可用的Grok大模型就是微调过的版本,其行为和原始权重版本并不相同。也就是说,xAI目前开源的Grok-1模型并不包括X平台上的语料。

据xAI去年公布的文档,从Grok-1的整体测试效果来看,Grok-1在各个测试集中呈现的效果要比GPT-3.5、70亿参数的Llama2和Inflection-1要好,但距离Palm-2、Claude2和GPT-4仍然差了一大截。

图片来源:xAI

基于此,有分析认为,马斯克开源Grok-1的一个考量是,尽管该模型表现尚可,但“比上不足,比下有余”,并未具备打败顶尖模型如GPT-4的能力,更别说未来的GPT-5。

在大模型角逐的当下,尽管Grok依托X平台的数据,但其无论是在能力上,还是知名度上都不具备与OpenAI、谷歌、Anthropic等公司匹敌的优势。尤其是今年以来,谷歌发布了Gemini,Anthropic发布了Claude3,大型语言模型的竞争更加激烈,在这样的情况下,马斯克选择开源路线也是必然之举。

模型开源让研究者和开发者可以自由地使用、修改和分发模型,打开了更多开放合作和创新的可能性。因此,一次性开源可以将迭代进化的任务交给社区。

正如月之暗面CEO杨植麟在此前接受腾讯采访时表示,“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

再加上马斯克频繁讽刺OpenAI并不Open,外媒Venture Beat认为,Grok-1的开源显然对他来说也是一个有益的立场。

不过,针对让社区来实现迭代这一目的,有业内人士在X平台表示,Grok-1的问题可能是模型参数太大,这需要巨大的计算资源,所以开源社区可能无法对Grok-1进行迭代。

另有评论认为,Grok-1没有对特定任务进行微调,这提高了用户使用它的门槛。AI工具饱和的市场可能更需要针对特定用例的工具。

开源乃大势所趋,初创公司迎来新机会

开源和闭源是当前AI浪潮之下的一个极具争议性的话题。

纽约大学坦登工程学院计算机科学与工程系副教授Julian Togelius在此前接受《每日经济新闻》记者采访时曾认为,开源是业界大势所趋,Meta正在引领这一趋势,其次是Mistral AI、HuggingFace等规模较小的公司。谷歌今年2月罕见地改变了去年坚持的大模型闭源策略,推出了“开源”大模型Gemma,似乎也是对Togelius言论的验证。

从技术视角来看,开源代码可以提高透明度并有助于推进技术发展,也能帮助了解模型弱点,这样才能更好地部署模型,从而降低风险。另一方面,也有不少反对开源的一派认为,开源AI会被不良行为者操纵从而造成风险。

从商业角度来看,Julian Togelius认为开源对防止权力集中很重要,能够避免少数财力雄厚的科技公司控制前沿模型。此外,还有分析认为,对于创业者来说,开源大模型则进一步降低了创业门槛,降低了大模型的开发成本,让更多创业者在基础模型方面处于同一起跑线上。

例如,目前许多开源模型都是基于Meta的开源模型Llama2而开发。据报道,截至2023年底,HuggingFace上开源的大模型排行榜前十名中,有8个是基于Llama2打造的,使用Llama2的开源大模型已经超过1500个。

Grok-1的权重和架构是在宽松的Apache 2.0许可下发布的,这使得研究者和开发者可以自由地使用、修改和分发模型,这种开源方式可以适应多种不同的任务和应用场景,更适合那些想要用开源模型打造自己专有模型的开发者。因此,有分析认为,Grok-1的开源也为许多AI初创公司提供了另一个选择。

例如,AI初创公司Abacus AI的CEO就在X平台上表示,将开始研究Grok-1,并在几周内进行更新/发布。

图片来源:X平台

对话搜索引擎公司Perplexity CEO Aravind Srinivas也在X平台上发文称,将会基于Grok的基础模型进行对话式搜索和推理的微调。

图片来源:X平台

随着开源力量的不断壮大,马萨诸塞大学洛厄尔分校计算机科学教授Jie Wang曾对《每日经济新闻》记者表示,未来各个主要参与者可能都倾向于采用半开源的方式,类似Meta开源Llama2系列大模型的方式,即开源模型的某些部分,以便研究人员和开发人员了解模型的架构和训练过程,但保留最重要的部分,例如用于训练和预训练模型权重的完整数据集。

Grok-1走的也是这样的路线。

知名机器学习研究者Sebastian Raschka认为,“尽管Grok-1比其他通常带有使用限制的开放权重模型更加开源,但是它的开源程度不如Pythia、Bloom和OLMo,后者附带训练代码和可复现的数据集。”

图片来源:X平台

每日经济新闻


马斯克旗下的大模型公司xAI近日发布了一款新的深度学习模型——Grok-1。这款模型是由他的自动驾驶子公司XAutomotive提供的,它是一个混合专家模型,具有大量的文本数据进行训练,不具备针对性的任务训练功能。
与其他大模型相比,Grok-1的参数量大得多,是至今为止业界公开参数最大的模型。但马斯克表示,相比于顶尖的模型,Grok-1仍有一定的差距。他认为,虽然Grok-1的性能还可以,但它并不能击败顶尖的模型,比如OpenAI的ChatGPT-4。
同时,马斯克还在自己的博客上嘲讽OpenAI,他表示,他们一直在问:“OpenAI想获得更多OpenAI的开放部分”。这也反映了马斯克对开源的看法,他认为开源已经成为大势所趋。
此次Grok-1的开源引起了业界的关注,一些专业人士认为,这无疑是对开源社区的一种激励。开源可以让研究者和开发者自由地使用、修改和分发模型,提高了研究效率。但对于拥有强大技术实力的公司来说,开源意味着更高的风险,因为他们需要面对公众的监督和审查。
总的来说,Grok-1的开源是大势所趋,无论是科研机构还是企业,都应该拥抱开源,以共享知识和技术。同时,马斯克的做法也可能引发更多的辩论,我们需要继续关注此事的发展。

上一篇:青海都兰现藏狐,表情包狐狸的脸为何又大又方?藏狐:这可不是随便长的
下一篇:铁木终于开花,比“铁树开花”难多了!
更多更酷的内容分享
猜你感兴趣
马斯克状告OpenAI八天后,Grok开源。

马斯克状告OpenAI八天后,Grok开源。

马斯克旗下的AI大模型Grok在本周开源,引发了科技圈和AI圈的热议。马斯克贴脸嘲讽OpenAI偏离了初衷,并质疑OpenAI全然是微软的好伙伴。尽管更多人参与了进来,但目前还不清楚马斯克的真实动机。

热点资讯 03.18
马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

特斯拉CEO马斯克宣布其人工智能公司xAI的大模型Grok将于本周开源,以寻求OpenAI和谷歌的替代方案。这一决定意味着公众将可免费尝试使用该公司大模型技术背后的代码。马斯克是大模型开源的倡导者,他认为OpenAI应该开放源代码。

热点资讯 03.11
消息来了:马斯克宣布Grok开源!

消息来了:马斯克宣布Grok开源!

马斯克的新款大模型Grok-1参数量达到3140亿,远超OpenAI GPT-3.5。这款大模型采用混合专家(Mixture-of-Experts,MOE)架构,门控网络机制使得每个领域专家负责特定任务。目前,Grok-1项目的评分约3400颗星。

热点资讯 03.18
OpenAI回应马斯克诉讼,道出马斯克退出OpenAI的内幕

OpenAI回应马斯克诉讼,道出马斯克退出OpenAI的内幕

马斯克起诉OpenAI后,OpenAI发表博客文章回应,揭示马斯克离开的直接原因及内部争论。文章显示,马斯克曾承诺资助OpenAI,但在讨论创建营利性实体时扣留资金,并建议将OpenAI并入特斯拉。此外,早在2016年,OpenAI就在争论是否继续选择开源。

热点资讯 03.06
蔚来换电冷清无人问津,奇瑞依靠固态电池弯道超车,中国电动汽车再创辉煌!

蔚来换电冷清无人问津,奇瑞依靠固态电池弯道超车,中国电动汽车再创辉煌!

固态电池将是未来新能源车的重要发展趋势。然而,其安全性和生产成本等问题还需解决。据报道,一块搭载固态电池的电动汽车在被切块后仍能正常工作,并有望在2026年上市,预计其纯电续航将达到1500km。尽管如此,固态电池的成本仍较高,且良品率还需提高。对于蔚来的蔚来ET7车型,其搭载的正是全固态电池。

热点资讯 11.23
天弘余额宝投资价值增长放缓:富裕人群流失严重?

天弘余额宝投资价值增长放缓:富裕人群流失严重?

天弘余额宝曾经作为最大的货币基金之一,在2018年开启混合策略,后来逐渐减弱吸引力,至2024年夏天达到最高份额1.95亿份,占比仅为0.03%。同时,与其他货币基金相比,天弘余额宝的收益表现也有所下滑,其7日年化收益已经从历史高峰降至1.31%。 尽管如此,天弘基金在非货基金领域仍然面临挑战。数据显示,目前管理规模超过10亿元的基金经理非常稀少,且在非货基金市场的表现糟糕。 为了提高非货基金的表现,天弘基金将加大培养知名基金经理的努力。事实上,早在成立之初,黄辰立和韩歆毅都是公司的创始人之一,曾共同创立了天弘余额宝。在此之后,两者的关系一度变得复杂,特别是在蚂蚁集团发生合并后,人们对天弘基金的未来持谨慎态度。 近年来,天弘余额宝遭遇了一些挑战,包括如何保持竞争力以及吸引更多的投资者。最近,该公司发布了一项重要信息,即原董事长韩歆毅因为工作原因离职,由黄辰立接替担任公司的新一任董事长。 值得关注的是,黄辰立与韩歆毅均出生于蚂蚁集团(原“蚂蚁金服”),这显示了他们在这家公司内部的密切联系和相互依赖。对于天弘基金来说,接下来的挑战可能会更为复杂和充满不确定性。

热点资讯 11.23
国君集团与海通证券达成合并重组协议,百亿元资金注入重要领域

国君集团与海通证券达成合并重组协议,百亿元资金注入重要领域

国泰君安、海通证券合并重组进度显著,前者吸收后者后,拟募集不超过100亿元配套资金。该交易或将在年底前完成,这标志着中国资本市场史上最快的大规模并购案例。此次收购有望使两公司更快地扩大市场份额,提高在证券市场的竞争力。然而,跨国并购还面临各种挑战,如文化融合、组织结构调整、人员安置和业务协同等。此外,证监会已经批准了该交易,这也表明监管层对此交易持开放态度。这一过程表明,随着中国资本市场的发展,大型金融机构之间的并购交易将会更加频繁。

热点资讯 11.23
比特币影子股MSTR的热度:基金经理大喊,是不同于怪兽的另类投资选择

未来可期!比特币影子股MSTR引基金经理高呼:这可能是一只不同的怪兽

比特币影子股MSTR的热度:基金经理大喊,是不同于怪兽的另类投资选择 未来可期!比特币影子股MSTR引基金经理高呼:这可能是一只不同的怪兽

市场出现了对"比特币大户"公司的提振,尤其是MicroStrategy成为最大的受益者。然而,这引来了股市动荡和限制了MSTR的一些衍生品交易。由于受到交易所规模、敏感度和成本等因素的影响,一些主要经纪人和客户被迫限制了这款ETF的交易。随着市场的变动,这种限制可能会继续存在一段时间。MSTR ETF的表现强劲,目前资产已接近50亿美元,三个月内增长了近600%。投资者对此表示乐观,并预计它将继续增长。对于管理MSTU的Tuttle Capital Management来说,面临的风险更大,必须寻求其他方式来满足其目标。

热点资讯 11.23
住建部与财政部公布:全国300个重点城市房价或将迎价格上涨趋势

住建部与财政部公布:全国300个重点城市房价或将迎价格上涨趋势

住建部、财政部联合发布通知,扩大城中村改造政策支持范围至近300个地级及以上城市,有助于解决棚户区问题,推动城市更新进程。随着政策执行,有望带动二线甚至三线城市的发展动力,改善居住条件,提高生活质量。此举有望促使房价止跌回稳,为楼市带来积极影响。

热点资讯 11.23
美国大选结果公布:消费者信心低迷,长期通胀预期再次触及上限顶点

美国大选结果公布:消费者信心低迷,长期通胀预期再次触及上限顶点

美国大选尘埃落定后,消费者信心及通胀预期均低于预期,反映了人们对特朗普政府经济前景的看法分歧。11月消费者信心指数终值创历史最高,预计2023年通胀率也将高于2020年,需警惕通胀失控的风险。

热点资讯 11.23
国产手机厂商的海外扩张之路:理想与现实的深度探索

国产手机厂商的海外扩张之路:理想与现实的深度探索

国产手机厂商正在走向海外市场以摆脱国内市场的“内卷”困境和追求更高的利润与品牌溢价。他们在欧洲、东南亚、印度和非洲等地成为主要出海地区,特别是欧洲市场的重要性不言而喻。然而,全球复杂的外部环境如关税、汇率波动等问题给他们的出海带来了挑战。虽然一些厂商已经取得了显著的成果,但是要想在全球市场上占有一席之地仍然需要面对许多困难。他们需要了解并精确把握不同市场的特点,并且在出海时考虑各种因素,包括文化差异和消费者需求偏好多样性。尽管面临诸多挑战,但是中国智能手机市场的未来仍然充满希望。

热点资讯 11.23
电商平台:双11拼数据而非拼力量的转变

电商平台:双11拼数据而非拼力量的转变

今年“双11”电商竞争策略转向补贴用户和商家,以满足消费者需求并提升平台竞争力;京东数据显示,AI学习机成交额同比增长超10倍;天猫平台上,国际大牌备受青睐,国货品牌表现依旧亮眼;电商平台的竞争策略开始转变,不再热衷于传统的价格战、广告战等做法,而是把资源更多投入于补贴用户、补贴商家等环节;新一轮的以旧换新补贴也为“双11”期间的家电销售再添动力。

热点资讯 11.23
迪士尼、谷歌等广告商暂停使用马斯克 X 平台,消息称其逐渐回归

迪士尼、谷歌等广告商暂停使用马斯克 X 平台,消息称其逐渐回归

《马斯克撤回广告与迪士尼回归给 X 平台带来希望》\n\n近期,某知名电商平台宣布部分企业已重返该平台投放广告。此举措被业界视为对马斯克撤回广告言论的回应。\n\n分析数据显示,由于马斯克的一次攻击性言论导致部分企业撤回X平台的广告,但这并未阻止企业如迪士尼、康卡斯特、狮门娱乐和华纳兄弟探索等回到平台上投放广告。\n\n据统计,这些企业在2024年1月至9月期间在X平台的广告支出总计约为330万美元,其中康卡斯特占近150万美元,华纳兄弟探索支出约110万美元,迪士尼约55万美元,狮门娱乐接近23万美元。\n\n虽然这并非大规模广告预算,但对于马斯克和X平台而言,此次举动无疑是具有象征意义的成功。马斯克在接受媒体采访时表示,他对此感到非常感谢,并欢迎各大品牌重新在X平台投放广告。\n\n未来,随着X平台适应和调整,其广告生态正在逐步回归主流视野。这显示出,无论何种情况,只要有决心和毅力,就有可能实现从困境到胜利的转变。

热点资讯 11.23
国家数据基础设施建设指引释放的信号:明确技术路线与实践路径

国家数据基础设施建设指引释放的信号:明确技术路线与实践路径

础设施共同构成的数据平台。这一变化将有助于提高数据资源配置效率,并且更好地满足未来数字化发展的需求。同时,这也是我国积极推进数据要素市场化配置的重要举措之一。从该信息中我们可以看出,建设国家数据基础设施的目标是为了满足数字中国的建设需求,并通过优化数据资源配置来提升数字经济发展水平。

热点资讯 11.23