马斯克为什么要做开源?

2024-03-21 热点资讯 关注公众号

出品|虎嗅科技组

|齐健

|王一鹏

头图|视觉中国

3月11日周一,马斯克发推文说要在一周内开源Grok。众多开发者等着盼着过了一周,到周日Grok才正式将代码推到了开源社区。

开源的Grok-1是一个基于Transformer架构的自回归模型,参数规模达到3140亿参数,是目前参数量最大的开源模型之一,Grok-1与主流开源大模型一样免费可商用。

在开源之前,Grok最大的亮点是直接调用X中的实时数据和“幽默”。

但开源版本的Grok已经打了折扣——在开发者手里,Grok不可能调取X的数据。从本次开源的信息来看,2023年11月Grok上线以后调用过的X数据,也没有被作为训练数据沉淀到Grok中。

除开源打折外,Grok本身的性能也并不占优。刚上线时,Grok的评分就远落后于当时的Palm 2、Claude 2和GPT-4。最典型的问题是,其支持的上下文长度只有8192个token。

Grok取得的关注(上线3天在GitHub收获3.9万Star),似乎很大一部分都来自马斯克本身的流量热度。开源Grok被马斯克说成是为了践行“AI造福全人类”的目标,但在与OpenAI的官司期间开源,有观点认为,Grok 开源的目的之一,就是为马斯克起诉、声讨OpenAI提供的事实依据——这是一场由马斯克亲自操盘的“AI 大秀”。

开源Grok是作秀?

开源是一场让企业与开发者跳双人舞的“社区游戏”,但Grok这个“舞伴”,完全不是普通开发者所能掌控的。

在Grok-1之前,很多开源大语言模型(LLM)的参数量只有70亿,LLaMA-2开源的最大参数量也只有700亿。

而马斯克直接开源了自家尺寸最大的3140亿参数模型,据估计Grok-1需要约628 GB GPU内存才能勉强运行,普通开发者几乎不可能在本地尝试Grok-1,对于云服务用户来说,至少需要8张80GB显存的A100或H100 GPU。

在Grok的GitHub讨论区有用户留言表示:谷歌云上80GB A100的4卡服务器每小时运行成本是20美元,这不适合我。(GCP instance with 4 A100 80GB; it cost around $20 per hour; this is not for me LOL.)

Grok开源之后,笔者也加入了一个关于Grok的开源讨论群,但到了第二天,群内的讨论焦点,已经转向了只有40亿参数的Qwen-1.5。

不过,Grok-1也支持8bit量化,一些开发者认为,如果模型可以量化到160GB,“可玩性”会大幅提高。算力不太宽裕的开发者,可以等到官方或者其他开发者发布量化版本后再尝试。

至少从短期来看,开源Grok对普通开发者并不是很友好。那么开源对于Grok本身来说,有什么帮助呢?从传统的开源视角来看,也很难说。

一些人认为开源模型可以汇聚更多开发者力量,帮助优化模型。但今天的开源AI与传统的开源软件逻辑几乎完全不同。代码开源对于AI大模型的促进作用,并不像过去的开源软件那样明显。

传统软件开发过程中,一款系统、工具或软件开源以后,开发者可以基于共享代码直接修复bug,优化程序。然而今天的多数AI模型本身就是一个很大的黑盒,要从中找到问题,并对模型的底层算法进行训练、调优并不容易。

“AI大模型训练是一个很‘集中’的工作。”生数科技CEO唐家渝表示,AI大模型很难通过“分布式”的开源来收集开发者的“贡献”。闭源反而是更能集中包括智力的资源、算力的资源,去做不断地迭代的。

一些开发者认为,对于开源AI模型的来说,最大的好处是打响知名度——以Grok目前的模型能力来看,只有吸引一批开发者、公司、机构对模型进行试用、开发,逐步建立起对模型的认可,才能稳固其在AI大模型领域的“江湖地位”,提高这款既不太新,也不太强的AI大模型的影响力。

闭源Grok把路走窄了?

从AI行业角度来看,Grok的受关注度不高。由于模型跑分不高,过去几个月中发布的AI大模型,在对比评测数据集得分时,几乎很少有人对标Grok。

从业务视角来看,Grok在X平台中的表现也不理想。

Grok上线到X后,与ChatGPT Plus一样采取订阅制,但ChatGPT的GPT-3.5免费开放,而Grok则一刀切,只提供给X Premium会员。X Premium会员的订阅费用是16美元包月,168美元包年。

由于一开始就设置了付费门槛,Grok没有吃到X庞大用户基础的红利。

X与三款AI对话网站流量  数据来源|SimilarWeb

虽然影响网站流量的因素很多,且x.com网站的受众、属性与其他几家也有明显差异,直接对比流量并不能完全说明问题,但访问时长的巨大差异,也侧面反映了X用户大概率没有跟付费的Grok聊太多。

马斯克最早给Grok的战略定位,可能更多是考虑促进X的Premium会员销售,以补贴X的广告收入。然而,如今Grok在X中发挥的作用很可能并没有达到马斯克的预期。与其一直在X Premium中“躺平”,开源Grok或许能给马斯克和x.AI打开新局面。

开源激起千层浪

在AI大模型热潮中,靠开源大模型树立行业地位的公司并不少见,包括MistralAI以及国内的智谱,阿里的通义千问等。

深陷元宇宙泥潭的Meta更是依靠开源LLaMA模型打了一次翻身仗。在2023年中,全球市场最大的变数是AI大模型,而Meta最大的变数就是开源了一款AI大模型。

通过开源LLaMA,Meta展现了其在大型语言模型(LLM)领域的技术实力和开放创新的姿态,这在一定程度上帮助公司缓解了市场对其元宇宙战略的担忧。由此Meta的股价也在一年内翻了几番,市值从3155亿美元涨到1.2万亿美元,涨出了19个京东。

LLaMA的开源,特别是其成本效益高的特点,对Meta而言具有战略意义。与Google和Microsoft等竞争对手的AI大模型相比,LLaMA的小巧和高性能使得Meta能够以较低成本部署高效的AI模型。这不仅提高了AI技术的普及率,也为Meta未来在各种应用和用例上的广泛部署提供了可能。有分析人士认为,基于Meta的业务范围,从聊天机器人到游戏,再到未来的生产力软件,生成式AI预计将带动一个价值超过500亿美元的市场。

虽然LLaMA最初的开源一直被业界传说是无意间的“泄露”,但其最终的结果却为Meta在AI大模型行业奠定了技术和市场的领导地位。

“开源”的战略逻辑,对于马斯克来说并不陌生。

2014年,马斯克开放了特斯拉的350多项电动车专利技术。当时马斯克在接受采访时表示,“特斯拉的首要目标是加速全世界向可持续能源转变”。事实证明,马斯克大公无私的“开源”,在后来使得他自己成为了最大的受益者。

特斯拉开放专利的做法,一举将全球汽车市场的水搅浑。大量新能源车企借助特斯拉的专利异军突起,直接激活了整个新能源汽车市场。而特斯拉作为行业领军企业,则借助长期积累的行业口碑和技术开发实力,持续保持了行业的领先地位。

虽然开源Grok大概不会像特斯拉开放专利那一石激起千层浪,改变整个AI行业的格局,但对于目前的x.AI来说,应该也会产生一些积极的影响。


本文主要探讨了开源Grok项目及其对普通开发者的影响。Grok是一个基于Transformer架构的自回归模型,其参数量高达3140亿参数,是目前参数量最大的开源模型之一。但在公开前,Grok的参数并未用于任何实际任务。
尽管如此,开源Grok的成功也引起了一些争议。许多开发者期待通过开源模型获取更多的研究机会和合作机会,但这同时也带来了挑战,例如高计算要求和潜在的合规风险。此外,开源Grok是否真正适用于人工智能领域,还有待进一步探索。
开源AI模型可以汇聚更多开发者力量,但其在某些方面并不如传统的开源软件那样明显。AI大模型的研发往往需要庞大的资金投入和复杂的算法开发,这些因素通常会影响到开源项目的吸引力。
虽然开源模型可以帮助推动AI技术的发展,但对于不同的企业和市场,其使用效果可能会有所不同。对于Grok这样依赖GPU资源的模型,可能不如一些专门针对低硬件要求的模型更有效。
最后,开源Grok的成功也引发了人们对于人工智能领域开放策略的深入思考。如何平衡商业化和学术研究之间的关系,以及如何保证AI技术的安全性和公平性,都是值得我们关注的问题。

上一篇:家长注意!4月1日起,长沙中小学入学报名系统将开放
下一篇:从极草到听花酒,这片土地上行骗的成本实在太低(上)
更多更酷的内容分享
猜你感兴趣
消息来了:马斯克宣布Grok开源!

消息来了:马斯克宣布Grok开源!

马斯克的新款大模型Grok-1参数量达到3140亿,远超OpenAI GPT-3.5。这款大模型采用混合专家(Mixture-of-Experts,MOE)架构,门控网络机制使得每个领域专家负责特定任务。目前,Grok-1项目的评分约3400颗星。

热点资讯 03.18
马斯克怒告OpenAI,被骗要赔偿,还要求开源!

马斯克怒告OpenAI,被骗要赔偿,还要求开源!

马斯克因违反合同将OpenAI告上法院,要求赔偿损失、恢复开源和非盈利性质,并切断其与微软的财路。诉讼文件中揭露了OpenAI违背初衷和一些不为人知的内幕细节。案件管理会议定于2024年7月31日召开。

热点资讯 03.02
马斯克与OpenAI分道扬镳,大模型开源还是闭源,你怎么看?

马斯克与OpenAI分道扬镳,大模型开源还是闭源,你怎么看?

马斯克起诉OpenAI事件引发关注,争议焦点在于马斯克对OpenAI的开源要求。纽约大学副教授Julian Togelius认为开源是大势所趋,可防止权力集中。马萨诸塞大学教授Jie Wang则表示未来各主要参与者可能会部分开源,但不会包括最重要的部分。此次纠纷反映出AI浪潮下科学界的长期争论话题——开源还是闭源。

热点资讯 03.09
马斯克加入开源AI大军

马斯克加入开源AI大军

特斯拉创始人埃隆·马斯克宣布开源大语言模型Grok-1,打破了对OpenAI封闭路线的不满,引发全球关注。

热点资讯 03.23
比特币影子股MSTR的热度:基金经理大喊,是不同于怪兽的另类投资选择

未来可期!比特币影子股MSTR引基金经理高呼:这可能是一只不同的怪兽

比特币影子股MSTR的热度:基金经理大喊,是不同于怪兽的另类投资选择 未来可期!比特币影子股MSTR引基金经理高呼:这可能是一只不同的怪兽

市场出现了对"比特币大户"公司的提振,尤其是MicroStrategy成为最大的受益者。然而,这引来了股市动荡和限制了MSTR的一些衍生品交易。由于受到交易所规模、敏感度和成本等因素的影响,一些主要经纪人和客户被迫限制了这款ETF的交易。随着市场的变动,这种限制可能会继续存在一段时间。MSTR ETF的表现强劲,目前资产已接近50亿美元,三个月内增长了近600%。投资者对此表示乐观,并预计它将继续增长。对于管理MSTU的Tuttle Capital Management来说,面临的风险更大,必须寻求其他方式来满足其目标。

热点资讯 11.23
住建部与财政部公布:全国300个重点城市房价或将迎价格上涨趋势

住建部与财政部公布:全国300个重点城市房价或将迎价格上涨趋势

住建部、财政部联合发布通知,扩大城中村改造政策支持范围至近300个地级及以上城市,有助于解决棚户区问题,推动城市更新进程。随着政策执行,有望带动二线甚至三线城市的发展动力,改善居住条件,提高生活质量。此举有望促使房价止跌回稳,为楼市带来积极影响。

热点资讯 11.23
美国大选结果公布:消费者信心低迷,长期通胀预期再次触及上限顶点

美国大选结果公布:消费者信心低迷,长期通胀预期再次触及上限顶点

美国大选尘埃落定后,消费者信心及通胀预期均低于预期,反映了人们对特朗普政府经济前景的看法分歧。11月消费者信心指数终值创历史最高,预计2023年通胀率也将高于2020年,需警惕通胀失控的风险。

热点资讯 11.23
国产手机厂商的海外扩张之路:理想与现实的深度探索

国产手机厂商的海外扩张之路:理想与现实的深度探索

国产手机厂商正在走向海外市场以摆脱国内市场的“内卷”困境和追求更高的利润与品牌溢价。他们在欧洲、东南亚、印度和非洲等地成为主要出海地区,特别是欧洲市场的重要性不言而喻。然而,全球复杂的外部环境如关税、汇率波动等问题给他们的出海带来了挑战。虽然一些厂商已经取得了显著的成果,但是要想在全球市场上占有一席之地仍然需要面对许多困难。他们需要了解并精确把握不同市场的特点,并且在出海时考虑各种因素,包括文化差异和消费者需求偏好多样性。尽管面临诸多挑战,但是中国智能手机市场的未来仍然充满希望。

热点资讯 11.23
电商平台:双11拼数据而非拼力量的转变

电商平台:双11拼数据而非拼力量的转变

今年“双11”电商竞争策略转向补贴用户和商家,以满足消费者需求并提升平台竞争力;京东数据显示,AI学习机成交额同比增长超10倍;天猫平台上,国际大牌备受青睐,国货品牌表现依旧亮眼;电商平台的竞争策略开始转变,不再热衷于传统的价格战、广告战等做法,而是把资源更多投入于补贴用户、补贴商家等环节;新一轮的以旧换新补贴也为“双11”期间的家电销售再添动力。

热点资讯 11.23
迪士尼、谷歌等广告商暂停使用马斯克 X 平台,消息称其逐渐回归

迪士尼、谷歌等广告商暂停使用马斯克 X 平台,消息称其逐渐回归

《马斯克撤回广告与迪士尼回归给 X 平台带来希望》\n\n近期,某知名电商平台宣布部分企业已重返该平台投放广告。此举措被业界视为对马斯克撤回广告言论的回应。\n\n分析数据显示,由于马斯克的一次攻击性言论导致部分企业撤回X平台的广告,但这并未阻止企业如迪士尼、康卡斯特、狮门娱乐和华纳兄弟探索等回到平台上投放广告。\n\n据统计,这些企业在2024年1月至9月期间在X平台的广告支出总计约为330万美元,其中康卡斯特占近150万美元,华纳兄弟探索支出约110万美元,迪士尼约55万美元,狮门娱乐接近23万美元。\n\n虽然这并非大规模广告预算,但对于马斯克和X平台而言,此次举动无疑是具有象征意义的成功。马斯克在接受媒体采访时表示,他对此感到非常感谢,并欢迎各大品牌重新在X平台投放广告。\n\n未来,随着X平台适应和调整,其广告生态正在逐步回归主流视野。这显示出,无论何种情况,只要有决心和毅力,就有可能实现从困境到胜利的转变。

热点资讯 11.23
国家数据基础设施建设指引释放的信号:明确技术路线与实践路径

国家数据基础设施建设指引释放的信号:明确技术路线与实践路径

础设施共同构成的数据平台。这一变化将有助于提高数据资源配置效率,并且更好地满足未来数字化发展的需求。同时,这也是我国积极推进数据要素市场化配置的重要举措之一。从该信息中我们可以看出,建设国家数据基础设施的目标是为了满足数字中国的建设需求,并通过优化数据资源配置来提升数字经济发展水平。

热点资讯 11.23
拼多多电话会:如何应对增长放缓的压力并做好持久战的准备?

拼多多电话会:如何应对增长放缓的压力并做好持久战的准备?

拼多多公布季度业绩:营收增长44%,净利润增长61%,环比下滑22%。宣布推出一系列扶持商家的举措,并指出受外部环境和运营模式等因素的影响,业务增速将长期放缓。分析人士对全球化业务未来发展持谨慎态度。 总结:拼多多Q3业绩报告显示营收、净利润均创纪录增长,但环比下滑明显。公司推出扶持商家举措以降低成本并提升经营效率。面临市场竞争加剧、全球化业务挑战等问题,管理层预测将持续加大在商家生态上的投入。

热点资讯 11.23
人形机器人产业发展热度持续提升,多家公司发布最新进展信息

调整如下:
人形机器人行业蓬勃发展,上市公司更新研发进程时间表,引关注

人形机器人产业发展热度持续提升,多家公司发布最新进展信息 调整如下: 人形机器人行业蓬勃发展,上市公司更新研发进程时间表,引关注

多家上市公司在人工智能(AI)相关领域取得了新进展,如机器人技术与配件的研发。企业将在接下来的五年内,投入逾500亿元资金,以覆盖更多空中、陆地和海洋交通方案,并推出自主研发的人形机器人。此外,长安汽车已决定在未来五年内,在海陆空立体交通方案及人形机器人的领域投入超过500亿元。

热点资讯 11.23
《小巷人家》大结局:四个人物的困扰与胜利 - 一个关于胜利和挑战的故事

《小巷人家》大结局:四个人物的困扰与胜利 - 一个关于胜利和挑战的故事

张阿妹最后嫁给了自己的弟弟张瑞霖,并且他们一家人的生活都非常的好,张阿妹因为过度赚钱而让自己的亲戚们都深受其害,这个也是让人感到非常伤心的事情。 尽管其他的角色也都有了自己的结果,但是从故事的整个走向来看,观众仍然可以感受到这些角色之间存在着一些复杂的矛盾和冲突。例如,张阿妹的自私和狠辣让她的家人备受伤害,而其他人则在他们的帮助下得到了成功,这种对比和对立给人留下了深刻的印象。同时,故事中的某些情节也让人深感遗憾,例如,有些角色的出现只是为了衬托其他人物的发展,但是最后的结果并没有得到公正的评价,这也让人感到失望。总的来说,这部剧的四大意难平之处在于角色之间的复杂关系和故事的结局的不合理性。

热点资讯 11.23