消息来了:马斯克宣布Grok开源!

2024-03-18 热点资讯 关注公众号

智东西(公众号:zhidxcom)

| 云鹏

| 心缘

6个月掏出3410亿参数自研大模型,马斯克说到做到!

智东西3月18日消息,就在刚刚,马斯克的AI创企xAI正式发布了此前备受期待大模型Grok-1,其参数量达到了3140亿,远超OpenAI GPT-3.5的1750亿。

这是迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。

Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,这种MOE架构重点在于提高大模型的训练和推理效率,形象地理解,MOE就像把各个领域的“专家”集合到了一起,遇到任务派发给不同领域的专家,最后汇总结论,提升效率。决定每个专家做什么的是被称为“门控网络”的机制。

xAI已经将Grok-1的权重和架构在GitHub上开源。

GitHub地址:

https://github.com/xai-org/grok-1?tab=readme-ov-file

目前Grok-1的源权重数据大小大约为300GB。

截至北京时间3月18日上午7时许,Grok-1项目收获了3400颗星。

Grok-1是马斯克xAI自2023年7月12日成立以来发布的首个自研大模型。xAI特别强调说这是他们自己从头训练的大模型。Grok-1没有针对特定应用进行微调。

xAI是马斯克去年刚刚成立的明星AI创企,其目的之一就是与OpenAI、谷歌、微软等对手在大模型领域进行竞争,其团队来自OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等诸多知名企业和研究机构。

此前马斯克刚刚“怒喷”OpenAI不够“Open”,后脚这就开源了自家的顶级3410亿参数自研大模型Grok-1。虽然马斯克在预热到发布的过程中也“放了几次鸽子”,但最终他并没有食言。

今天,xAI还公布了Grok-1的更多细节:

基础模型基于大量文本数据训练,未针对特定任务进行微调。

3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%。

xAI从2023年10月开始使用自定义训练堆栈在JAX和Rust之上从头开始训练。

但此次xAI并没有放出Grok-1的具体测试成绩,其与OpenAI即将发布的GPT-5的大模型王者之战,必将成为业内关注的焦点。

当然,马斯克发大模型,怎么会少的了大佬隔空对线“互怼”?

xAI官方消息刚刚发布,ChatGPT的官方账号马上就跟马斯克在X平台上进行了互动,在Grok官方账号评论下回复道:“偷了我的笑话。”

马斯克自然不会示弱,马上说请告诉我OpenAI“Open”之处在哪里。

马斯克高仿号也马上跑过来添油加醋,说我们都知道是Sam在运营ChatGPT的账号。

值得一提的是,此次xAI发布Grok-1消息的封面图片,是由Midjourney生成,Grok给出了提示文本:一个神经网络的3D插图,具有透明节点和发光连接,展示不同粗细和颜色的连接线的不同权重(A 3D illustration of a neural network, with transparent nodes and glowing connections, showcasing the varying weights as different thicknesses and colors of the connecting lines)。

原图:


结论:
马斯克的Grok-1大模型参数量达到3140亿,远超OpenAI GPT-3.5的1750亿,这不仅是中国AI创企xAI自研的最新成果,也是全球范围内参数量最大的开源大语言模型。
马斯克提到做到这一点,并表示这是他从头训练的结果,而不是专门针对特定应用进行微调。这也表明他在推进AI技术的发展方面有着坚定的决心和决心。
建议:
对于xAI来说,他们的成功值得鼓励,但也需要保持警惕。他们的成功无疑展示了中国AI技术的进步和潜力,但也应注意到在科研道路上存在的挑战和风险。此外,他们的大模型也需要在性能和安全等方面做出更多的努力。

上一篇:韩媒:未来核心科技,韩国更落后中国
下一篇:全球科技早参丨Sora训练数据被质疑
更多更酷的内容分享
猜你感兴趣
马斯克公布:本周开源强大的xAI语言模型Grok,通俗易懂!

马斯克公布:本周开源强大的xAI语言模型Grok,通俗易懂!

马斯克宣布xAI的Grok将开源,但未明确说明哪些部分。Grok表达了对开源的期待和担忧。同时,马斯克起诉OpenAI和阿尔特曼违约,指控他们背离了最初的使命和保密GPT-4的设计。特斯拉股票上涨1.39%,柏林超级工厂的电力恢复。

热点资讯 03.12
马斯克状告OpenAI八天后,Grok开源。

马斯克状告OpenAI八天后,Grok开源。

马斯克旗下的AI大模型Grok在本周开源,引发了科技圈和AI圈的热议。马斯克贴脸嘲讽OpenAI偏离了初衷,并质疑OpenAI全然是微软的好伙伴。尽管更多人参与了进来,但目前还不清楚马斯克的真实动机。

热点资讯 03.18
马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

特斯拉CEO马斯克宣布其人工智能公司xAI的大模型Grok将于本周开源,以寻求OpenAI和谷歌的替代方案。这一决定意味着公众将可免费尝试使用该公司大模型技术背后的代码。马斯克是大模型开源的倡导者,他认为OpenAI应该开放源代码。

热点资讯 03.11
马斯克公开Grok原始动力

马斯克公开Grok原始动力

马斯克宣布其AI公司Grok将在本周内开源,这是在控告OpenAI及奥特曼违背创始协议后采取的行动。OpenAI公开邮件反驳指控,并称马斯克曾承诺捐款并同意对外融资。Grok闭源已走投无路,只有开源一条路可走。然而,马斯克创办Grok的初衷并非为了开源,而是商业利益。

热点资讯 03.12
成功转战LNG赛场!Yagao图受宠若惊,韩国队质疑替补选手人选

或者

‘LNG世界赛租借Yagao图’引发争议:韩国官方对替补选手不满

成功转战LNG赛场!Yagao图受宠若惊,韩国队质疑替补选手人选 或者 ‘LNG世界赛租借Yagao图’引发争议:韩国官方对替补选手不满

事件是因中单选手scout合同问题被限制出境,无法参加S14世界赛,无奈之下转向其他战队租借中单选手Yagao。此事引发了Lck玩家的不满,并称Lpl赛区在世界赛前轻松租借选手的规则违背公平竞争原则。拳头官方则指出在8月16日提交参赛名额后,允许队伍组建临时超级战队,违反规则。对此,有玩家调侃称其可能为要给scout办退役仪式做铺垫。

热点资讯 09.19
中国创造,全球首台人体哈勃望远镜成功制造

中国创造,全球首台人体哈勃望远镜成功制造

"人体哈勃望远镜"和"探索者"全身PET-CT是中国自主研发的世界首款全球顶尖的医疗设备,能实时动态监测药物在人体全身代谢分布,具备极高的灵敏度和快速扫描能力。中国高端医学影像设备已在国内外市场上占据主导地位,并走出国门,展现出中国高质量发展的优秀成绩。

热点资讯 09.19
斗罗大陆:第67集预告被大量用户质疑和怒斥,其中的关键内容为何被删除?

斗罗大陆:第67集预告被大量用户质疑和怒斥,其中的关键内容为何被删除?

斗罗大陆第二部第67集预告遭大量网友炮轰,原因是该预告中出现了张乐萱这个名字,引发了大量网友不满。其中一名大美女张乐萱在预告中并未出现,引起了很多网友不满。对于导演的行为,有人认为其不分主次,甚至将张乐萱这样重要的人物删掉。另一些人则认为,虽然新一代史莱克七怪即将重聚,但他们还未与寒若若、楚倾天等新人交手,因此期待他们的精彩表现。最后,导演选择了删掉新一代史莱克七怪首战,以避免了过于激烈的打斗场面。

热点资讯 09.18
中国在绿色能源领域已成为全球领导者

中国在绿色能源领域已成为全球领导者

长57%,而欧洲仅为11%,美国只有4%。 在这篇文章中,《纽约时报》专栏作家大卫·华莱士-威尔斯批评了美国企图通过推行一系列绿色科技关税来阻挡中国在绿色能源转型方面的努力,认为这标志着美国在全球绿色转型中全面失败。文章指出,尽管中国在过去几年取得了许多显著的绿色科技突破,但它与欧洲、日本等发达国家相比,仍处于领先地位。同时,大卫也警告说,如果不采取行动,未来的世界将变得越来越不利于环保和可持续发展。

热点资讯 09.18
传字节跳动拟在2026前量产两款自研AI芯片,将由台积电代工

传字节跳动拟在2026前量产两款自研AI芯片,将由台积电代工

字节跳动计划自研AI芯片,以便在中国AI聊天机器人市场领先竞争对手,同时节省数十亿美元的成本,降低成本并增强供应链的多元化和安全性。字节跳动此前与博通合作开发AI芯片,但由于需求太大,每个客户都想争取最多出货量,因此字节跳动最终决定自研AI芯片。

热点资讯 09.18
官员三天穿同一套衣服引发争议:有损公职形象?

同一件衣服三日穿出,官员形象何去何从?|新京报评论

官员三天穿同一套衣服引发争议:有损公职形象? 同一件衣服三日穿出,官员形象何去何从?|新京报评论

浙江省应急管理厅办公室副主任楼卿磊出镜直播期间着装不整洁被质疑有损形象。其本人表示是因为任务紧急而无法换衣服。评论应尊重公务员的工作态度和职责,避免以衣着和外貌来评价公务员形象。

热点资讯 09.18
美联储降息预期:明天凌晨,你会看到什么?

美联储降息预期:明天凌晨,你会看到什么?

美联储货币政策会议将于17日至18日举行,市场关注降息25个基点还是50个基点。 由于全球经济形势变化,美联储下一步的政策走向备受瞩目。 8月份美国核心CPI同比增长3.2%,超出市场预期,削弱了市场对美联储再次降息的预期。 民生证券首席经济学家 陶川认为,尽管目前市场预计美联储下周会开始其降息周期,但仍存在两种观点:一种认为应该降息25个基点,另一种则认为应该降息50个基点。 美联储货币政策会议即将召开,投资者将密切关注此次会议的结果及其对金融市场的影响。同时,还将关注其他相关国家的货币政策调整。

热点资讯 09.18
直播间的高额月饼利润:单个成本仅需5元,额外主播佣金高达20%

直播间的高额月饼利润:单个成本仅需5元,额外主播佣金高达20%

网红主播小杨哥带货的“香港美诚月饼”陷入虚假宣传风波,引发消费者不满。该月饼并非产自香港,并且标注有黑松露成分,但价格却远超正常售价。广州市花都区市场监管局表示涉事企业为广州市美诚食品有限公司、广州市美诚食品科技有限公司以及香港美诚食品集团有限公司。部分月饼产品已被下架。

热点资讯 09.18
海贼王1127话:草帽三大战力联手,激战巨狮,挑战无尽未知!

海贼王1127话:草帽三大战力联手,激战巨狮,挑战无尽未知!

摘要:娜美所处的积木城堡是艾尔巴夫,全员都穿上了艾尔巴夫风格的衣服,最先聚在一起。草帽一伙感到有人当玩具,寻找失散的九里女孩。扉页内暗示了犬岚公爵与大和会面的消息。袭击娜美的巨大昆虫是由乌索普攻击的。这次围攻大猫后,路飞、索隆和山治、乌索普和娜美,成功战胜了它,并开始离城堡而去。整个画面充满了火药味,展示了草帽四皇的实力。

热点资讯 09.18
国产双剑:岁月荏苒,昔日辉煌已成过往;独步天下的大宇时代已走向衰败

国产双剑:岁月荏苒,昔日辉煌已成过往;独步天下的大宇时代已走向衰败

【一句话概述】:大宇资讯宣布出售《仙剑奇侠传》IP海外地区及《轩辕剑》IP全球版权。 【聚焦点】: - 大宇资讯公告出售这两款IP的全球版权; - 这并非大宇首次售卖“娃”; - 双剑IP在国内营收占比下降,大宇不再满足从双剑赚取授权; - 现在这两个IP已经不属于大宇所有。 - 国产双剑成为了历史。 - 如何走向没落的。

热点资讯 09.18