消息来了:马斯克宣布Grok开源!

2024-03-18 热点资讯 关注公众号

智东西(公众号:zhidxcom)

| 云鹏

| 心缘

6个月掏出3410亿参数自研大模型,马斯克说到做到!

智东西3月18日消息,就在刚刚,马斯克的AI创企xAI正式发布了此前备受期待大模型Grok-1,其参数量达到了3140亿,远超OpenAI GPT-3.5的1750亿。

这是迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。

Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,这种MOE架构重点在于提高大模型的训练和推理效率,形象地理解,MOE就像把各个领域的“专家”集合到了一起,遇到任务派发给不同领域的专家,最后汇总结论,提升效率。决定每个专家做什么的是被称为“门控网络”的机制。

xAI已经将Grok-1的权重和架构在GitHub上开源。

GitHub地址:

https://github.com/xai-org/grok-1?tab=readme-ov-file

目前Grok-1的源权重数据大小大约为300GB。

截至北京时间3月18日上午7时许,Grok-1项目收获了3400颗星。

Grok-1是马斯克xAI自2023年7月12日成立以来发布的首个自研大模型。xAI特别强调说这是他们自己从头训练的大模型。Grok-1没有针对特定应用进行微调。

xAI是马斯克去年刚刚成立的明星AI创企,其目的之一就是与OpenAI、谷歌、微软等对手在大模型领域进行竞争,其团队来自OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等诸多知名企业和研究机构。

此前马斯克刚刚“怒喷”OpenAI不够“Open”,后脚这就开源了自家的顶级3410亿参数自研大模型Grok-1。虽然马斯克在预热到发布的过程中也“放了几次鸽子”,但最终他并没有食言。

今天,xAI还公布了Grok-1的更多细节:

基础模型基于大量文本数据训练,未针对特定任务进行微调。

3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%。

xAI从2023年10月开始使用自定义训练堆栈在JAX和Rust之上从头开始训练。

但此次xAI并没有放出Grok-1的具体测试成绩,其与OpenAI即将发布的GPT-5的大模型王者之战,必将成为业内关注的焦点。

当然,马斯克发大模型,怎么会少的了大佬隔空对线“互怼”?

xAI官方消息刚刚发布,ChatGPT的官方账号马上就跟马斯克在X平台上进行了互动,在Grok官方账号评论下回复道:“偷了我的笑话。”

马斯克自然不会示弱,马上说请告诉我OpenAI“Open”之处在哪里。

马斯克高仿号也马上跑过来添油加醋,说我们都知道是Sam在运营ChatGPT的账号。

值得一提的是,此次xAI发布Grok-1消息的封面图片,是由Midjourney生成,Grok给出了提示文本:一个神经网络的3D插图,具有透明节点和发光连接,展示不同粗细和颜色的连接线的不同权重(A 3D illustration of a neural network, with transparent nodes and glowing connections, showcasing the varying weights as different thicknesses and colors of the connecting lines)。

原图:


结论:
马斯克的Grok-1大模型参数量达到3140亿,远超OpenAI GPT-3.5的1750亿,这不仅是中国AI创企xAI自研的最新成果,也是全球范围内参数量最大的开源大语言模型。
马斯克提到做到这一点,并表示这是他从头训练的结果,而不是专门针对特定应用进行微调。这也表明他在推进AI技术的发展方面有着坚定的决心和决心。
建议:
对于xAI来说,他们的成功值得鼓励,但也需要保持警惕。他们的成功无疑展示了中国AI技术的进步和潜力,但也应注意到在科研道路上存在的挑战和风险。此外,他们的大模型也需要在性能和安全等方面做出更多的努力。

上一篇:韩媒:未来核心科技,韩国更落后中国
下一篇:全球科技早参丨Sora训练数据被质疑
更多更酷的内容分享
猜你感兴趣
马斯克公布:本周开源强大的xAI语言模型Grok,通俗易懂!

马斯克公布:本周开源强大的xAI语言模型Grok,通俗易懂!

马斯克宣布xAI的Grok将开源,但未明确说明哪些部分。Grok表达了对开源的期待和担忧。同时,马斯克起诉OpenAI和阿尔特曼违约,指控他们背离了最初的使命和保密GPT-4的设计。特斯拉股票上涨1.39%,柏林超级工厂的电力恢复。

热点资讯 03.12
马斯克状告OpenAI八天后,Grok开源。

马斯克状告OpenAI八天后,Grok开源。

马斯克旗下的AI大模型Grok在本周开源,引发了科技圈和AI圈的热议。马斯克贴脸嘲讽OpenAI偏离了初衷,并质疑OpenAI全然是微软的好伙伴。尽管更多人参与了进来,但目前还不清楚马斯克的真实动机。

热点资讯 03.18
马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

马斯克宣布,xAI本周将开源Grok大模型,此前曾起诉OpenAI。

特斯拉CEO马斯克宣布其人工智能公司xAI的大模型Grok将于本周开源,以寻求OpenAI和谷歌的替代方案。这一决定意味着公众将可免费尝试使用该公司大模型技术背后的代码。马斯克是大模型开源的倡导者,他认为OpenAI应该开放源代码。

热点资讯 03.11
马斯克公开Grok原始动力

马斯克公开Grok原始动力

马斯克宣布其AI公司Grok将在本周内开源,这是在控告OpenAI及奥特曼违背创始协议后采取的行动。OpenAI公开邮件反驳指控,并称马斯克曾承诺捐款并同意对外融资。Grok闭源已走投无路,只有开源一条路可走。然而,马斯克创办Grok的初衷并非为了开源,而是商业利益。

热点资讯 03.12
华为全新智能手表:动态血压监测 助您全面了解自身健康状况

华为全新智能手表:动态血压监测 助您全面了解自身健康状况

华为 Watch D2 的动态血压监测功能,每天可以24小时全天候无间断监测血压波动情况。不同于其他普通手表,华为 Watch D2 配备了专业的医疗级动态血压监测技术,可在全天24小时内获取并分析血压数据,对于高血压患者来说,有助于及时发现并控制病情。同时,华为 Watch D2 还可通过华为运动健康 App 提供个性化的健康管理服务,为用户提供详细、准确的血压报告。

热点资讯 11.26
华为MatePad Pro发布,起售价高达5199元

华为MatePad Pro发布,起售价高达5199元

"华为MatePad Pro起售价5199元,今天被曝光。"

热点资讯 11.26
英伟达CEO称:中国仍是全球IT市场的关键,为公司提供了新的增长机遇

英伟达CEO称:中国仍是全球IT市场的关键,为公司提供了新的增长机遇

近期,美国科技巨头高管密集访华,英伟达高管到访中国并与中国商务部高层会面,释放了跨国科技巨头对中国市场高度重视的信号。中美两国关系紧张,英伟达在华业务备受关注。在此背景下,公司股价下跌近四成。行业分析师认为,中美关税战可能影响英伟达股价,甚至将其投资评级调降至“缓步加码”。

热点资讯 11.26
华为推出全球最强Mate,全球首颗卫星导航卫星支持,余承东:抄袭毫无未来,真正超越并非抄袭可比

华为推出全球最强Mate,全球首颗卫星导航卫星支持,余承东:抄袭毫无未来,真正超越并非抄袭可比

华为Mate 70系列正式发布,搭载高亮钛材质机身、第二代昆仑玻璃和卫星寻呼功能,11月25日在微博发布一段视频显示AI隔空传送技术,展示了华为Mate 70系列的新亮点。

热点资讯 11.26
网红北大学生历引发争议:掉粉百万,学霸人设成网络问题或加速器?

网红北大学生历引发争议:掉粉百万,学霸人设成网络问题或加速器?

北京大学研究生并不是北大的事吗?11月26日,“羊毛月北大学历被质疑造假”,该大学生质疑网红博主的北大学历真实性。2021年4月,“羊毛月”与花椒合作的“帅小伙试吃成都最辣美食”系列视频,播放量均超过百万。视频发布后,引发巨大争议。网红博主因此走红。不过,“北大的博士、武大的硕士,找不着工作在抖音上说段子,或是在宿舍里诉说自己的面试经历,说着说着就哭了。”,“不诚恳、不原谅”。

热点资讯 11.26
王宝强案件调查进展:警方已对王宝强进行监控和调查,事件是否涉及财产分配需核实

王宝强案件:警方通报可能涉及财产分配,若消息真实,恩波真能分得1.1亿吗?

王宝强案件调查进展:警方已对王宝强进行监控和调查,事件是否涉及财产分配需核实 王宝强案件:警方通报可能涉及财产分配,若消息真实,恩波真能分得1.1亿吗?

演员王宝强被举报涉嫌欺诈,涉及电影《八角笼中》的票房分成纠纷。

热点资讯 11.26
《珠帘玉幕》结局:燕子京去世、端午接手商队、崔十九笑到最后

《珠帘玉幕》结局:燕子京去世、端午接手商队、崔十九笑到最后

电视剧《珠帘玉幕》以古偶剧的形式落幕,赵露思与刘宇宁主演。然而,该剧中存在许多问题,如人物塑造过于理想化,剧情推进缓慢,情感纠葛复杂等。然而,故事结尾给出了一个令人大跌眼镜的结局——主角们并未死,而是以现代人的身份再次出现在观众面前。虽然令人失望,但这并不意味着这部剧失败。相反,它展现出了独特的叙事风格和深刻的主题。虽然结局有些意外,但还是表达了对主人公坚韧不拔的精神的赞美。

热点资讯 11.26
吴柳芳:被曝光「双标」行为引发网民关注与谴责

吴柳芳:被曝光「双标」行为引发网民关注与谴责

台自身的影响力,用新颖的舞蹈风格吸引观众的目光。然而,在曝光率的背后,她的隐私权也受到了侵犯。这不仅是对于吴柳芳本人,也是对她所在领域的尊重问题。而面对平台不公的做法,吴柳芳表示:“无论是体育运动还是娱乐行业,我们都应该坚守正义,抵制‘擦边’行为。”这也体现出体育界对于职业道德和社会责任感的重视。对于其他体育明星来说,也应该以此为鉴,不忘初心,继续前进。

热点资讯 11.26
星女郎新古装剧曝光:演员阵容强大,让剧荒的情况得到缓解

星女郎新古装剧曝光:演员阵容强大,让剧荒的情况得到缓解

人关系变化多端,充满悬念和冲突,非常吸引观众。 02 古偶剧《怎敌她千娇百媚》有望在鹅厂播出,融合了喜剧、权谋、经商等要素,有望成为《永夜星河》之后的又一部爆款。该剧讲述家道没落的罗令妤在投奔表亲陆家的路上,意外与陆家三公子陆昀结怨,两人在困境中携手,收获幸福的故事。 03 主演林允、方逸伦、赵晴等演员的颜值和演技备受期待,为剧集增色不少。值得一提的是,《怎敌她千娇百媚》中有大量的权谋、经商元素融入,增添了剧情的层次,使观众更加期待。 04 杨紫、李现二搭的《国色芳华》和谭松韵主演的《蜀锦人家》都备受期待。而就在这些等待中的剧目中,有一部古偶剧有望打破之前一段时间的低谷,那就是由腾讯混元大模型生成的《怎敌她千娇百媚》。这部剧有望成为爆款,并通过剧情精彩的表现、两位男主角的出色表现以及与其他作品的比较,为观众带来更多的惊喜。

热点资讯 11.26
丹麦指控中方船只破坏海底电缆,外交部回应:我们已经保持与有关各方的开放沟通渠道。

丹麦指控中方船只破坏海底电缆,外交部回应:我们已经保持与有关各方的开放沟通渠道。

11月26日,外交部新闻发布会回答了关于丹麦方面指责中国船只破坏海底电缆的问题,并强调了中欧和中美之间良好的沟通机制。此外,外交部还确认了将不会采取所谓的“双标”行动,并回应了美国方面对中国产品的转口情况。在回答缅甸方面的和平谈判问题时,外交部表示将坚持四项充分尊重的原则,并坚决反对任何可能导致国家冲突的行为。

热点资讯 11.26