马斯克的AI公司今日发布了最新大模型Grok-1,其参数量高达3140亿。这款模型将为AI技术提供强大的支撑。

2024-03-18 热点资讯 关注公众号

腾讯科技讯 3月18日消息,据国外媒体报道,美国当地时间上周日,埃隆·马斯克(Elon Musk)旗下人工智能初创公司xAI发布了其大语言模型Grok-1的基本模型权重和网络架构。

xAI在官方网站上宣称,Grok-1是由该公司从头开始训练、拥有3140亿参数的混合专家模型。

xAI表示,这是Grok-1预训练阶段的原始基础模型检查点(Checkpoint,指在特定时间点保存模型状态的操作,以便在未来某个时间点恢复模型状态),该阶段于2023年10月结束。这意味着该模型没有针对任何特定的应用程序(例如对话)进行微调。

xAI正在Apache 2.0许可下发布权重和架构。该模型的细节包括:

  • 1 在大量文本数据上训练的基础模型,没有针对任何特定任务进行微调
  • 2 3140亿参数混合专家模型,在给定Token上活动的权重为25%
  • 3 2023年10月,xAI使用JAX和Rust之上的自定义训练堆栈从头开始训练

延展阅读

为何要开源Grok?美媒:马斯克别无他法,否则将打自己脸


根据xAI发布的数据,Grok-1的大语言模型具有3140亿参数的混合专家模型,这是非常强大的语言处理工具。然而,这也让许多人开始担忧,因为马斯克曾公开表示,他对技术有绝对的信心,并且经常声称他的公司在未来将超越其他科技巨头。
因此,对于未来的XAI来说,他们需要保持警惕。他们应该继续收集更多的数据来训练他们的模型,并且在微调模型时更加小心。此外,他们也应该考虑开放他们的代码库,让更多的人可以参与到这个项目中来。
总的来说,虽然Grok-1是一个强大而创新的技术,但是它也带来了许多挑战。为了确保这个项目能够成功,马斯克和他的团队需要采取正确的步骤,以保护他们的技术,并使其成为我们所有人都能使用的工具。

上一篇:自动驾驶真要来了!北京年底前将在机场、火车站进行内测,你期待吗?
下一篇:AMD Spartan UltraScale+: 低成本高性能的FPGA
更多更酷的内容分享
猜你感兴趣
特斯拉CEO马斯克日前发布了全球最大的开源人工智能模型。这个模型有3140亿个参数,击败了OpenAI的Grok,再次展现了他的创新能力和科技实力。

特斯拉CEO马斯克日前发布了全球最大的开源人工智能模型。这个模型有3140亿个参数,击败了OpenAI的Grok,再次展现了他的创新能力和科技实力。

马斯克宣布开源自家公司的大模型(Grok-1)。该模型参数达到3140亿,为最大开源大模型。王煜全对此表示理解并提出判断未来发展的两个关键因素——趋势和模式。 anthropic公司推出的Claude 3大模型有望影响未来,因其具有多个模态和多agent处理能力。

热点资讯 03.19
马斯克怒批OpenAI,最大模型Grok-1开源!参数高达3140亿,4个模态,75万颗星星。

马斯克怒批OpenAI,最大模型Grok-1开源!参数高达3140亿,4个模态,75万颗星星。

马斯克XAI的Grok在七天后开源,参数量高达3140亿,是Llama 2的4倍,其权重和架构已公之于众。

热点资讯 03.18
马斯克发布的Grok-1开源项目,有超过3140亿个参数,是迄今为止最大的。

马斯克发布的Grok-1开源项目,有超过3140亿个参数,是迄今为止最大的。

特斯拉CEO马斯克的AI创企xAI宣布发布3140亿参数的混合专家模型Grok-1,参数量远超OpenAI GPT-3.5。此外,该模型具有高智能和批判性思维,并将在LML和MMLU等评测中取得优异成绩。

热点资讯 03.18
马斯克的初创公司XAI已发布开源的大模型Grok-1。这个模型能产生什么影响呢?

马斯克的初创公司XAI已发布开源的大模型Grok-1。这个模型能产生什么影响呢?

马斯克开源的大规模语言模型Grok-1引发广泛关注。该模型由XAI公司开发,具有参数量最高的开源大语言模型之称。然而,关于Grok-1的具体性能,特别是与OpenAI GPT-3.5相比的差距,尚未明确。尽管如此,XAI公司表示,其将继续监测和改进Grok-1的表现。

热点资讯 03.19
英特尔砍掉15000人并剥离代工业务,德国工厂因裁员而暂时停工

英特尔砍掉15000人并剥离代工业务,德国工厂因裁员而暂时停工

场地位。在这封公开信中,英特尔首席执行官帕特·基辛格表示,公司将继续发展代工业务,削减成本,简化X86产品组合。同时,他还表示将继续推进Altera IPO,以提升投资收益。此外,英特尔已经获得了美国国防部30亿美元资助,用于生产尖端半导体。然而,根据这些消息,我们也需要注意这些背后可能存在的疑虑。

热点资讯 09.18
商城业主持刀威胁执法人员:网友称北京山卖菜大爷

官方回应:北京山卖菜大爷持刀威胁执法人员事件真相如何?

商城业主持刀威胁执法人员:网友称北京山卖菜大爷 官方回应:北京山卖菜大爷持刀威胁执法人员事件真相如何?

今日在北京市新市街道综合执法中心发现一起涉事情况,一名大爷醉酒后忘记车停位置寻求帮助,与值班人员发生争执并试图取走对方的手机和店内刀具,结果被制止并将物品归还给店铺。警方已经介入调查,相关人员已被带走。此事仍在调查中。

热点资讯 09.18
法国与欧盟遭受削弱,新一届欧委会提名名单曝光:背后是马克龙的决定

马克龙主导新一届欧委会提名名单,法国与欧盟地位被削弱?

法国与欧盟遭受削弱,新一届欧委会提名名单曝光:背后是马克龙的决定 马克龙主导新一届欧委会提名名单,法国与欧盟地位被削弱?

新一届欧委会中的反对派别将是唯一面孔 这是关于欧洲战地

热点资讯 09.18
石班瑜逝世:他与周星驰的合作足迹深厚,留下了许多经典

石班瑜逝世:他与周星驰的合作足迹深厚,留下了许多经典

石班瑜于9月17日上午在北京去世,享年66岁,他的代表配音作品有《赌侠》《极道学园》《古惑仔》等,石班瑜曾是“周星驰御用配音”。

热点资讯 09.18
苹果即将在中国台湾厂批量生产4纳米A16处理器,这标志着未来移动设备性能的大飞跃

苹果即将在中国台湾厂批量生产4纳米A16处理器,这标志着未来移动设备性能的大飞跃

苹果公司将利用台积电的4nm工艺在其位于美国亚利桑那州的晶圆厂进行生产移动处理器。这一消息标志着台积电在亚洲地区的布局即将完成,也预示着苹果将向半导体行业注入更多的资本和技术。此外,考虑到苹果对于高质量制造和环保要求,这也将推动半导体产业的进步和发展。未来,台积电将在美国亚利桑那州凤凰城建设三座晶圆厂,分别负责制造4nm、3nm和更先进的制程技术的芯片。这一举措表明台积电将继续加强其在亚洲市场的地位,并在未来几年继续投入资源进行创新和投资。

热点资讯 09.18
以色列释放5000部手机进行军事行动

或者:

以色列秘密安置了5000部爆炸装置,未引起公众关注

以色列释放5000部手机进行军事行动 或者: 以色列秘密安置了5000部爆炸装置,未引起公众关注

黎巴嫩寻呼机大规模爆炸事件,外界普遍认为以色列为袭击策划者。真主党订购5000台寻呼机中安置爆炸物,消息人士指其阴谋暴露。黎巴嫩安全领域高级消息人士证实真主党近几个月引进的AP924型寻呼机为诱发此次爆炸原因。调查发现以色列情报机构在生产阶段修改炸弹内部电路板,导致无人察觉。近3000名黎巴嫩居民受伤,其中真主党武装人员及伊朗驻黎巴嫩大使受伤。

热点资讯 09.18
专家预测:气候变暖催生更多罕见水龙卷现象

专家预测:气候变暖催生更多罕见水龙卷现象

水龙卷是由强烈风切变引导上升气流形成的旋转空气柱,常呈现出漏斗云形态。在极端不稳定的大气环境下,以及近地面存在强风切变时,水龙卷往往会出现。

热点资讯 09.18
阿联酋AI公司G42与英伟达签署合作协议:中国将获得AI芯片采购许可

阿联酋AI公司G42与英伟达签署合作协议:中国将获得AI芯片采购许可

美国批准英伟达向阿联酋提供H100和H200加速器,为AI布局增添信心;G42由于美国出口管制政策受限无法购买英伟达GPU,押注于美关系以推动技术成长并摆脱石油依赖;G42数据中心采用西方供应商硬件构建,仅保留中国部件以防黑客入侵。微软投资15亿美元与G42合作拓展Azure云业务,加强两国关系。

热点资讯 09.18
岳欢:是否存在中国势力对韩国的威胁?韩国民众疑虑加剧

岳欢:是否存在中国势力对韩国的威胁?韩国民众疑虑加剧

支付宝

热点资讯 09.18
56岁谢广坤老来得子,在豪华酒店大办百日宴,赵四拖着一大箱子随礼

56岁谢广坤老来得子,在豪华酒店大办百日宴,赵四拖着一大箱子随礼

唐鉴军老来得子喜庆十周年的百日宴上发生笑料:众明星前来祝福却仅收到数百元红包。

热点资讯 09.18