世界最强模型改朝换代,GPT-4被全面碾压

2024-03-05 热点资讯 关注公众号
    【全新发布】Anthropic AI震撼宣布:Claude 3系列模型强势登场,直接撼动行业基准!
全球最强大模型一夜易主,GPT-4被全面超越    来自凹非寺的前沿报道,量子位公众号QbitAI带来了最新的科技动态。Anthropic作为OpenAI的主要竞争对手,此次推出的Claude 3模型家族以其旗舰版Claude 3 Opus为代表,宣称其“已近乎实现与人类相当的理解能力”。该模型在推理、数学、编码、多语言理解及视觉处理等多领域全面超越包括GPT-4在内的所有大型预训练模型,无疑为整个行业设定了全新的标准。
全球最强大模型一夜易主,GPT-4被全面超越    Claude 3的成绩单令人瞩目,在数个数学评测中,它以零样本学习的方式力压GPT-4的四至八次采样结果。此外,Claude系列新模型提供前所未有的200K上下文窗口,并能接受超过100万Tokens的输入,展现了其卓越的长文本处理能力。
全球最强大模型一夜易主,GPT-4被全面超越    目前,用户可以免费体验Claude 3家族中的Sonnet,而最强版本Claude 3 Opus则供付费用户专享,但大模型竞技场同样提供了试用机会,引发网友们的热烈追捧和实验热潮。同时,Opus和Sonnet均已开放API访问权限,开发者们可立即启用这一最新成果。
全球最强大模型一夜易主,GPT-4被全面超越    面对Claude 3的强大性能,有人甚至半开玩笑地向OpenAI喊话:“好了,你们现在可以推出GPT-5了。”不过,OpenAI可能正忙于应对马斯克的诉讼案件。
全球最强大模型一夜易主,GPT-4被全面超越    Claude 3家族共包含三个型号——小杯Haiku、中杯Sonnet以及大杯Opus,三者成本与性能逐级递增。全系模型在多个维度进行了显著提升,其中Opus在MMLU、GPQA、GSM8K等多个评估基准上傲视群雄。在视觉能力方面,Claude 3能够处理包括照片、图表、图形和技术图表在内的多种视觉格式。
全球最强大模型一夜易主,GPT-4被全面超越    爱丁堡大学博士生符尧,同时也是中文大模型知识评估基准C-Eval的提出者之一,指出在MMLU / GSM8K / HumanEval等基准测试中,各模型表现已高度饱和,真正区分模型性能的是MATH和GPQA等更为严苛的测试。值得一提的是,Claude 3在拒绝回答不恰当或无法准确回答的问题方面取得了重大进步,显著降低了拒绝回答的可能性。
全球最强大模型一夜易主,GPT-4被全面超越    在上下文理解和记忆能力上,Anthropic采用NIAH测试方法,结果显示Claude 3 Opus在海量数据中精准检索信息的能力极其出色,实现了接近完美的召回率(超过99%的准确率),并且在某些情况下还能识别出人为插入的“针”句,体现出对评估局限性的敏锐洞察力。
全球最强大模型一夜易主,GPT-4被全面超越    Claude 3在生物知识、网络相关知识等方面也有所突破,虽然仍处于安全级别ASL-2,但在智能与反应速度上的优化十分明显。无论是小杯Haiku能在短短三秒内理解含图表的约10k token arXiv论文,还是中杯Sonnet在保持高智能水平的同时,响应速度比Claude 2和Claude 2.1快两倍,特别擅长快速的知识检索和自动化销售场景;再到大杯Opus虽智能最高却未牺牲速度,与前代Claude模型相近,都体现了Anthropic对于模型性能和效率的极致追求。
全球最强大模型一夜易主,GPT-4被全面超越    官方对三种型号有明确的应用定位:大杯Opus适用于复杂的任务自动化、研发与策略制定;中杯Sonnet性价比出众,更利于规模化应用,适合进行数据处理、RAG任务以及在中等复杂度工作流程中节省时间;小杯Haiku凭借超快响应速度和亲民价格,成为实时互动及简单工作流程自动化场景的理想选择。
全球最强大模型一夜易主,GPT-4被全面超越    在定价策略上,最经济的小杯Haiku每1M tokens输入收费0.25美元,而顶级配置的大杯Opus则为75美元/1M tokens输入,尽管相比GPT-4 Turbo价格略高,但这也反映了Anthropic对其产品的强大信心和品质保证。
全球最强大模型一夜易主,GPT-4被全面超越    随着Claude 3官网更新,众多用户已第一时间体验到了这款模型的图像理解和处理功能,如风格改进推荐、从图像提取文本、前端代码转换、复杂方程解析以及手写笔记转录等。即便是模糊且年代久远的手稿文档,Claude 3也能准确进行OCR识别。
全球最强大模型一夜易主,GPT-4被全面超越    尽管由于访问人数过多,部分用户在初次尝试时遭遇了连接失败,但热心网友们已经分享了许多Claude 3的实际应用案例,比如让Sonnet成功解答谜题、解读ASCII码,甚至在编程任务上展示出了较GPT-4更为严谨的态度。而在面对用户的巧妙试探时,Claude 3 Opus展现出了极高的智能水平,轻松避开各种陷阱。
全球最强大模型一夜易主,GPT-4被全面超越    总体来看,Claude 3的初步效果给人留下了深刻印象。此时此刻,或许我们可以向OpenAI发问:“GPT-5何时问世?”对Claude 3感兴趣的朋友们,不妨即刻点击下方链接亲自体验一番吧!
全球最强大模型一夜易主,GPT-4被全面超越    访问链接:https://claude.ai/
全球最强大模型一夜易主,GPT-4被全面超越

上一篇:创新药“倒爷”落幕?
下一篇:权,钱,性
更多更酷的内容分享
猜你感兴趣
超越GPT-4!Anthropic的Claude 3,OpenAI的强劲对手,全面爆发!

超越GPT-4!Anthropic的Claude 3,OpenAI的强劲对手,全面爆发!

人工智能初创公司Anthropic推出Claude 3大模型,声称具有接近人类的理解能力,是当前最强大的大模型之一。Claude 3分为三个版本,其中Opus在行业基准测试中表现优于OpenAI的GPT-4和谷歌的Gemini Ultra。该公司由OpenAI前高层创立,目标是开发与OpenAI竞争的生成式人工智能模型。在过去一年里,Anthropic完成了五笔融资交易,总额约为73亿美元,估值达到184亿美元。

热点资讯 03.05
科创板日报记者亲测:Claude 3模型威力炸裂,超越GPT-4?

科创板日报记者亲测:Claude 3模型威力炸裂,超越GPT-4?

Anthropic发布的Claude 3模型被誉为超越GPT-4的最快、最强大的人工智能模型。该系列包括三个模型,具有强大的视觉能力。然而,《科创板日报》记者测试发现,尽管Claude 3 Opus在图片识别上有更多细节表现,但在准确率和本科生知识水平上并未展现出明显优势。

热点资讯 03.08
新一代大模型即将问世:GPT-3与GPT-4的全新升级及潜力解析

新一代大模型即将问世:GPT-3与GPT-4的全新升级及潜力解析

"米拉·穆拉蒂透露,将在一年半后发布"博士生水平"的人工智能,这标志着GPT-5将在一年半后发布,而在某些领域将超过人类。相比之下,Claude 3.5 Sonnet在研究生级推理、本科级知识和编码能力方面已刷新了SOTA,被宣布为史上最智能模型。这个模型打破了现有纪录,使得普通博士在GPQA上的得分为34%,领域内专业博士的得分为65%,而Claude 3.5 Sonnet无疑已经超越了他们。此外,主持人为这个问题提出了一个假设性的问答。"

热点资讯 06.27
全新换代途观L震撼发布:颠覆性的技术革新,让您碾压Q7与X5!

全新换代途观L震撼发布:颠覆性的技术革新,让您碾压Q7与X5!

全新途观L PRO于4月10日正式发布,并推出三种配置车型,包括300TSI/330TSI两驱车以及380TSI四驱车。新车高度还原海外版车型,拥有R-Line运动前脸和先锋前脸两种造型,配备了IQ.Light智慧投影大灯等智能化配置。内饰方面,新车进行了全方面的调整。

热点资讯 04.12
洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

江南五虎在江浙地区崛起,占江苏白酒市场份额近40%,竞争日益激烈。 黄山归来,犹如一幅画卷,把古老的中国文化装点得独具魅力。

热点资讯 09.19
女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

深圳男子PPT揭露出轨事实,自称曾下跪哀求女友不要举报。

热点资讯 09.19
外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

9月18日,深圳日本人学校10岁学生遭男子刺伤,已被现场捕获。中方继续采取有效措施,保障在外中国人的安全。

热点资讯 09.19
挑战《黑神话》的强劲对手:打造3A级开放世界游戏引擎,却未知其神秘力量

挑战《黑神话》的强劲对手:打造3A级开放世界游戏引擎,却未知其神秘力量

随着《黑神话:悟空》的火热,国内玩家开始调侃欧美玩家的“女拳师”现象,国内一些工作室也试图利用男女话题来吸引眼球。最近一家被称为全女的GHG游戏工作室成立,并承诺将制作出完全由女性参与的3A级别开放世界游戏。然而,由于尚未完成游戏引擎的研发和成本控制,这款游戏可能会成为诈骗的一种手段。对此,我们建议大家保持理性判断,不要轻信不实信息,保护自己的权益不受侵犯。

热点资讯 09.19
大众关闭工厂,狼堡裁员,互联网巨头的严峻挑战与未来展望

大众关闭工厂,狼堡裁员,互联网巨头的严峻挑战与未来展望

沃尔夫斯堡面临前所未有的挑战:汽车电动化、智能化转型和竞争压力加剧导致德国这家百年历史的工业重镇面临倒闭风险。沃尔夫斯堡及其庞大的大众汽车集团总部象征着德国工业复兴,但随着欧洲最大汽车制造商宣布关闭本土工厂,并放弃工作保障承诺,这座城市的12万居民开始担忧未来。沃尔夫斯堡拥有超过4800万辆汽车的生产能力,而在中国汽车市场竞争加剧的影响下,该公司可能会遭受重大打击,需要大幅增加拨备以应对这一冲击。这个消息引发了全球汽车产业的关注。

热点资讯 09.19
罗峰全新造型发布,诺岚山危机,五大强者的降临:一位神秘人物的隐藏身份

罗峰全新造型发布,诺岚山危机,五大强者的降临:一位神秘人物的隐藏身份

米克、亚瑟和涅塔。在这五人当中,涅塔的名字最引人注目,因为他是一名黑帮老大,同时还是一个天才级别的战士。从他的实力来看,他是第五个出场的五大强者之一,绝对不容小觑。 另外,涅塔在预告片中并未完全展示出他的实力,只能猜测他的战斗力应该很强。这次出现在《吞噬星空》动漫中的涅塔,无疑会给观众带来更大的惊喜。 总之,从这次剧情来看,有很多看点,包括主角罗峰的新造型、五大超级强者的登场等,相信这部动漫会有更多的精彩内容等待着观众。

热点资讯 09.19
黎巴嫩爆炸引发猜测:台企生产寻呼机,源头调查仍在进行中

黎巴嫩爆炸引发猜测:台企生产寻呼机,源头调查仍在进行中

黎巴嫩真主党订购台产寻呼机爆炸,以色列事先破坏并伪装成自杀式袭击。

热点资讯 09.19
梦幻西游:首款秋杀九黎城装备首曝 - 表弟团队打造联赛冠军帮计划已启动!

梦幻西游:首款秋杀九黎城装备首曝 - 表弟团队打造联赛冠军帮计划已启动!

标题:奇幻高手晒新装!打造双九黎城阵容及联赛冠军帮! 事件起因及关注爆点:梦幻游戏官方曝光九黎城装备,打造双九黎城阵容;另曝雪山表弟团队欲打造联赛冠军帮,提高团队实力。

热点资讯 09.19
70后农行女性高管晋升至高层,预示着银行业改革与发展新趋势

70后农行女性高管晋升至高层,预示着银行业改革与发展新趋势

张曼获湖南农行派重任官,时值长沙银行半年后新行长人选揭晓,张曼晋升为副行长,成为湖南省万亿上市银行董事长人选,由她提名成为董事会董事候选人。此前张曼加入长沙银行前是中国农业银行的员工,期间担任过多个职务,包括副行长等,此次晋升为总经理。

热点资讯 09.19
东方甄选创始人董宇辉今年或将陷入口碑危机:丈母娘是否被冤枉?

东方甄选创始人董宇辉今年或将陷入口碑危机:丈母娘是否被冤枉?

今年初,董宇辉成为东方甄选最高薪酬雇员之一。他在2024财年年度收益高达3.41亿港元,包括年薪、奖金、期权和新公司分润。自7月25日分手后,他自立门户已55天。但近日舆论场对其进行猛烈批评,被指责“没有文化”,并有人称对其进行了“绞杀”。在此期间,他面临各种商业挑战,如稳住人设、守住口碑和带领“与辉同行”前行等。目前,他的抖音账号粉丝数量超过51.7万,“与辉同行”账号粉丝数超过165.7万,显示出良好的发展势头。尽管如此,东方甄选主账号却掉了24.3万粉丝,这无疑给与辉同行带来了竞争压力。在完成一系列直播带货数据后,于近日新增了一家名为“与辉同行”的品牌公司,实现了业绩增长。与辉同行目前的销售额和粉丝数量均超过了东方甄选,与竞争对手相比有着明显优势。在未来的发展中,他还将继续努力稳定形象,提升口碑,并带领“与辉同行”走向更广阔的舞台。

热点资讯 09.19