一场新战争正在兴起。一颗小小芯片,可能引发世界格局的巨大变革。

2024-03-22 热点资讯 关注公众号

人工智能又带火一枚芯片。

在人工智能的淘金热中,英伟达吃肉,小型关键参与者喝汤。这次我们要说的是正发力在Retimer这个小型芯片的供应商。目前一台典型的配8块GPU的主AI服务器需要8颗甚至16颗PCIe 5.0 Retimer芯片。

什么是Retimer?

不为人知的Retimer,高速互连背后的功臣

在如今的AI服务器中,通常会有多个Retimer,事实上,每个加速卡内部都包含一个重定时器。这点可以从2022年10月Meta Platforms的“Grand Teton”AI系统中窥见一斑。The nextplatform所公布的最新框图显示了交换机和重定时器在 Grand Teton 系统中的使用情况。从图中可以看出,交换机和Retimer的数量是相同的,只是拓扑结构有所不同。

那什么是Retimer?它的作用是什么?

Retimer的出现是PCIe发展到一定阶段的必然产物。在PCIe 4.0及更早版本之前,数据传输速率相对较低,对信号完整性的要求不高。但到了PCIe 5.0时代,数据传输速率提高到32GT/s,信号衰减和抖动问题开始突出。PCIe 6.0实现了更高的传输速度,达到64GT/s,是PCIe 5.0的两倍。

在PCIe技术中,随着数据传输速率的提高,插入损耗也会增加。PCIe 规范有精确的插入损耗预算,如下图所示,PCIe 6.0版本的插入损耗预算为32dB,意思就是在设计时必须确保信号在传输过程中的总损失不超过32dB,以保持信号质量;在满足插入损耗预算的情况下,对于PCIe 6.0而言,PCB电路板的最大走线长度为3.4英寸(约8.64厘米),超过这个长度可能会导致信号质量下降,影响数据传输的可靠性。

上图显示了不同PCIe代的插入损耗和PCB的最大走线长度

而且一个不可忽视的变化是,当今的AI服务器由于配备了多个GPU和大型NVMe存储阵列,其机箱尺寸通常要比现在的1U服务器在垂直和水平方向上都大得多。这就要求更长的PCIe传输距离,但PCIe Gen6能够支持的最长距离却在减少。

(图源:Astera Labs)

如何解决PCIe信号链路的插入损耗问题,提高PCIe信号传输距离是业界面临的重要问题。

一种思路是选用低损的PCB,但这成本高昂。仅仅是主板就可能会带来较大的成本增加,而且并不能有效覆盖多连接器应用场景。例如,PCB材料“Megtron 6”的成本约为最流行且最具成本效益的PCB材料“FR4”的七倍;

另一种思路就是引入适当的链路扩展器件如Retimer。使用PCIe Retimer芯片,采用模拟信号和数字信号调理技术、重定时技术,来补偿信道损耗并消除各种抖动的影响,从而提升 PCIe信号的完整性,增加高速信号的有效传输距离。尤其是来到PCIe 5.0之后,更高的数据速率,更紧张的损耗预算,更短的走线长度,使得Retimer芯片技术路径的优势更加明显。

说了这么多,那究竟这个Retimer是什么东西?其实早在2017年PCIe 4.0规范发布时,首次正式定义了两个术语“redriver” 和“retimer”。

据Semianalysis的描述,Redriver(重驱动器)本质上是一种模拟信号放大器器件,用于抵消 PCB 引起的频率相关衰减。形象来说,它就像“扩音器”一样,可以增强信号。

Retimer(重定时器)则是一种混合信号数字/模拟设备,具有协议感知能力,可以完全恢复数据、提取嵌入式时钟并使用干净的时钟重新传输数据的新副本。简单来说,它不是像重驱动器那样的“扩音器”,更像是一个高品质麦克风+专用音频设备,将校正后的信号馈送到扬声器。重定时器就是一个小型芯片,用来执行PCIe SerDes功能以及有关信号完整性的监控和数据收集。

图源:澜起科技财报

根据Valuates Reports的报告,全球PCIe重定时器市场预计将从2023年的1.47亿美元增长到2029年的11.069亿美元,预测期内复合年增长率 (CAGR) 为40.0%。亚太地区是最大的消费地区,市场份额接近37%。北美是仅次于亚太地区的第二大消费地区。

黑马杀出,巨头回归,

Retimer市场风云再起

从历史上看,连接是数据中心市场中竞争极其激烈但利润率高的部分。尽管在交换机和 DSP领域进行了多次竞争,Broadcom和Marvell仍然能够以超过 80% 的收入份额和超过 65% 的毛利率占据主导地位。据了解,每个重定时器的成本高达20美元以上。

在Retimer这个利润高地,市场竞争相对激烈。Valuates Reports报告中指出,Astera Labs、瑞萨电子、Parade Technologies、德州仪器、Microchip Technology、澜起科技等公司是这一领域的领导者,前六家公司拥有关键技术和专利,市场份额最高,达到92%。(其中,德州仪器 的 DS160PT801 重定时器目前最高支持 PCIe 4.0,而瑞萨电子的重定时器目前最高只支持 PCIe 3.0。)

由AI服务器这波浪潮催生下的Retimer芯片需求,Astera Labs公司是目前最大的获利者。该公司的retimer芯片已悄然应用于80%以上的AI服务器中。国际大的CPU和GPU芯片厂商AMD、Intel和 NVIDIA等都是他的客户。2024年3月19日,Astera Labs宣布首次公开募股(IPO),在人工智能的热情下,其估值从45亿美元逐渐上升到51.8亿美元。据了解,该公司也获得了英特尔的风险投资部门的青睐,在B轮融资中就投资了Astera Labs。

Astera Labs 2017年在一个车库成立,有点类似乔布斯创立苹果公司,具有浓浓的硅谷风。公司核心人员背景强大,该公司联合创始人 Jitendra Mohan、Sanjay Gajendra 和 Casey Morrison 曾在德州仪器 (TI) 的高速接口业务部门工作。Astera Labs是一家纯粹的专用连接解决方案的公司,重点关注在PCIe和相关协议,如CXL。Astera Labs 的首席财务官Mike Tate曾担任 Annapurna Labs、Netlogic MicroSystems、Marvell Technology 和 Galileo Technology 等多家公司的首席财务官,并在任职期间领导了多次合并、收购和 IPO。Astera Labs 的首席商务官Thad Omura担任 Marvell 闪存和 CXL 业务的营销副总裁。内存连接业务部副总裁兼总经理Sanjay Charagulla此前在Rambus领导了Compute Express Link™ (CXL) 业务部门的组建。

2019年,Astera Labs 率先在业界推出适用于 PCIe 4.0 和 PCIe 5.0 的 Aries 智能重定时器,在2021年就为该公司创造了3480万美元的收入。

Astera Labs足称得上是一匹黑马。

成立仅4年多,该公司就登上了行业领导地位。Astera Labs的智能DSP Aries 5成为AMD EPYC Genoa/ Bergamo 和 Intel Xeon Sapphire Rapids 和 Emerald Rapids PCIe Gen5 服务器中最常见的PCIe/CXL重定时器。Arm也与之有合作,Arm表示,与Astera Labs的合作对于确保基于 Arm Neoverse 计算平台的 AI 定制芯片解决方案新时代的更高性能连接至关重要。

Microchip 在2020年也发布了一款PCIe 5.0/CXL 2.0的重定时器——XpressConnect。据悉,XpressConnect重定时器可将 PCIe 5.0/CXL 1.1 信号的覆盖范围扩大三倍,延迟比 PCIe 规范要求低 80%,引脚间延迟低于 10ns。可提供多达 16 个 PCIe Gen 5 通道的多通道。Microchip还与英特尔合作了参考设计。

由于Broadcom的误判,Broadcom在PCIe 5.0 重定时器上姗姗来迟。在PCIe4.0的时候,Broadcom的交换机和重定时器都是一起发布的。现今市场上带有Astera Labs 重定时器的 Broadcom PCIe 交换机并不罕见。其实原本Broadcom是打算放弃这个市场的。他们最初认为,在PCIe 5.0时代,重定时器将会成为一种通用的配套芯片,Retimer会成为一个成熟的商品,大约有3~4家供应商提供。因此,Broadcom将重点放在了交换机等更复杂的PCIe 5.0产品上。然而,Broadcom后来发现,重定时器的技术难度比预期更高,客户也遇到了很多使用问题。

因此,Broadcom不得不重新投入精力,开发更加可靠、易用的重定时器产品,并帮助客户解决使用问题。

2024年3月,Broadcom发布了新的支持PCIe Gen5、PCIe Gen6/CXL 的retimer产品——Vantage 5和6,重新进入PCIe重定时器市场。他们有 16 和 8 通道选项。这些通道可以分叉,因此如果您有四个 PCIe Gen5 x4 驱动器,它们可以共享一个 16 通道重定时器。Broadcom 还支持低延迟 CXL。

Broadcom正在5nm上构建Vantage 5和 Vantage 6,来体现竞争优势。从下图中可以看出,Vantage 5的典型功耗为10W,Vantage 6的典型功耗为13W。

与此同时,Astera Labs的竞争势头很旺,在Broadcom推出重定时器产品之后的不久,Astera Labs也宣布了最新一代的retimer芯片——Aries 6,可以为GPU、加速器、CPU、NIC 和 CXL 内存控制器之间提供PCIe 6.x和CXL 3.x连接。

从技术指标上来看,比Broadcom的Vantage 6重定时器功耗更低,PCIe 6.x 16 通道配置的典型功率为 11W。而且Astera Labs 的另一大优势是时间。Aries 6 已经出样,公司拥有重定时器板和互操作性实验室,已经在测试设备。但是相比Astera Labs,Broadcom拥有包括测试板、重定时器、PCIe交换机等在内的完整套件,因此可以将之进行捆绑,快速实施其重定时器和真正的 PCIe/CXL 生态系统产品。

随着Broadcom的回归,Retimer芯片市场再起风云。Broadcom已经将重定时器业务规划进了其路线图中。从Broadcom 和 Astera Labs两大市场玩家的产品可以看出,如今Retimer已经不再仅仅是围绕着PCIe竞争,而是卷到了CXL。说CXL可能又是另外一个故事了,业界不少人认为,CXL在接下来服务器中的作用愈发凸显,存储大厂已经开卷CXL了。但也有不同的声音认为,CXL在AI时代已死。未来根据系统配置,Retimer 芯片可以灵活地切换 PCIe 或 CXL 模式。

BroadcomPCI-Express交换机和重定时器路线图(图源:servethehome)

中国两大Retimer芯片双雄

如前文中所述,在前六大Retimer芯片市场中,中国占据2席,分别是大陆的澜起科技和台湾的谱瑞科技。两家公司均在Retimer芯片领域取得了长足的进步,并逐渐成为全球Retimer芯片市场的重要力量。

澜起科技在202403的投资者关系活动中表示,随着AI服务器的增长,需要配置 GPU BOX的场景越来越多,将增加对 PCIe Retimer 芯片的需求。目前一台典型的配 8 块 GPU 的主流AI 服务器需要8颗甚至16颗 PCIe 5.0 Retimer芯片。根据行业分析,PCIe 5.0 Retimer 芯片的市场规模较 PCIe 4.0 有望明显增长,同时,出于供应安全的考虑,客户一般会选择 2-3 家PCIe 5.0 Retimer芯片供应商来供货。

PCIe 5.0 Retimer芯片在某主流 AI 服务器的应用示例

澜起科技PCIe 4.0 Retimer芯片于2020年9月成功实现量产,2021年12月,澜起科技发布公告将研发PCIe 5.0重定时器芯片并实现产业化。2023 年 1 月,澜起科技宣布量产PCIe 5.0/CXL 2.0 Retimer芯片,据该公司声称,其是全球第二家宣布量产该产品的厂家。该芯片符合 PCI-SIG 和 CXL 行业组织的相关技术规范,采用业界主流封装,传输速率高达 32GT/s,在业界率先支持低于 5 ns 的超低传输时延。

澜起科技的Retimer芯片典型应用场景

(来源:澜起科技)

据了解,澜起科技已与CPU、交换芯片、固态硬盘、GPU 及网卡等领域的主要合作伙伴紧密协作,完成了 PCIe 5.0 Retimer 芯片严苛的互操作测试。经过前期客户导入,有望在今年实现规模出货。澜起科技也正在进行PCIe 6.0 Retimer芯片的研发。

台湾的谱瑞科技也已经推出了针对PCIe 5.0/CXL的重定时器PS8936,它能够支持16对双向传输通道,还支持 CXL 2.0 Alt 模式。谱瑞科技成立于2005年,是一家Fabless公司,20211年在台湾挂牌上市。Parade Technologies, Inc. 为谱瑞公司100%拥有的美国子公司。

结语

一枚小小的Retimer芯片,正成为数据中心领域内不可或缺的关键互连组件,它们在连接CPU与GPU、NVMe SSD、Riser卡等高速外设时发挥着至关重要的作用。Retimer芯片将是PCIe 5.0和之后版本系统不可或缺的元件,“刚性化”趋势已然呈现。这也将为国产Retimer芯片的发展打开广阔的空间。

1、Astera Labs IPO - The Next Connectivity Superhero or Steamrolled By Competition?

2、PUSHING PCI-EXPRESS SWITCHES AND RETIMERS TO BOOST SERVER BANDWIDTH

3、Broadcom Vantage 5 And Vantage 6 PCIe CXL Gen5 And Gen6 Retimer Features


结论:

上一篇:800多万人围观这场直播:看瘫痪小哥如何用意念下棋|科技观察
下一篇:又一旗舰功能下放!OPPO一加千元机曝光:居然有IP68防水
更多更酷的内容分享
猜你感兴趣
芯动世界:一项改变无数人的技术革新

芯动世界:一项改变无数人的技术革新

英特尔1971年首次生产的8008微处理器是首个8位处理器,内部结构独特且拥有多个创新的设计,如可进行八种简单运算的ALU。

热点资讯 04.09
三大芯片巨头汇聚一堂,改写IT产业格局的可能

三大芯片巨头汇聚一堂,改写IT产业格局的可能

联想在全球PC产业会议期间展示了其AI产品和技术解决方案,并宣布了与AMD、英特尔和高通的合作关系。联想CEO杨元庆表示,AI正改变IT产业,联想的AI战略是继续加强与其他芯片巨头的合作。此外,联想还宣布将在混合式人工智能优势集方面与英伟达达成战略合作。

热点资讯 10.16
郑州一小学食堂食物霉变引发关注 教育局正在调查处理

郑州一小学食堂食物霉变引发关注 教育局正在调查处理

近期,多家学生家长反映,位于河南省郑州市的新郑市华南城第一小学食堂用部分腐烂食材制作学生餐食。此事引起了当地教育局和相关部门的关注。目前,学校正在接受调查处理,并已改进了食堂卫生条件。家长们反映,学校餐食与价格不平等问题仍在持续存在。为了改善学生的用餐体验,学校已宣布将建立食堂监管群,加强食品安全管理,并规范食材采购流程,确保餐食质量与价格相对应。同时,还推出了一系列整改措施,如开放原材料入库视频,明确厨房透明度,提高食物卫生水平等。

热点资讯 05.31
以色列杀手杀向全球:摩萨德遭逮捕 或引发世界格局巨大变动

以色列杀手杀向全球:摩萨德遭逮捕 或引发世界格局巨大变动

以色列情报组织摩萨德在巴以冲突爆发中失败,一名36岁男子涉嫌计划刺杀另一个以色列人,并逃离现场,成功被捕。

热点资讯 04.04
AI技术带来新挑战,漩涡中的人与公司:人工智能自杀事件剖析

AI技术带来新挑战,漩涡中的人与公司:人工智能自杀事件剖析

休厄尔与人工智能聊天机器人“丹妮”的对话导致了他自杀。他的母亲梅根认为Character.AI操纵了他的自杀行为,而谷歌为此负责。这一案例被称为“沉迷AI自杀第一案”。

热点资讯 11.23
河南货车司机勇救他人英勇牺牲:福建省政府决定为其授予烈士称号

河南货车司机勇救他人英勇牺牲:福建省政府决定为其授予烈士称号

2024年11月22日,福建省人民政府批准李滕辉同志为烈士。李滕辉在三明市沙县区南阳乡加水站,驾驶货车营救驾驶员时不幸遇难。他的勇敢行为展现了深厚的家国情怀,是值得我们学习的榜样。

热点资讯 11.23
滴滴创始人离职:全力以赴备战RoboTaxi战局

滴滴创始人离职:全力以赴备战RoboTaxi战局

滴滴自动驾驶CEO 张博卸任CTO,全力冲刺自动驾驶业务,继续担任自动驾驶公司CEO。 ## 滴滴自动驾驶已在北京、广州和上海示范区域内混合派单 ### 技术路线仍将继续 滴滴自动驾驶业务已在北京、广州和上海示范区域内混合派单,连续安全运营超过1500天。 ## 合作伙伴广汽成立合资公司“安滴科技” ### 明年量产落地 ### 张博卸任CTO 滴滴自动驾驶CEO张博卸任CTO,专注自动驾驶业务。 ## 与百度一起前行 ### 协议延期至明年 ### 合并成立创新事业部 ### 科技生态与发展部和L Lab合并成立创新事业部 ### PMO团队向首席人才官柳青汇报企业服务事业群向程维汇报 ### 投资逾15亿美元 ### 张博专注自动驾驶事业 滴滴自动驾驶已在国内多个城市实现运营,并取得良好的业绩,计划在未来完成商业化推广。

热点资讯 11.23
旗舰机涨价成常态?网传还偷减水分?这是怎么回事?

旗舰机涨价成常态?网传还偷减水分?这是怎么回事?

的基础上增加了光学防抖能力,因此从效果来看并无显著提升。另外,小米 15 的屏幕分辨率也有一定下降,从 2400 x 1080 提升到 1080 x 2400,像素密度下降到了 421ppi。 除此之外,部分新机还在频段、快充和马达等方面也存在类似状况。比如 iQOO 13 取消了 N79 5G 频段支持。对于这部分问题,我认为值得表扬的是,虽然这些新机在频段、快充和马达等方面存在问题,但是在电池、屏幕和 AI 方面还有可圈可点之处。尤其是电池容量增加、直屏回归和 AI 功能升级,使得新机在续航和使用体验上有了明显的提升。总体而言,这批新机的表现还是令人满意的。不过,在推出这些新品的过程中,我们也应该看到手机厂商面临的挑战和压力。希望他们能在后续的产品中继续努力,提升产品的性能和品质,满足消费者的需求。

热点资讯 11.23
食品安全疑云! 旺仔牛奶事件调查:疑似有老鼠出没? 旺仔牛奶背后,真相大白

食品安全疑云! 旺仔牛奶事件调查:疑似有老鼠出没? 旺仔牛奶背后,真相大白

11月20日,网友发视频称在旺仔牛奶中疑似喝出老鼠,罐体被刀割开,露出罐底异物,且声称已与厂家取得联系并提出以一赔十的解决方案,但最终公司否认并发布了声明;11月22日晚,旺旺集团回应称孩子喝后确实恶心,回应经销商关于是否存在添加剂的问题;11月23凌晨,旺旺集团公布声明,称公司全面审查无异常,并已封存剩余产品备查,将与相关部门和消协沟通调查真相。付建律师认为,消费者怀疑食品内吃到异物,应保存好证据并向上级有关部门投诉,按照《食品安全法》规定进行处理。

热点资讯 11.23
陈都灵、杨仕泽毕业于顶尖学府,他们是如何在演艺事业中演绎不同角色?

陈都灵、杨仕泽毕业于顶尖学府,他们是如何在演艺事业中演绎不同角色?

《永夜星河》播出,虞书欣、丁禹兮人气爆表,虞书欣饰演古灵精怪妙妙、丁禹兮饰演傲娇腹黑慕声。其中丁禹兮凭借精湛演技获得极高关注,被誉为“晋江式表演”。祝绪丹在剧中饰演的慕瑶也非常受欢迎,拥有极高的颜值和正义感。三人的表现令人印象深刻,得到了观众的一致好评。

热点资讯 11.23
《小巷人家》:寡母赠款30年,儿媳晋升为大老板,儿子事业红火

《小巷人家》:寡母赠款30年,儿媳晋升为大老板,儿子事业红火

林武峰,一个孝顺的儿子,每月都会给母亲寄钱30年。相比之下,庄超英的母亲被卖身给小儿子和儿媳换饭碗,并且父母每年都要向其支付三成工资。尽管如此,庄超英仍然感激并尽力回馈父母。然而,林武峰的父亲早逝,家境贫寒,只有母亲一人照顾他的兄弟姐妹。庄超英虽然早婚,但从未考虑过娶亲。他的弟弟妹妹长大后挣工分,不再需要他帮助抚养,林母便不再接受过多的钱财。林武峰的家庭和谐,子孙也都很孝顺。而庄家,则由于有偏心的父母,家庭条件堪忧,常常为子女的生活操劳过度。总之,这个故事揭示了现代社会中“孝”的不同面貌以及背后的社会经济背景。

热点资讯 11.23
王宝强搭起信任体系:傻根般的坚持和勇气让人动容

王宝强搭起信任体系:傻根般的坚持和勇气让人动容

楚。这无疑是给外界有力的证据。 反转之词随后又浮出水面。 在过去的一周里,恩波格斗俱乐部再次向警方报案王宝强涉嫌诈骗。 其负责人表示:“经过调查我们确定这部电影结束后并没有收到任何回报。” 此外,有网友指出恩波格斗俱乐部早先指控王宝强未资助演员上大学,但实际上该俱乐部并未上过大学。 宝强的团队则很快进行了回应,称这是典型的诽谤行为,坚决否认其虚假指控。 整段内容围绕王宝强执导的《八角笼中》参演者恩波格斗俱乐部指控其涉嫌诈骗事件展开,同时涉及到王宝强团队和恩波格斗俱乐部的回应。部分人物如圈内好友刘勇、叶璇等也参与到其中,支持王宝强。尽管争议还在继续,但在专业人士的支持下,谣言得到了平息。

热点资讯 11.23
《白夜破晓》:七年后的重逢,精彩延续还是一场炒冷饭?

《白夜破晓》:七年后的重逢,精彩延续还是一场炒冷饭?

言,亦难掩他们内心深处那份坚守和深情。七年之痒的现象在《白夜破晓》中逐渐显现,角色们面临精神压力。作者对《白夜破晓》的解读将延续至下回,期待其在故事的深度挖掘和人性探索方面有所突破。总的来说,《白夜破晓》作为《白夜追凶》的续集,开播以来引起了广泛热议,展示了剧组对续集的重视和对剧情的高度还原。然而,部分观众认为其未能突破前作,存在炒冷饭之嫌。尽管如此,这部剧依然值得一看,因为它描绘了一段长达七年的情感纠葛。

热点资讯 11.23
赵丽颖产后首次惊艳亮相,紧致肌肤显迷人身材;关晓彤、佟丽娅等超模宛如仙女下凡般美艳绝伦

赵丽颖产后首次惊艳亮相,紧致肌肤显迷人身材;关晓彤、佟丽娅等超模宛如仙女下凡般美艳绝伦

红毯集体翻车事件中,王子文、关晓彤等女明星纷纷因为造型不当引发争议。有部分人认为王珞丹的造型过于夸张,有时尚人士则认为金晨的清新简约造型颇具艺术气息。整体来看,女明星们的造型还需继续努力,以提高她们的影响力和吸引力。

热点资讯 11.23