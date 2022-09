“快来吧奔腾电脑,让它们代替我来思考。”

1999 年,朴树在《New Boy》中唱出这句歌词时,x86 架构芯片正经历着一场华丽蜕变,借着 Wintel 组合,个人电脑飞入寻常百姓家;2021 年,当“房东的猫”乐队翻唱这首歌时,电脑已不是人们一窥世界的主要窗口,x86 架构也遇到了宿命对手:Arm。

CPU 是最重要的数字芯片。过去十年,Arm(Advanced RISC Machine)架构的 CPU 已横扫智能手机市场,并日渐侵蚀传统桌面电脑市场,在服务器计算机市场也是步步紧逼。如今,Arm 指令集在芯片国产化运动中展现出的潜力,也吸引大量资本进场,让这一轮半导体盛宴大有烈火烹油之势。

作为所有现代计算系统不可或缺的大脑,今天的单颗 CPU 可拥有多个处理内核,数百亿个晶体管,最佳工作负载类型为串行计算,其极强的通用性亦可指挥运算全局,控制调配计算机所有硬件资源,解释计算机指令和处理计算机软件中的数据 [1]。因此,从系统启动、生产力应用程序,到密码学、人工智能等高级工作负载,它都能应对。[2]

根据指令集(又称为架构或 ISA)的不同,CPU 分为不同流派。所谓指令集,是指一套软硬件的标准规范,CPU 芯片和软件应用会围绕这套规范设计,可以将它理解成对 CPU 运算指导优化的硬程序。指令集一般分为两大体系结构,即复杂指令集 CISC(Complex lnstruction Set Computer)和精简指令集 RISC(Reduced Instruction Set Computer)。

指令集的开端是英特尔(Intel)。英特尔于 1971 年推出首款完全集成到单芯片中的商用微处理器 4004 以来,CPU 及指令集发展了将近 50 年。

▲ CPU 的 50 年历史内经历了四个阶段,制表丨果壳硬科技

资料来源丨 CSTC[3]

50 年间也浮现了诸多指令集,但一些参与者或由盛转衰,逐渐淡出市场,或初出茅庐,尚不能担重任。桌面端、移动端、服务器对 CPU 性能要求高,目前市场形成以英特尔和 AMD(超威半导体)为代表的 x86 指令集占大部分份额、Arm 指令集占小部分份额的局面。

注丨 x86 的由来 —— 由于早期英特尔的处理器以 86 结尾,包括 Intel 8086、80186、80286、80386 以及 80486,所以被称为 x86。

▲ 市面主流指令集情况,制表丨果壳硬科技

国内 CPU 依赖进口,且以服务器对 CPU 性能和数量需求最大,其中英特尔和 AMD 占据了 2021 年中国服务器 CPU 出货量的 94% 以上。

▲ 2021 中国服务器 CPU 市场出货情况,图源丨华安证券 [4]

在诞生之初,Arm 只用于手机,而后凭借低功耗的优势占领了嵌入式和汽车领域。如今,无处不在的 Arm 芯片累计出货量已超过 2250 亿颗 [5]。

近年来,原本活跃于移动设备(手机 / 平板 / 可穿戴)和嵌入式领域的 Arm,已大批进军桌面端、移动端、服务器 CPU。这股越吹越猛的大风背后的造势者,是苹果和亚马逊。

▲ Arm 架构生态系统日渐庞大,图源丨太平洋证券 [6]

苹果有着引领行业风向的能力,几次更换指令集,都颠覆了桌面端、移动端 PC 市场。

1994 年,苹果将 Mac 从摩托罗拉 68000 转移至 PowerPC,PowerPC 是由苹果、IBM 和摩托罗拉三家创立的一种指令集,一段时间内 PowerPC 都取得了巨大成功,如索尼的 PlayStation3、任天堂的 Wii 和 Wii U、微软的 Xbox 360 都搭载了 PowerPC 的处理器;[7]

2005 年,苹果转向使用英特尔的 x86 处理器,彼时乔布斯希望与其它计算机 OEM 厂商争夺更多市场,便使用与对手相同的指令集,允许用户安装对手的操作系统,以此“挖墙脚”。当然,如果不认可 x86,乔布斯也不会选用它;[8]

2020 年,风向又变了,苹果弃用 x86,转用自研的 Arm SoC(芯片内包含 CPU、GPU、ISP、NPU 等),一时间业界和媒体都认为,苹果或将引领新的十年潮流。[9]

自苹果弃用 x86,推出 M1 后,把 Arm 带得风生水起,整个市场也充满了火药味,搞得 x86“人见人嫌”。Geekbench 5 测试分数显示,2020 款 13 英寸 MacBook Pro(M1@3.2 GHz)比 2019 款 15 英寸 MacBook Pro(i7-9750H@2.6 GHz)单核快 70%,多核快 50%,并且 M1 还只有 8 线程,i7-9750H 为 12 线程 [10]。无独有偶,PassMark 基准测试上显示,M1 芯片单核性能甚至超过了部分 11 代酷睿 i9(i9-11900K、i9-11900F 等)和 12 代酷睿(i7-12700T、i5-12500T 等)。[11]

也有一些不同的测试结果,Cinebench R23 测试显示英特尔 CPU 的单核性能强于 M1,但多核性能依然不及 M1[12]。英特尔也在 M1 产品上市后,急忙分享出一组数据,证明自家 产品优势更大(i7-1185G7),但当时并未掀起波澜。[13]

之后,苹果推出 M1 Pro、M1 Max、M1 Ultra,Arm 芯片势头愈发猛烈。

2022 年 WWDC 期间,苹果推出了 M2 芯片,采用台积电第二代 5nm 制程,集成 200 多亿个晶体管,较 M1 提升了 18% 的 CPU 速度,让苹果顺利设计生产出这样芯片的关键是 Arm。[14]

尽管业界有越来越多的声音批评苹果炒作,尽管苹果数据也的确有夸张之嫌,但不得不说,苹果芯片的实机效果还是比较好的,坐实了 Arm 在桌面端和移动端 PC 的能力。

作为不折不扣的 Arm 派,亚马逊(Amazon)在服务器领域力推 Arm 芯片。从 2018 年就首度推出基于 Arm 的 AWS(Amazon Web Services)Graviton 云处理器,向云计算市场展现了 Arm IP 的优势。

此外,Google、微软等大厂也都自研 Arm 云处理器。

主攻 Arm 架构服务器 CPU 的公司 Ampere(安晟培)曾向笔者表示,x86 已推出很长一段时间,在市场中应用了几十年,其设计初衷和应用的场景都是非云端业务,这也是 x86 最大的劣势。在过去的一二十年期间,由于市场没有更好的选择,所以 x86 也会用在云端业务中,未来 Arm 在数据中心的地位会愈来愈高。

Arm 这种“越来越高”的地位,在各种 CPU 领域都有所体现,这也是国产势力也大举进军 Arm 市场背后的逻辑。

随之而来的,是各路资本入局,国产 Arm 架构 CPU 公司迎来遍地是钱的时代。

多年以来,我国市场上的 CPU 均依赖进口,不仅存在木马、漏洞、后门等安全隐患,还可能会被监听和控制。在“震网”“棱镜门”及各种制裁事件后,摆在国产 CPU 面前的只有一条路:发展自主可控。[15]

但作为“人造物巅峰”,造 CPU 很难。一款成功的 CPU 背后不仅要求高昂的投入,还会涉及一整个链条:一方面,高性能 CPU 尖端复杂,是典型的人才、资金和技术密集型行业;另一方面,造出芯片并不意味着结束,还要建立完整的产业生态,一款芯片没有配套软硬件,便无用武之地。

想造 CPU 就先要有指令集,摆在国产厂商面前有三条路:

获得 IP(知识产权)内核授权:相当于买半成品,将已经设计好的电路或物理版图买下,基于半成品再后端设计,入门门槛低,性能有保障,但硬核 IP 需要使用指定的代工厂和工艺,而软核 IP 除了配置选项外,不允许任何设计改动,更重要的是,这两种 IP 均不具备自主可控性;[16]

获得指令集授权或使用开源指令集:只买下指令集授权,在此基础上自主设计相应规格 CPU。这种模式下只有一纸授权书,设计 CPU 全靠自己,具有一定自主可控性,但指令集本身也存在制裁风险;或者使用 RISC-V 这种开源指令集,自主设计 CPU,可控性高,但如需使用一些专利模块,也会涉及授权;

自主研发指令集:新建世界上不存在的指令集,不依赖任何其他指令集,技术门槛极高,但高度自主可控。国内也存在一些半自主研发的情况,在授权指令集基础上自主研发新指令集。

通过这三条路,目前国内 CPU 市场形成 x86、Arm 和自研三大指令集阵营:

x86 方面,天津海光和上海兆芯的 IP 授权分别来自于 AMD(超微半导体)和 VIA(威盛半导体),性能高,兼容性好,生态完整,但在自主可控上存疑;

Arm 方面,鲲鹏、飞腾等均为指令集授权,具有一定自主可控性,兼容性和生态依赖 Arm 指令集自身;

自研方面,龙芯此前为基于 MIPS 授权的自研,后弃用 MIPS,完全自主研发,申威为基于 Alpha 授权的自研,自主可控性非常高,但性能与国外有差距,兼容性和生态需要进一步打造。

▲ 国产主要 CPU 厂商情况,制表丨果壳硬科技

CPU 作为基础设施,一定少不了新玩家,不缺资本加持。

造 CPU 烧钱,与 CPU 相关的公司融资额度也持续攀升,一些公司在 Pre-A 轮就能拿到数亿元的融资金额,估值一度超过 40 亿元。

这种热潮中,虽然一些厂商会选择开源的 RISC-V,设计自主可控力极强的 CPU,但大多数厂商还是会选择较为成熟的 Arm 来制造高性能 CPU。

▲ 国内主要融资阶段企业情况,制表丨果壳硬科技

那么国产在现在大举进军 Arm 高性能 CPU,会面临什么挑战?

Arm 声势虽然很大,但 x86 仍然不会交出权杖。在实际应用中,双方互有胜负,这源于在设计 CPU 时,x86 和 Arm 的不同机制和产品特点:

行业普遍比较认可的结论是 x86 基于复杂指令集(CISC),指令在多个时钟周期中处理,Arm 基于精简指令集(RISC),每个时钟周期执行一条指令,因此 Arm 在功耗上更优,但从性能上看,Arm 弱于 x86;

x86 更多工作由硬件实现,Arm 是将部分工作交给编译器完成,从而降低硬件复杂度;[17]

作为 RISC 的 Arm 指令集,可使用每周期指令数(IPC)来衡量 CPU 运行速度,但作为 CISC 的 x86 指令集不适合用 IPC 反映运行速度,这是因为 x86 架构一条指令需 CPU 执行大量工作,而 Arm 一条指令通常只对应一个功能或操作;[18]

x86 指令集发展时间长,PC 领域生态明显比 Arm 成熟,且此前与 Windows 深度绑定,被戏称为 Wintel(Windows+Intel),目前 Arm 支持的操作系统、语言、云原生、数据库、CI(持续集成)/CD(持续部署)越来越多,但生态仍然不及 x86;

Arm 指令集从诞生之初便是以授权模式经营,Arm 公司本身不依靠自有设计制造或出售 CPU 芯片,由于开放授权,所以在开发上较为活跃,但 x86 指令集几乎是闭塞的,只对极小范围公司授权,在今年 2 月才开始松动对 x86 指令集的软核和硬核授权,使客户能在英特尔制造的定制设计芯片中混合 x86、Arm 和 RISC-V 等不同 CPU IP 核。[19]

一些专家也曾警示业界,争论指令集没有意义。这是因为与 CPU 性能进步相关的技术技巧与指令集是完全独立的,包括流水线、乱序执行、分支预测器、多级缓存和许多其他技巧,这些技巧可以在 x86、Arm、RISC-V 等任何指令集中实现。Arm 和 x86 只是与 CPU 通信的一种语言,最终性能如何,还是全凭芯片设计。[20]

简单来说,就是指令集就是一把锤子,能把芯片锤成什么样,取决于使用者本身。即使手握成熟的 Arm 指令集,国产厂商能走多远,还是要看 CPU 设计能力。

另外,虽然 Arm 在高性能 CPU 上有很大进展,且有巨头强势站队,但不得不说目前 x86 在性能和生态上还是具有绝对优势,短期内难以一口吃掉 x86 的市场份额。

Arm 拥有极大的潜力,但仍需时间发展。

2020 年,x86 占据将近 98% 的 CPU 市场总量。据 Tom's Hardware 数据显示,2020 年 Q2 Arm CPU 占整体市场份额不到 2%,而在 2022 年 Q1 Arm CPU 占整体份额的 11.3%。[21]

据 Khaveen Investments 预测,2025 年 Arm CPU 市场可达 169.2 亿美元 TAM(可触达市场),占整体市场的份额将提升至 19.5%。[22]

▲ 2020 年 Q2~2022 年 Q1 Arm CPU 在市场占有率变化情况,图源丨 Tom's Hardware[21]

造 CPU 烧钱量很大,尤其是 Arm 这种专以授权为生的企业,授权费极高。Arm 的收费项目包括前期授权费(License)、版税(Royalty)和技术咨询服务费。[23]

前期授权费是 Arm 收取的固定费用,授权模式分指令集授权(Architecture License)、传统 IP 授权(Traditional IP Licensing)和灵活授权(Arm Flexible Access)三种。

如今中低端的 Arm 芯片授权费已较低,但对性能要求较高的桌面端、移动端、服务器 CPU 属于尖端领域,授权费用高。前期许可费预估达到 100 万美元~1000 万美元,用的 IP 越多就越贵。[24]

我们可通过一个数字感受一下 Arm 的授权费用:虽然英伟达(Nvidia)没有成功收购 Arm 公司,但在前期交易中曾向 Arm 支付了 7.5 亿美元购买 Arm IP。[25]

版税是芯片出货后 Arm 的抽成费用。版税是大多数半导体 IP 设计公司的主要盈利点,Arm 的版税一般约为芯片最终售价的 1%~3%。

值得注意的是,除了授权费,做 CPU 还有很多烧钱项目,稍有不慎,融资的钱就会烧光。现今本就人才紧缺,人员支出只会增长不会下降,没有资深的设计人员就做不出好 CPU;没有 EDA 软件就没有 CPU 的基础工具,而 EDA 也需要授权;高性能 CPU 一般都是先进制程,制程能够快速提升 CPU 性能,但制程越先进,流片费就越贵,并且一旦流片失败,还要承担高额损失;产品试产阶段有诸多测试项目,稳定性差的 CPU 产品必会被淘汰。

根据我们的粗略计算,一款 CPU 产品从人力成本,到授权再到成功流片和试产,总支出超过 1.3 亿元,如果预留流片失败的成本,总支出将更高。

▲ 芯片初创公司所需费用,制表丨果壳硬科技

注丨本表仅为粗略计算,不作为投资参考,市场波动严重,请以实际为准

虽然国产厂商的初衷是生产自主可控性的 CPU,但从外部看,随着大国实力交锋,Arm 指令集本身也存在一定风险;从内部看,掌握 Arm 指令集的 Arm 公司,自身也正处于动荡期,原因一方面来自软银的上市压力,另一方面中国子公司问题待解。

此外,由于 Arm 对半导体界太重要,Arm 的 IPO 引发行业对公司未来所有权和中立性的担忧,许多国际巨头都争相规划收购。自从英伟达收购失败后,一家公司吞并 Arm 的路似乎行不通,之后英特尔、SK 海力士、高通等企业又跃跃欲试,想组团收购。但假若收购方均为美企,相当于 Arm 控制权变相落入美国之手。

虽然国产企业也能购买 Arm 当前版本的永久授权,但 Arm 本身也在进化,假若被制裁,将无法获得后续新版本。也就是说,使用 Arm 的风险一直存在。

因此,业界对这种 Arm CPU 创业投资潮持怀疑态度。造 Arm CPU 本意是想跳出 x86 的困境,但结果是否会变成从一个坑跳到另一个坑?另外,现阶段投资人扎堆投 Arm CPU 项目,有个风口就上,不考虑同质化严重的现状,也不考虑估值是否过高,后续项目如何退出?二级市场接得住吗?

现在,管不了那么多了,先上车吧。

