发布时间:2021-10-19 13:50:00来源:机器之心
机器之心报道
机器之心编辑部
目前业界性能最强的ARM服务器芯片,性能超过业界标杆20%,能效比提升50%以上。
10月18日是2021云栖大会的开放日,在40000平米的展区中,有一个展位格外引人注目。
这里展示着阿里的「芯片家族」:从平头哥首颗芯片玄铁910到首颗自研高性能AI芯片含光800,再到其他专用芯片,阿里这两年的造芯之路「几乎」一览无余,只有红布之下是个例外。
「红布之下是什么呢?」「到明天云栖大会开幕就知道了。」现场工作人员卖起了关子。

十几个小时后,阿里云智能总裁、达摩院院长张建锋为我们揭开了谜底:原来这是阿里平头哥芯片家族的新成员——倚天710。它采用了业界最先进的5nm工艺,单芯片可容纳高达600亿颗晶体管。

和专注于AI推理的含光800不同,倚天710是一颗通用服务器芯片(CPU),也是第一颗采用5nm工艺的服务器芯片。它基于最新的Armv9架构,内含128核CPU,主频最高达到3.2GHz,能同时兼顾性能和功耗。
在内存和接口方面,它集成了业界领先的DDR5、PCIE5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。
在SPECInt2017基础测试平台上,倚天710的跑分达到440分,是当前性能最强的服务器芯片,超出业界标杆20%,能效比优于业界标杆50%,能有效帮助数据中心节能减排。
阿里表示,倚天710是阿里云推进「一云多芯」策略的重要一步,也是阿里第一颗为云而生的CPU芯片,即将在阿里云数据中心部署。
「基于阿里云『一云多芯』和『做深基础』的商业策略,我们发布倚天710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM等合作伙伴保持密切合作,为客户提供更多选择。」张建锋介绍说。

作为一家电商、物流、云计算、大数据、全球化等场景的公司,阿里拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。随着倚天710的发布,平头哥已拥有处理器IP、AI芯片及通用芯片等产品家族。其中,玄铁系列为AIoT终端芯片提供IP,出货量已达25亿颗;含光800为人工智能场景提供AI算力,服务于搜索推荐、视频直播等行业;倚天710则通过阿里云为云上用户提供算力。
从玄铁到含光再到倚天,平头哥三年完成「三级跳」
造芯难,一直是这两三年的热门话题,国内企业也在快马加鞭补齐芯片设计的短板。但在高性能CPU市场上,国内还没有太多成功的经验。正如中国科学院微电子研究所所长叶甜春所说,集成电路就是一座喜马拉雅山,而核心芯片就是珠穆朗玛峰,「需要全世界最高端的技术。」
为了攀登这座高峰,阿里早在几年前就开始了布局。
2016年,阿里投资软件定义网络(SDN)芯片公司Barefoot以及翱捷科技、寒武纪、深鉴、耐能、中天微、恒玄科技等多家芯片公司;2017年又成立了达摩院并组建了一支由半导体行业顶级专家组成的技术团队。
2018年,阿里全资收购大陆唯一拥有自主嵌入式CPUIPcore的中天微。在那年的云栖大会上,达摩院芯片研发团队与中天微团队合并,平头哥半导体公司就此成立。
在之后的三年里,平头哥完成了「三级跳」:先是发布了当时业界性能最强的RISC-V处理器玄铁710,让基于RISC-V架构的高性能芯片成为可能,也让芯片设计的门槛进一步降低;紧接着,在2019年的云栖大会上,平头哥又发布了阿里第一颗芯片含光800,这是一颗针对场景深度定制的芯片,创造了性能和能效比的两项第一;再接着就是今年云栖大会倚天710CPU的问世。

CPU是半导体行业设计门槛最高的芯片之一。为了达到通用服务器CPU的性能、功耗要求,倚天710采用了很多领先的技术,包括Armv9、DDR5、PCIE5.0等,并对它们做了深度定制。
Armv9是ARM公司在今年3月份正式推出的新架构。它的前辈——ARM在2011年推出的第一款64位架构Armv8——之前已经在服务器领域取得了一些成功,不少企业基于此架构开发了可用于服务器和超算领域的产品,个别产品也获得了不错的效果,让Arm芯片从小型或移动设备,进入了新的领域。Armv9在此基础上进一步创新。根据ARM官方的介绍,新的Armv9架构将会至少使用10年,未来两代基于Armv9架构的处理器在性能上有望提升30%。而且与Armv8架构不同的是,Armv9架构的适用范围更广阔,其一系列改进不少都是为了Arm架构芯片可以实现高性能计算做铺垫。
长期以来,X86服务器一直占据市场主导地位,而且构建起了成熟的商业生态并占据专利和标准制定等战略高地。相比之下,ARM芯片在服务器领域存在性能劣势以及生态环境的阻力。Armv9的一系列改进为芯片企业进一步探索基于Arm的服务器芯片设计提供了信心。
除了这些国际领先技术,倚天710还引入了许多自研技术,从前端架构设计到后端物理实现都是自研。
在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到DRAM地址的转换机制,倚天710支持安全、非安全隔离、多NUMA、异常通道隔离多种特性,同时DRAM读写效率大幅度提升。
在后端物理实现方面,5nm工艺对能量密度、芯片内部结构的布局提出了极高的要求。为此,平头哥在研发过程中灵活调度了30种不同的EDA软件、深度定制时钟网络和定制IP技术。此外,他们还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。
倚天芯片的研制成功,标志着平头哥已经具备大型复杂芯片的研发设计能力,并进入与Intel、AMD、AWS等少数一流芯片公司竞争的行列。
从服务器芯片发布到玄铁处理器开源,阿里端云一体化战略逐渐清晰
除了在纵深向不断突破芯片技术外,平头哥也在积极推动芯片生态的发展。在本次云栖大会现场,平头哥宣布四款开源玄铁RISC-V系列处理器(玄铁E902、E906、C906、C910),并开放相关工具及系统软件。开发者可通过平头哥Github和芯片开放社区(OpenChipCommunity)下载玄铁源代码,在此基础上,实现开源EDA协同,创新硬件架构,丰富软件应用生态。
这是继发布玄铁710等处理器后,平头哥在RISC-V生态上的重要举措,也是全球首个商业处理器的开源,进一步拉近了RISC-V技术与开发者的距离,成为全球硬件开源的新里程碑。

AIoT时代,RISC-V架构因其开放、灵活的特性,有望成为继IntelX86、ARM后的下一代广泛应用的CPU架构。但是,当前RISC-V架构面临应用碎片化、开发效率低、软硬件适配难等问题,软硬件生态尚未成熟。
玄铁RISC-V系列处理器采用自研技术,覆盖从低功耗到高性能的各类场景,支持AliOS、FreeRTOS、RT-Thread、Linux、Android等操作系统,并已成功应用于微控制器、工业控制、智能家电、智能电网、图像处理、人工智能、多媒体和汽车电子等领域。不久前,玄铁910全球首次实现兼容安卓,极大拓展了RISC-V架构面向开放生态的想象力。
阿里表示,对于正在上升期的RISC-V架构技术而言,只有更多的开发者和企业使用,才能共同推进生态进步,真正让这一技术在芯片和操作系统等软硬件层面实现繁荣,平头哥也会从中受益。
服务器芯片发布、玄铁系列处理器宣布开源,阿里的端云一体化战略逐渐清晰。作为构筑这一战略的核心,达摩院、平头哥及阿里云,正在成为阿里巴巴三位一体的核心技术栈。平头哥得到了达摩院和阿里云的软实力加持,例如基于达摩院的算法能力,打破了算法和硬件之间的鸿沟;基于阿里云飞天云平台的优势,快速形成了端云一体芯片生态。
阿里表示,他们希望通过自研的强大技术平台和生态系统能力,推动国产自主芯片的产业化落地。
过去30年,微软研究院一直通过跨学科、跨机构、跨地域的科学研究,为微软、为社会畅想和实现技术远景,致力于培育一个有韧性、可持续且健康的全球社会,并确保技术值得信赖,可以让每一个人受益。
为了进一步探索科学与技术发展的未来,由微软全球八大研究院携手倾力打造的首届微软研究峰会MicrosoftResearchSummit2021将于10月19日至21日线上举办。
来自世界各地的300余位顶尖科学家和技术领导者将带来共150场分享,包括微软公司董事长兼首席执行官SatyaNadella,首席技术官KevinScott,微软全球资深副总裁、微软研究院负责人PeterLee……内容围绕“科学、赋能、可持续发展、医疗健康、信任”五大主题展开,话题涵盖人工智能的行业应用、机器学习、可持续发展、隐私与安全、健康和生命科学等等。
欢迎大家扫描二维码或点击阅读原文注册MicrosoftResearchSummit2021,共享这场全球学术盛宴!

©THEEND
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com