发布时间:2021-02-11 09:57:47来源:观察者网
►文/观察者网科工力量龙科多
2月9日,据CNBC报道,百度正在为成立一个独立的AI芯片企业筹集资金。百度正式加入芯片这场硬仗。
目前,百度自主研发的AI芯片昆仑1已量产2万片,在百度搜索引擎、百度无人驾驶汽车中广泛部署,昆仑2也即将于今年实现量产。百度选择在这个时间宣布消息,证明百度无人驾驶技术、人工智能技术企业稳的当下,选择以积极进取态度进行布局,百度要不断进行底层研发,做中国“AI新型基础设施”。
“算力不足恐惧症”推动产业发展
目前,芯片的格局看似很稳固,几家国际大厂把握行业制高点,但是如果把时间拉到10年的周期围堵,会明显感受到,每一次下游应用的变化,都会因芯片算力等性能的提升,带来半导体行业的重大洗牌。从超算、PC,到智能手机,特殊的历史周期,总会将技术积淀者推上历史潮头。
今天,人们习惯于把小小的中央处理器(CPU)芯片视为一国半导体产业能力的代表,然而40年前,也就是上世纪80年代,半导体产业生态极为不同,个人PC是媒体聚光灯之外的鸡肋市场。站在终端性能顶点的是,超级计算机。
日本企业是那个时代的佼佼者,1983年,日本电气(NEC)发布的SX系列超算,其高端型号每秒运算速度超过10亿次,是当时最快的超算。这样的成绩背后,有着芯片技术实力后盾。东芝、富士通的产品,算力优秀,成为“高质量”的代名词,良品率远高于英特尔、德州仪器。
算力的提升,总会带来产业的大洗牌。90年代,个人电脑爆发,对算力需求更高,带来了英特尔的崛起。该公司创始人戈登摩尔曾提出:“集成电路上可以容纳的晶体管数目,每18个月翻一番”。这一定律,也是该公司坚守的目标。
虽然1971年,英特尔推出的4004型处理器芯片,算力还是弱者,甚至在80年代,被日本半导体企业压制。可仅仅过了十年,历史老人奖励了英特尔在算力上的坚守,个人PC市场需求激增,几乎都是使用该公司的微处理器作为内核。2000年的《IC洞察》显示:1999年,32位、64位微处理器市场,英特尔占据的市场接近80%。
到了2010年,传统的PC市场已接近饱和,芯片算力的进步,加上低功耗性能的加持,将智能手机推入舞台中央。ARM、苹果、三星又一批市场新秀诞生,成了主角。
在美国企业在市场疯狂揽金的时候,ARM的员工的办公地点,还只是一个谷仓。但是一直坚守高性能、低功耗、低成本的处理器芯片研究。同样是十年的坚守,苹果、三星与ARM芯片的结合,智能手机产业爆发了。2007年,乔布斯拿着可触屏的手机,向外界演示时,全球都震惊了。
2015年AI登场,AIoT时代来临。2020年的5G又加速了AI的渗透,芯片行业再一次处在聚变前夜,实时处理、高精度、超低功耗成为新的需求点。中国企业正在为这一变革,默默积累。
不同于其他公司高调宣传,百度已经在芯片领域钻研多年,用于通用AI处理器的昆仑系列,2010年就开始了技术积累,2018年正式发布,2019年流片成功,2020年昆仑1量产两万片,昆仑2也即将于今年实现量产。与此同时,该公司的另一款芯片,用于语音交互的鸿鹄芯片也早在两年前问世。爆款智能音箱小度就是搭载了鸿鹄芯片,出货量仅次于亚马逊和谷歌位列全球第三。
百度为何做芯片?
一块芯片的诞生,背后是模块化的产业链条。芯片行业前期投入大,专业门槛高。导致芯片的生产一方面分工细化,另一方面生产集中。从IP授权、仿真软件、设备材料、到芯片设计、制造代工、封装测试,一颗小小的芯片背后是几十家,甚至上百家的公司合力完成。
大规模的分工生产,可以让更多人享受到芯片带来的便利。这也让芯片市场的发展模式产生了变化。在以前,芯片市场主要考虑的是硬件产能,所以英特尔、英伟达、AMD这样的厂商可以通过掌握硬件标准,确保自身的行业话语权。
近些年来,虽然硬件产能的需求依然有增无减,但是自动驾驶、机器学习等新领域的发展,导致算力需求也产生了爆发性增长。以无人驾驶领域为例,市场上常见的商业化车型L2到L3级别无人驾驶为主,算力集中在50TOPS以内,而根据预测,要实现L4需要的计算力超过100TOPS,而L5需要则要超过1000TOPS。互联网企业要满足这种规模的算力需求,就必然要进军芯片生产。用应用领域的实际需求,驱动上游生产更好的芯片。
互联网企业介入芯片生产,并不是外行指导内行。由于芯片领域的生产分工更加明确,互联网企业负责的主要是根据需求设计芯片,专注的是设计和研发领域。互联网巨头的不断发展,依靠的就是大量的人才和足够高的研发投入。芯片行业的分工生产,为整个行业的新变局创造了机会。
以百度研发的昆仑芯片为例,昆仑系列芯片设计出来后,对接的就是开源深度学习框架飞桨(PaddlePaddle)和百度机器学习平台(BML)。这些技术平台继续应用到日常生活的搜索引擎和智能驾驶。构建了完整的技术产业链。除了内部应用,百度对外也将保持开源,支持主流CPU、操作系统,Pytorch和TensorFlow等深度学习框架,也可支持国产化CPU和操作系统,让更多人参与到技术的落地。
实际上从技术角度来说,昆仑也会选择开源。百度昆仑系列的底层设计框架是基于FPGA设计的,最大的特点就是可编程。使用昆仑的用户,完全可以根据自己的应用场景来进行定制、魔改、二次开发。昆仑芯片不光可以应用在自动驾驶和AI,城市管理、科学研究和工业制造也可以大规模应用,路口的红绿灯和工厂的生产线,可能就因为一枚芯片连接到了一起。
从行业发展角度而言,芯片由于高投入和高技术风险的存在,在各个生产环节都会走向集中。
不过集中化的生产,并不会让芯片行业变成一潭死水。芯片算力需求的爆发性增长,让互联网企业掌握了芯片市场的话语权。需求驱动的芯片设计,会让芯片行业的生产更加多样化。更加贴合市场的研发路线,也会让芯片行业的技术研发走上快车道。
百度芯片的成色
在“自主可控”的大旗下,一夜之间,无数芯片制造企业像雨后春笋一样冒了出来,也给中国芯片行业蒙上了一层浮躁。
但百度是不同的,“芯片的成功,需要有生态的支持,这方面百度有较好的条件”,中国著名计算机专家,首批中国工程院院士倪光南对于百度造“芯”有着这样的评价。
在他看来,百度可以发挥他们在AI方面的积累的技术优势,做出的芯片可以首先在它自己的AI平台及其应用上得到应用,通过应用可以推动芯片的发展,形成一个良性循环。
事实也是如此,自主研发AI芯片,不仅需要懂硬件,还需要特别懂AI算法软件,而百度造芯采用“软硬一体化”发展战略,更注重生态。另外,它不同于传统芯片企业靠卖芯片赚钱,也不同于传统互联网企业通过卖服务挣钱,而更多的是赋能。软硬一体化的AI芯片生态一旦建立,将实现从芯片到终端、到应用、到云端,最终到服务,形成闭环,将释放出更大的商业价值。
在去年的“百度世界大会”上,百度旗下无人车、小度音箱、度晓晓先后亮相,而这些产品的技术支持,都来自百度大脑,而芯片,就是百度大脑的发动机。
一系列生态链产品的存在,使得百度丝毫不用为造什么芯片,用在哪里发愁,因为它们早就标注好了。昆仑就是百度的第一个杰作,让我们来看下它的诞生过程。
2010年,百度开始用FPGA做AI架构的研发,2011年开展小规模部署上线,2017年部署超过了10000片FPGA。2018年7月14日,是个大日子,这一天昆仑1正式发布,后面的过程更是顺利,第二年就流片成功,第三年实现量产。
昆仑1处理器采用14nm工艺打造,可在低于150瓦的功率下实现256TOPS的INT8处理能力。相较于业内标杆英伟达的TeslaT4,昆仑1的性能在不同模型下有着最高3倍的提升。
目前,昆仑1已经量产超过2万片,在百度搜索引擎和百度智能云生态伙伴等场景中广泛部署;性能更强的昆仑2也已经在研发中,这款7nm工艺打造的芯片,将于2021年实现量产,其性能对1代,将再提升3倍。
百度造芯的另一张王牌鸿鹄,问世时间要稍晚一些,2019年百度AI开发者大会上,鸿鹄才刚刚亮相。鸿鹄芯片是一款专用型芯片,主打智能家居语音交互、智能车载语音交互、以及智能物联等场景,具有远场阵列信号实时处理、高精度超低误报语音唤醒、离线语音识别等核心能力。
相比昆仑的隐身幕后,鸿鹄与消费者的接触无疑更多一点,百度的爆款智能音箱小度就搭载了鸿鹄芯片。在后者的加持下,小度音箱的出货量已经位列世界第三,仅次于亚马逊和谷歌。
有人说,在中国这股造“芯”热潮中,企业分为两种,一种是因为钱,一种是因为我们需要。百度无疑是属于后者。在英特尔、英伟达、特斯拉、苹果等全球顶级芯片俱乐部中,终于要有中国企业的一席身影了。
从构建生态提出需求、到分析需求打造芯片,再到造出芯片反哺生态,百度一直在芯片AI生态构建之路上不屈不挠,稳步前进。在这个强调科技创新的时代,中国科技要自立自强,有能力的中国企业要积极投身芯片产业,百度造芯是一股星星之火,我们需要更多的、这样的奋进火焰,点亮未来的星辰大海。