影视聚合站 科技 文章内容

从RTX3090到11代酷睿的iRISXe,更值得期待OPENVINO

发布时间:2020-09-04 14:20:42来源:电子产品世界

9月的第一周,称得上是很多PC发烧友的期待已久的节日,作为PC现在性能最大标尺的显卡和处理器,两大巨头先后发布了极具时代意义的RTX30系列显卡和11代酷睿系列CPU。

作为一个刚刚入了10700K+2070的攒机党来说,在扼腕痛惜之余,想起自己工作的身份,还是要忍着滴血的痛苦好好学习下两大重量级系列带来的全新创新。

网上爆料很多我不会一一列举各种细节,只挑我最感兴趣的地方。首先是11代酷睿的SuperFIN工艺,这东西一年前英特尔的工艺分享会上介绍过细节,看指标提升我是能看得懂,看细节的地方我就不行了,当时左右坐着姚老师和毕老师两位我自认为媒体圈里非常精通制造的前辈,但看他们似乎也有点茫然我就没好意思开口请教。

不过英特尔从拼数字节点到比密度的转变过程中,核心的思想就是增加FIN的密度并进行超微缩,尽可能压缩从平面到立体过程中的空间,并加入大量导通孔增加连接,从而提升了单位面积上的电路密度,进而缩小因节点差造成的密度差。

这也是为啥从密度数据上英特尔一直号称自己没有落后的原因,14nm能够做到台积电10nm的密度水平,而这次10nm的11代酷睿基本能接近台积电7nm的工艺密度。至于所谓的20%性能提升,大部分会来自于密度提升带来的性能增强。

GPU核显部分则是全新的XeLP,这也是Xe架构首次登场,虽然说很多像我这样的攒机党始终对集成显卡嗤之以鼻,但作为从业者还是必须承认集成显卡在异构计算特别是AI应用中可以发挥更多的作用,这也是为啥我选了10700k而没选10700kf的原因吧。

这次发布的11代酷睿中的Xe是低功耗版本,最多96个EU执行单元,比前一代增加一半从而使得性能提升最高可达2倍,并支持深度学习加速指令DP4A,可加速AI应用,号称AI性能提升了5倍之多。此外,AI方面还集成新的高斯网络加速器GNA2.0,相当于NPU的角色,只需很低的功耗和CPU占用率,就可以高效进行神经推理计算。

当然说显卡和AI性能,就必须提到真正的显卡大佬NVIDIA,就在英特尔发布的前一天,全新的RTX30系列隆重登场,除了让人震惊的公版价格之外,残暴的显示和AI性能值得我们大书特书一把。

看看媒体同行的评价吧,新一代RTX30系列产品号称实现了GeForce有史以来前所未有的性能飞跃,对比Turing图灵架构的上一代性能提升2倍,能效比提升1.9倍,可让玩家享受前所未有的实时光线追踪、AI游戏体验。NVIDIA创始人兼CEO黄仁勋激动地表示:“20年后,我们再回首往事,会发现游戏从今天起腾飞。”

采用安培架构的RTX30系列的全新的流式多处理器拥有全球速度最快、效率最高的GPU架构,处理能力为30Shader-TFLOP/s,FP32浮点吞吐量是上一代的2倍。第二代RTCore(光追核心)的计算能力为58RT-TFLOPS,是上一代的2倍,同时支持光线追踪、着色与计算。第三代TensorCores(张量核心)的算力高达238Tensor-TFLOPS,是上一代的2倍,能够更快速、更高效地运行AI技术,比如DLSS深度学习超采样抗锯齿。

光是游戏性能,是不可能撑起NVIDIA的三千亿市值的,AI才是真正的关键。GeForceRTX3090,搭载24GBGDDR6X显存,可以应对最具挑战性的人工智能算法,并满足大规模内容创作的需求。RTCore(光追核心)的应用,其实就是发挥了AI推断在部分应用中的价值,能够更好的基于视觉处理进行相应的应用展示,从而打造成更完美的应用体验。

虽然NVIDIA为了防止很多用户将商业显卡直接用于大规模人工智能应用,进行了相应的架构和软件的调整,但看着仅仅万元性能如此强悍的3090,是不是觉得用起来未必会输给只能进行复杂运算的Tesla了?

不管是11代酷睿,还是RTX30系列,我们看到的是真正的性能突破早就超出了传统桌面PC性能的范畴,将图形处理和AI处理的能力进行大幅提升才是关键。比如实时光线追踪和AI游戏体验,这两点都是将人工智能与图形视觉处理合二为一的应用,而这不仅是娱乐类游戏未来的发展方向,更是诸多行业应用的未来关键。

并行计算和多平台异构计算早就不再是什么新玩意,但是能把并行计算和异构计算处理得非常完美的软件平台却不多,如果要再加上最热门的人工智能推断,那就少之又少了,这里面英特尔的OPENVINO算得上比较成熟的一个。

关于OPENVINO的特点,我们的社区里有足够多的资料和文章讲的比我有内涵又形象,我就不多说这部分了。就拿全新的酷睿11代来说,增强型的Xe对于没有单独显卡的笔记本来说是个不小的性能提升,但最大的价值也许将会在OPENVINO上得以体现。为啥这么说呢?

因为如果让Xe去跟RTX30系列比多边形生成和运算完全是班门弄斧,但要是比AI推断和机器视觉处理还真未必会输,就是因为OPENVINO能够更好的将应用所需的计算在CPU和GPU内核中进行优化资源调配,届时跟RTX3090对比的就不是单纯的Xe小朋友了,人家可以直接拉着幼儿园阿姨11代酷睿一起跟你比算数,比画画,比搭积木……

在之前英特尔的平台上,四大处理器架构中GPU一直是相对较弱的一环,而其他几个平台又没有整合在一起的SoC出现。我们都知道在部分并行计算中,GPU有非常明显的计算优势,于是当作为核显的Xe能够提供更强大性能之际,英特尔的单芯片AI处理就会变得优势更加明显,再配合上OPENVINO的强大AI推断性能和在多处理平台之间游刃有余的兼容和协调能力,我们有理由期待在11代酷睿平台上会有更多更强大的人工智能推断应用的出现。

特别是当边缘端处理性能需求愈来愈高,这次发布的适合移动平台,功耗在10-20w左右带有Xe核显的11代酷睿,很明显会在很多边缘端应用中更好的发挥其强大的人工智能价值,而如果展现11代酷睿的这方面价值,就要看你会不会借助OPENVINO平台进行相关应用开发了……

关于OPENVINO

OpenVINO,(OpenVisualInferenceandneuralnetworkoptimization)直译就是“基于视觉推断与神经网络优化”。最直观的表述就是英特尔将时下最流行的视觉相关处理和人工智能推断与神经网络计算等概念融合到一个软件框架下,可以在任何英特尔处理平台上进行无缝的应用,满足各种将人工智能与视觉处理植入到各种物联网的应用中的时代需求,从而真正实现云端和边缘端对智能化运算的理想算力分布优化,并更大价值的发挥异构计算模式的应用价值。

相比于其他人工智能的软件平台,OpenVINO兼具了学术研究和商业应用的多方面需求,有人认为OpenVINO的ROS/ROS2版本可能是能运行在CPU上的最好的深度学习框架,它的功能强大并且可以大大降低部署成本,各种对开发者的支持和参考样例非常丰富,适合从最基础的入门级开发者到顶尖系统设计团队的不同研究和开发需求。

OpenVINO对各种图形图像处理算法进行了针对性的优化,从而扩展了Intel的各类算力硬件以及相关加速器的应用空间,实现了AI领域的异构计算,使传统平台的视觉推断能力得到了很大程度的提高。OpenVINO实现了一套通用的API,可以混合调用CPU、GPU、MovidiusNCS和FGPA的算力来共同完成一次视觉推断,预先实现了一系列的功能库、OpenCLkernel等,可以缩短产品面世时间。

基于OpenVINO,英特尔从图像采集设备到云的全面视觉战略将加速视频技术在各个行业中的采用,在新零售、教育、智能交通、智慧金融、智慧城市、智能工厂以及无人驾驶等领域,OpenVINO已经在众多国内外顶尖客户的方案中展现出强大的优势。

扫码入群

扫码添加管理员微信

加入“电子产品世界”粉丝交流群

↓↓↓↓点击阅读原文,查看OPENVINO生态社区

© 2016-2017 ysjhz.com Inc.

站点统计| 举报| Archiver| 手机版| 小黑屋| 影视聚合站 ( 皖ICP备16004362号-2 )