我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:王中王 > 定点运算 >

寒武纪发布首款云端AI芯片MLU100_创始人兼CEO陈天石公开信内容预

归档日期:05-26       文本归类:定点运算      文章编辑:爱尚语录

  5 月 3 日,智能芯片公司寒武纪科技在上海举办了 2018 产品发布会。会上,寒武纪正式发布了多个最新一代终端 IP 产品采用 7nm 工艺的终端芯片 Cambricon 1M、首款云端智能芯片 MLU100 及搭载了 MLU100 的云端智能处理计算卡。

  在人工智能技术的发展过程中,神经网络正不断迈向更深、更复杂的方向,而硬件则正朝着机器学习任务处理专用的道路前进。目前,国内已出现十余家人工智能芯片公司,而寒武纪是其中的佼佼者。作为全球唯一一家 AI 芯片独角兽,寒武纪于 2016 年诞生于中国科学院计算技术研究所,并率先推出了商用化的深度学习专用处理器 NPU(神经网络处理器)。

  其实,寒武纪科技的产品早已进入普通用户的手中。去年 10 月,华为发布了搭载全球首款「人工智能处理器」麒麟 970 的手机 Mate 10 系列(以及其后发布的华为 P20、荣耀 V10 系列等),其芯片架构中就包含了寒武纪的 Cambricon-1A 神经网络处理器。1A 也由此成为了全球首个成功商用的深度学习处理器 IP 产品。

  寒武纪的智能处理器主要针对于人工智能领域计算机视觉、语音识别等方面的任务,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类应用。据称,其专为神经网络任务优化的架构可以使其达到传统四核 CPU25 倍以上的性能。

  与此前仅面向终端设备的芯片 IP 不同,本次发布会上,寒武纪推出的芯片不仅性能更强大,而且还出现了面向云端服务器等专业应用场景的产品。

  首先是终端处理器部分。今天发布的寒武纪 1M 是这家公司的第三代机器学习专用芯片,其性能超越此前广泛使用的寒武纪 1A 十倍。去年 11 月 6 日,寒武纪在北京举行了公司成立以来的首场发布会,陈天石在会上披露了 1M 处理器的发展计划。

  在本次发布会上,寒武纪 1M 处理器的具体参数终于展示在人们的眼前。1M 使用 TSMC 7nm 工艺生产,其 8 位运算效能比达 5Tops/watt(每瓦 5 万亿次运算)。寒武纪提供了三种尺寸的处理器内核(2Tops/4Tops/8Tops)以满足不同场景下不同量级智能处理的需求,寒武纪称,用户还可以通过多核互联进一步提高处理效能。

  寒武纪 1M 处理器延续了前两代 IP 产品(1H/1A)的完备性,可支持 CNN、RNN、SOM 等多种深度学习模型,此次又进一步支持了 SVM、k-NN、k-Means、决策树等经典机器学习算法的加速。这款芯片支持帮助终端设备进行本地训练,可为视觉、语音、自然语言处理等任务提供高效计算平台。「这意味着使用 1M 的设备可以根据用户行为对应用进行个性化定制,」陈天石表示。「本地训练同时也解决了用户数据隐私的问题。它是全球第一款支持本地机器学习训练的智能处理器产品。」据悉,该产品可应用于智能手机、智能音箱、摄像头、自动驾驶等不同领域。

  在去年 11 月份的发布会上,陈天石展示了服务器级 AI 处理器 MLU 系列的发展计划,寒武纪希望将自己的产品从神经网络加速拓展到机器学习,以及更多任务中。本次发布的又一大重点就是首次亮相的 Cambricon MLU 100 云端 AI 芯片,以及以此为基础的云端智能处理计算卡。「在三年前,我们就开始了两颗测试芯片的研发了。我们时刻准备着将自己的产品放入云端。」陈天石表示。今天推出的产品正是寒武纪稳步推进的成果。

  MLU100 采用寒武纪最新的 MLUv01 架构和 TSMC 16nm 工艺,可工作在平衡模式(主频 1Ghz)和高性能模式(1.3GHz)主频下,等效理论峰值速度则分别可以达到 128 万亿次定点运算/166.4 万亿次定点运算,而其功耗为 80w/110w。与寒武纪系列的终端处理器相同,MLU100 云端芯片具有很高的通用性,可支持各类深度学习和常用机器学习算法。可满足计算机视觉、语音、自然语言处理和数据挖掘等多种云处理任务。搭载这款芯片的板卡使用了 PCIe 接口。

  在发布会上,寒武纪的合作伙伴们展示了基于寒武纪芯片的部分应用方案。其中联想推出了基于 Cambricon MLU100 的服务器 ThinkSystem SR650。该产品为 2U2 路机架式规格,支持两个 MLU100 智能处理器计算卡。这款服务器打破了 37 项服务器基准测试的世界纪录。

  作为寒武纪的创始人和CEO,我非常自豪地与大家分享一个消息:2018年5月3日,寒武纪已在中国上海发布了首款云端智能芯片MLU100及相应的板卡产品。MLU100芯片主要用于云端的机器学习推断任务,可支持视觉、语音、自然语言处理等多种类型的云端应用场景,平衡模式下的等效理论峰值达128万亿次定点运算每秒,高性能模式下的等效理论峰值更可达166.4万亿次定点运算每秒,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。MLU100芯片是寒武纪发展历程上全新的里程碑,标志着寒武纪已成为中国第一家(也是世界上少数几家)同时拥有终端和云端智能处理器产品的商业公司。

  寒武纪的创始团队来自学术界,我本人也是中科院计算所的教授和博士生导师。在过去十年的基础学术研究中,我们与国际同行紧密合作,为国际学术界和工业界同仁们奉献了一系列人工智能与处理器架构交叉研究的新思想。2013年前后,我作为主要参与者,与中科院计算所和法国国家信息与自动化研究所(Inria)的同事们一道见证了DianNao系列深度学习处理器架构在国际学术界引起的轰动性效应。如今我们非常自豪地看到,DianNao系列学术论文已经将智能处理器的创新思想播撒到全世界,得到哈佛、斯坦福、麻省理工、普林斯顿、英特尔、谷歌等顶尖国际机构的高频次学术引用,成为诸多国际顶尖大学处理器架构教学的重要资料,成为全世界每一家智能芯片设计公司无法忽略的参照。光荣属于中国科学院和Inria,属于我的长期学术合作者陈云霁教授和Olivier Temam教授,也属于我优秀的学生们;而知识,属于全人类。

  DianNao系列的核心思想内涵在于不断追求智能处理最极致的性能。但要让学术界之外的普通民众都能受益于这样创新的思想,还需要更多的努力和协作。我走出实验室创立寒武纪的目的,就是要让全世界都能用上智能处理器,而不是让思想停留在论文纸面,落上历史的灰尘。“一花独放不是春,万紫千红春满园”,寒武纪在成立之初就延续了学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享公司最新的技术成果,帮助我们的全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。公司研发的寒武纪1A(Cambricon-1A)是全球第一款商用终端智能处理器IP产品,赋能华为麒麟970芯片成为世界首款人工智能手机芯片,为华为Mate10、P20等四款手机插上智慧之翼。未来,更多的国内外客户也将陆续发布他们集成寒武纪处理器的芯片产品。这次发布会,我向大家介绍了寒武纪第三代处理器IP产品寒武纪1M的更多细节,期待与全球范围内的客户通力合作,将智能播撒到每一台终端,让整个地球都变得智能。

  寒武纪在技术上贯彻“端云协作”的理念,在研发和推广终端处理器IP产品的同时,亦非常重视云端智能芯片的研发。这次发布的MLU100云端芯片,不仅其本身可以高效完成多任务、多模态、低延时、高通量的复杂智能处理任务,还可以与寒武纪1A/1H/1M系列终端处理器完美适配,以端云协作的方式为广大客户提供前所未有的智能应用体验。MLU100云端芯片是寒武纪的里程碑,是这家伟大创业公司征程的新起点,更是智能芯片领域的新标杆。我们期待与全世界人工智能和集成电路的上下游同行携手共进,从“芯”开始铸造人类社会的智能时代,向着全人类共同的美好未来前进。

本文链接:http://brazil-run.com/dingdianyunsuan/447.html