原标题:寒武纪到访深圳超算,商讨共同开展人工智能芯片市场应用研究

国内首款云端人工智能芯片发布理论峰值速度达每秒128万亿次定点运算,达到世界先进水平

我国发布“寒武纪”新一代人工智能芯片

9月3日,寒武纪科技创始人兼CEO陈天石、上海寒武纪有限公司董事长罗韬一行到访国家超算深圳中心。国家超算深圳中心主任冯圣中研究员、高性能计算、市场销售部相关负责人就人工智能芯片应用、视觉识别和自动驾驶等内容与到访者进行了深入交流。

云端智能芯片是面向人工智能领域大规模数据中心和服务器提供的核心芯片。5月3日,中国科学院发布国内首款云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域——

姓名:韩竞宇      学号:17011210093

图片 1

图片 2

转载自:

冯圣中向来访者介绍了深圳超算中心各业务板块及发展现状。指出,对于超级计算机而言,人工智能是重要的发展方向。寒武纪科技是目前国内知名的人工智能芯片研发制造商,这与深圳超算的众多应用场景不谋而合。未来,深圳超算将升级E级超级计算机,希望与寒武纪科技深度合作,助力知识创新、技术创新和大数据人工智能产业发展。

智能芯片是前沿科技和社会关注的热点,也是人工智能技术发展过程中不可逾越的关键环节。可以说,不论有怎样领先的算法,要想最终应用,都必须通过芯片实现。

【嵌牛导读】:由中国科学院科学传播局主办的我国新一代人工智能芯片发布会今日召开,“寒武纪”新一代智能处理器芯片产品首次公开亮相。

陈天石介绍了寒武纪的发展现状和未来规划。他指出,以大数据为基础的人工智能产业逐渐成熟。在这个全新的人工智能时代,寒武纪作为深度学习处理器的开创者,推出了多款人工智能处理器,可广泛应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。在这些领域和深圳超算有广泛的合作空间。

5月3日,全球新一代人工智能芯片发布会在上海召开,中科院旗下的寒武纪科技公司发布了我国自主研发的Cambricon
MLU100云端智能芯片和板卡产品、寒武纪1M终端智能处理器IP产品。这款国内首个云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平。

【嵌牛鼻子】:人工智能芯片  “寒武纪”

双方还针对人工智能创新领域进行了深入探讨。双方表示,将发挥各自技术优势,共同开展人工智能芯片在各种业务场景应用研究,共同推动科技创新和产业升级。为我国人工智能产业发展注入新动能。

智能芯片实现新突破

【嵌牛提问】:我国的人工智能芯片新的突破?

图片 3

作为此次发布会焦点,首次正式亮相的Cambricon
MLU100云端智能芯片,是我国首款云端AI芯片。

【嵌牛正文】:由中国科学院科学传播局主办的我国新一代人工智能芯片发布会今日召开,“寒武纪”新一代智能处理器芯片产品首次公开亮相。

寒武纪科技的宗旨是打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。公司创始人、首席执行官陈天石教授,在处理器架构和人工智能领域深耕十余年,是国内外学术界享有盛誉的杰出青年科学家,曾获国家自然科学基金委员会“优青”、CCF-Intel青年学者奖、中国计算机学会优秀博士论文奖等荣誉。

据中科院计算所研究员、寒武纪公司创始人兼CEO陈天石介绍,云端智能芯片是面向人工智能领域大规模数据中心和服务器提供的核心芯片。云端的智能芯片规模更大,结构更加复杂,它和终端芯片的最大区别就在于其运算能力更强。

寒武纪公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习专用处理器——寒武纪1A处理器。它的横空出世打破了多项记录,并入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。中科曙光于近日发布的专用人工智能服务器“Phaneron”就搭载了寒武纪芯片。另外,寒武纪处理器也已在某知名国产手机新近发布的旗舰机型中进行了集成应用。

2016年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越CPU和GPU,与特斯拉增强型自动辅助驾驶、IBMWatson等国内外新兴信息技术的杰出代表同时入选第三届世界互联网大会(乌镇)评选的十五项“世界互联网领先科技成果”。

MLU100云端智能芯片采用寒武纪最新的MLUv01架构和TSMC
16nm的先进工艺,可工作在平衡模式和高性能模式下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。

此次发布的新一代智能处理器有三款,分别是:面向低功耗场景视觉应用的寒武纪1H8、拥有更广泛通用性和更高性能的寒武纪1H16,以及面向智能驾驶领域的寒武纪1M。

图片 4

“3年来,我们从研发两颗测试芯片,一直到现在云端智能芯片的最终亮相,我们时刻准备着‘由端入云’。”陈天石说,MLU100基于软硬件协同提升内存带宽利用率,不管是从性能比,还是功耗比来说,寒武纪都将树立智能芯片领域的新标杆。

中科院计算所研究员、寒武纪公司创始人兼CEO陈天石介绍,与寒武纪1A相比,新一代智能处理器在功耗、能效比、成本开销等方面进行了优化,性能功耗比再次实现飞跃,适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等各个重点应用领域。

国家超级计算深圳中心于2009年获国家科技部批准成立,是深圳建市以来投资规模最大的国家级重大科技创新基础设施,是深圳作为创新型城市的名片。中心坚持以技术为引领、以市场为导向、以品质为追求、以服务为根本,在科学计算、工程计算、生物医药、动漫渲染、海洋石油等领域支持国家科技创新,成果卓著。中心是世界上最早布局云计算、大数据、人工智能的超算中心之一,2009年建立之初,就迅速组建了深圳云计算中心,联合相关企事业单位,开展智慧城市等方面技术创新与服务。深圳公安云已经在为每一位市民保驾护航,深圳健康云正在努力削平医疗资源和服务的不均衡,深圳教育云将让中学生来揭示AI的奥秘。目前中心云计算、大数据和人工智能机构用户超过2万家,个人用户超过1200万人。返回搜狐,查看更多

与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持千万量级用户的大规模商用检验,搭载各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。

陈天石认为,未来人工智能方法将在视觉、语音、自然语言、数据分析、经济金融等各类应用方面大显身手,并带动未来超级计算机、数据中心、智能手机、嵌入式设备等进一步智能化。

责任编辑:

此外,这次最新发布的寒武纪1M处理器是公司的第三代IP产品,它延续了前两代产品卓越的完备性,单个处理器核即可支持多样化深度学习模型,并更进一步支持经典机器学习算法和本地训练,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供了灵活高效的计算平台,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域。

陈天石表示,寒武纪将力争在3年后占有中国高性能智能芯片市场30%的份额,并使全世界10亿台以上的智能终端设备集成有寒武纪终端智能处理器。“如果这两个目标实现,寒武纪将初步支撑起中国主导的国际智能产业生态。”

“由端入云”协同发展

“寒武纪公司是中科院计算所在处理器与人工智能交叉领域超前布局的结晶。”中科院计算所所长孙凝晖表示,人工智能经历60余载沉浮,如今迎来了收获的季节。在新形势、新机遇面前,应着重培育和壮大人工智能基础软硬件企业,为我国智能产业发展注入新动能。同时他指出,寒武纪公司在智能芯片领域占据全球领先地位,通过与产业上下游伙伴通力合作,有望引领中国人工智能产业“变道超车”。

寒武纪科技公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习专用处理器——寒武纪1A处理器。它的横空出世打破了多项纪录,并入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前,寒武纪处理器也已应用于某知名国产手机新近发布的旗舰机型,实现了集成应用。

中科院科学传播局局长周德进对寒武纪科技寄予厚望。他表示,今年7月国务院颁布的《新一代人工智能发展规划》中明确提出,要重点突破智能芯片与系统等一批关键技术,建立新一代人工智能关键共性技术体系。“寒武纪处理器是中国科学院在智能方向基础研究的关键突破。未来通过产学研用的结合,寒武纪公司具有持续引领世界人工智能发展新潮流的潜力。”

近年来,人工智能产业迅猛发展,推动了芯片市场规模的快速增长,也推动了人工智能计算从终端向云端的延伸。陈天石表示,寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。

陈天石指出,端侧智能处理可以最快速响应用户需求,以非常低小的功耗、成本和延迟,帮助用户理解图像、视频、语音和文本。同时,云侧的智能处理则可以把多个端的信息汇聚在一起。由于终端的数据量有限,只能根据单个用户的数据对机器学习模型进行微调。因此,端云协同的智能处理模式将在数据方面发挥巨大优势,利用海量数据,训练出强大的人工智能模型。

“过去大部分芯片厂商都主攻端,例如芯片巨头ARM公司,或是主攻云,例如英特尔公司。两者兼顾的却很少,因为端云的任务生态区别较大。但是智能时代这个局面会被全面打破。因为端和云的任务是一体的,编程和使用的生态也是一致的。作为一个通用机器学习芯片厂商,寒武纪就是要端云结合,共同推动智能芯片生态的发展。”陈天石说。

中科院上海分院副院长、中科院院士张旭表示,从过去在手机等终端上应用的智能芯片,到今天更高一层的云端人工智能芯片,它可以使人们在手机等终端的应用上升为未来在云端等领域更加广阔的应用,所以这是一个开拓性的突破。

当前,众多科技公司纷纷加大对人工智能芯片的研发,包括智能手机、无人驾驶、云计算等各领域巨头。根据相关机构预测,到2021年,人工智能芯片市场规模将超过110亿美元,而2016年这一数字仅为36亿美元。

“寒武纪创立的初衷就是要让全世界都能用上智能处理器。”陈天石告诉记者,寒武纪将秉承学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享寒武纪最新的技术成果,使全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。

共建人工智能生态链

发布会上,寒武纪部分产业伙伴公开展示了基于寒武纪芯片的应用方案。联想集团高级副总裁童夫尧在发布会上推出了基于寒武纪MLU100智能处理卡的ThinkSystem
SR650,打破了37项服务器基准测试的世界纪录。

“在新产品上,我们搭载了寒武纪的芯片,有助于各行各业在人工智能、VR、高性能计算等方面的研发和行业解决方案的落地。”童夫尧说。

不仅如此,芯片成果还将运用于智能语音领域。“一小时的语音数据在一个传统处理器上进行智能应用处理,需要一万小时才能完成,科大讯飞一直在跟踪人工智能专用芯片的前沿进展。”上海讯飞总裁程甦介绍,寒武纪的智能处理器在语音智能处理上交出了优异的答卷,能耗效率领先竞争对手的云端GPU方案达5倍以上。它的强大处理能力使得手机本地端可以处理更加复杂的机器学习算法,使得语音本地识别准确率相对于传统处理器领先了9.8%,显著提高了用户体验。

中科曙光高级副总裁任京旸在发布会上同步推出了基于Cambricon
MLU100智能处理卡的服务器产品系列“PHANERON”,它的性能更为强劲,可以支持2—10块寒武纪MLU处理卡,灵活应对不同的智能应用负载。以升级版的PHANERON-10为例,单台服务器可集成10片寒武纪人工智能处理单元,为人工智能训练应用提供832T半精度浮点运算能力,为推理应用提供1.66P整数运算能力,典型场景下的能效提升30倍以上。

“下一步,曙光与寒武纪之间的合作将不仅仅局限于整机领域,会从顶端科研一直延伸到低端应用,合力打造下游应用产业,共建人工智能生态链。”任京旸透露,中科曙光还将发布人工智能管理平台SothisAI,与寒武纪的芯片及开发环境实现无缝对接和深度融合。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章