中国首款嵌入式神经网络处理器芯片是“星光智能一号”

2016年6月20日下午,中星微“数字多媒体芯片技术”国家重点实验室在北京宣布,经过五年多努力,中国首款嵌入式神经网络处理器(NPU)诞生,全球首次成功应用于嵌入式视频监控芯片已于2016年3月6日开始进行量产。

“数字多媒体芯片技术”国家重点实验室执行主任张韵东表示,该成果的发布标志着我国在神经网络处理器领域的研究和开发上取得了重大突破;在基于“数据驱动并行计算”架构的深度学习人工智能领域达到国际先进水平;使我国视频监控行业发展由模拟时代、数字时代跨入智能时代,实现产业化并促进整体水平提升,在全球确立领先地位。

深度学习和NPU

近年来,人工智能逐渐从科幻电影走向现实生活,在其发展历程中,两次著名的“人机大战”成为重要里程碑。1997年,IBM的超级计算机“深蓝”击败国际象棋世界冠军;2016年3月,谷歌的“AlphGo”以4胜1负的成绩战胜了围棋世界冠军

“围棋比国际象棋复杂200多个数量级。”数字多媒体芯片技术国家重点实验室执行主任张韵东认为“深蓝”是凭借超级计算机运算能力的“蛮力”战胜了人类,而“AlphGo”则主要依靠模仿人脑的深度学习神经网络击败人类。

这一结果让人震撼,甚至有人担忧,电影里“终结者”是否很快会进入我们的生活?

张韵东认为,“人机大战”只是科学实验,如此高级的人工智能离普通人的生活还有一定距离。他介绍,“深蓝”的质量达到1.27吨,拥有32个CPU;“AlphGo”运行在庞大服务器集群里,下一盘棋光电费就要花掉3000美元。即使是手机里的苹果、微软等语音识别软件,所有的运算、识别也必须在后台进行。

将深度学习系统做到小型化,用在嵌入式系统中,这是中星微国家重点实验室多年来努力解决的问题。其此次发布的,正是我国首款具有深度学习功能的嵌入式NPU,其已于2016年3月成功量产。

极大提升计算能力与功耗之比

此次推出的NPU,是中星微国家重点实验室为深度学习算法专门设计的处理器。

张韵东介绍,深度学习源于对生物人脑机理的仿生学研究,其实质是建立多层次感知层模型,从底层到高层进行识别和智能分析。与传统算法最大的不同,是它能像人脑一样学习知识。

卷积神经网络(CNN)是深度学习的重要分支,是目前机器视觉人工智能领域的研究热点。张韵东说,CNN算法需要处理海量数据和运算,传统的冯诺依曼架构CPU,在面对这种类型数据运算时已经力不从心。而其他传统处理器中,信号处理器DSP同样无法高效处理大量并行运算;图形处理器GPU是为三维图形设计,用于CNN算法功耗高、成本高,且不适合嵌入环境;可编程门阵列FPGA能灵活实现各种算法架构,但一般用于算法原型机的验证,同样存在功耗高、价格高问题。

IBM、高通、谷歌等国外公司都推出了自己的神经网络处理器,中科院在这方面也开展了研究。为此,中星微针对CNN算法和特点进行了专门设计,彻底颠覆了冯诺依曼架构,而采用全新的数据驱动并行运算架构,研发的数据流类型NPU极大提升了计算能力与功耗之比,擅长处理海量视频、图像类多媒体数据,能使人工智能在嵌入式机器视觉应用中大显身手。

给“眼睛”加上“大脑”

目前,中星微NPU其已成功集成到“星光智能一号”中,在视频监控领域实现产业化。

“如果说原来的视频处理芯片相当于眼睛,加上NPU以后就拥有了大脑。”张韵东说,“星光智能一号”包含视频信号处理、视频压缩编码模块以及神经网络处理器,是全球首颗具有如此集成度的深度学习系统级芯片

视频监控领域对智能识别有着强烈需求。张韵东介绍,此前的技术主要存在两方面局限,一是识别准确度不高;二是传统技术需要先把海量视频数据传到后台,再在后台进行识别,无法实时得到结果。而使用了深度学习的机器视觉,对人脸识别的准确率可达98%;在嵌入人工智能后,可以当场识别,只把有用的信息传回来。

在几年前轰动全国的周克华案件中,案犯在南京被拍到,公安干警将视频信息拷贝分发给数千人的团队,对着每个摄像头进行比对,但周克华仍逃到重庆,直到再次作案后才被抓获。“如果当时有‘星光智能一号’技术,罪犯走到哪里都会被智能识别,很快就会有线索传回来。”张韵东说。除了实时搜索,该技术还能将已经拍摄的信息存在码流中,需要时可以随时根据特征检索,或是用“以图搜图”的方式,用一张图把类似的图全找出来。

除了视频监控领域,“星光智能一号”还能用于汽车无人驾驶或智能辅助、无人机自动拍摄、跟踪、避障,智能机器人理解合成语言、娱乐和陪护等方面。

张韵东表示,下一步将不断探索更加接近生物人脑的工作机理方式,开发更低功耗、更高运算性能的新一代NPU。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注