犹抱琵琶半遮面,千呼万唤始出来。ISSCC 2019的文章列表终于出来了!在ISSCC 2019上,大陆地区的录取文章继续高奏凯歌,继去年的5篇,今年一举达到9篇,其中多来自高校,包括复旦大学(3篇)、清华大学(2篇)、东南大学、上海交通大学等研究成果。矽说小编也延续传统赶紧捧着偷偷放出来的program企图一窥集成电路顶会的大趋势,为大家的科研添砖加瓦。首先带来的是人工智能处理器部分的内容。
在AI大热的2018年,ISSCC的人工智能芯片仅仅只有一个session,然而在2019年,除了machine learning的session 7, 还带了两个半session:session 14 Machine learning & Digital LDO, 和 session 24 SRAM & Computation-in-Memory,并且一只脚迈进从来只有Intel/AMD等的超大司才能占据 最大session 2 Processor (session 1是全场报告Plenary Talk)。
讲到 Plenary Talk, ISSCC 2019的第一演讲嘉宾是——Yann LeCun! 第二嘉宾也是AI芯片发到手软的Hoi-Jun Yoo。
毫不夸张的说,ISSCC 2019中最大的明星就是AI,没有之一。
从目前的已经发布的ISSCC 2019的文章列表,我们可以看出新一年的AI芯片的三大主旨——
存内计算的竞技场
自今年ISSCC上存内计算首次出现后,明年的ISSCC上的存内计算可谓大爆发。所谓存内计算,就是在冯诺依曼瓶颈出现的今天,将处理器和存储器融合在一起,有效地避免受制于通信带宽而导致的系统性能的下降。
今年的ISSCC后,小编还一度吐槽了一下存内计算(不以非冯为目的AI存储器都是耍流氓?)。然而历史的潮流总不会因为某些人的表演而停下。这不,ISSCC 2019首次出现了超过1Mb容量的RRAM存内计算(神马是RRAM,请点击RAM的前世,今生,与未来),并可以实现多比特的CNN。相比于去年的单比特SRAM为主的设计,可以说该设计才是真正为突破冯诺伊曼瓶颈带来了曙光。
另外,本次入围ISSCC的大陆文章中,有两篇皆为面向人工智能应用的存内计算设计,分别是来自清华大学的可变精度超高能效加速器:
以及来自东南大学与清华大学合作的“三明治”RAM,如果小编没有猜错BWN指的是Binary Weight Network, 即weight是2进制的架构:
值得指出的是,存内计算不仅出现在machine learning领域,在处理器的其他应用领域被应用了起来,比如图论(离散数学处理器?)等场合。
机器人带来的新机遇
除去存内计算,ISSCC 2019还给AI芯片指了一条新路。纵观几个AI芯片session,一个过去不曾出现但是今年开始不断被重复的词——Robot/Robotics。在Session 17开篇就是有日本Sony公司带来的invited talk
在具体的科研成果展示中,Intel带来了面向多机器人协同系统中,小型机器人的通用芯片:
而佐治亚理工带来了面向群体机器人(swarm robotics)高能效计算计算平台:
这里可以科普一下,群体机器人就是一群机器人。
密西根大学还带来了一个SLAM (simultaneous localization and mapping,即时定位和地图构建)处理器。SLAM作为视觉机器人/VR-AR的核心功能,典型使用方式是让机器人在某个空间内走一走,然后就能构建出空间,如下图所示。(电影版《盗墓笔记》中,裘德考就是用了几十个小型无人机,远程构建了蛇母陵的3D结构,理论上这就是SLAM)。
传统的SLAM是依靠ARM+IPU实现,但是随着与CNN结合,智能化的SLAM对于处理器的要求不断提高,GPU已经逐渐进入SLAM的硬件需求。此次出现的即是CNN和SLAM专用结合的模式:
先定一个小目标,10TOPS还是TOPS/W
值得指出的是,其实上述在存内计算或者是智能机器人芯片中的许多设计都满足了这个小目标。
最后,要不要在2月的旧金山约一波?