如被称为国内“AI四小龙”之一的依图科技就凭借在计算机视觉、语音识别、语义理解和智能决策等多方面的技术积累,将人工智能技术注入到了智能安防、科技金融、智能医疗、智慧城市、新零售和智能制药等多个领域,推出了全球领先的创新技术和产品。人工智能应用也在依图等厂商的的推动下迅速发展,这也带动了后面相关芯片需求的发展。
根据Gartner的预测数据,全球人工智能芯片市场规模将在未来五年内呈现飙升,从2018年的42.7亿美元成长至343亿美元,增长超过7倍。相关的芯片也从早期的CPU、GPU、FPGA发展到现在针对特殊应用开发的客制化AI芯片。尤其是后者,更是成为最近这些年产业不可逆转的潮流。
从GPU、FPGA到专用AI芯片的演变
在人工智能的发展早期,市场上都是选用CPU、GPU和FPGA等芯片作为人工智能应用的“动力”来源,但随着终端市场的发展,这些芯片的瓶颈开始凸显:
如CPU虽然能够为人工智能提供适合的算力、价格、功耗和时间,但因为AI的许多数据处理涉及矩阵乘法和加法,这并不是CPU所擅长的;GPU方面,虽然他们也是为了应对图像处理中的大规模并行计算处理而生的,但因为其硬件结构方面的局限性,使得即使他们在人工智能训练端如此重要,也还是有不少厂商尝试寻找新的替代空间;FPGA也因为基本单元的计算能力有限,速度和功耗方面也略显不足,再加上价格昂贵,在市场上也颇受争议。于是拥有成本、性能和功耗等优势的专门定制AI芯片就开始成为了市场追逐的目标。
这不但推动了一大波初创公司的诞生,很多做软件和算法的公司也都先后投身其中。
在前者方面,国内的寒武纪、地平线和比特大陆都是先锋。以寒武纪为例,他们在2016年推出了世界首款终端人工智能专用处理器“寒武纪 1A”处理器,并已应用于数千万智能手机中。2018年,寒武纪推出了MLU100机器学习处理器芯片。按照他们的说法,这个昔年的运行主流智能算法时性能功耗比全面超越CPU和GPU。他们新一代的芯片最近也将浮出水面。
后者方面,谷歌和亚马逊是当中的先行者。据谷歌介绍,他们设计的、专门用于神经网络工作负载的矩阵处理器TPU可以极快地为神经网络处理大量的乘法和加法运算,并且耗电量显著降低,占用的物理空间更小。更重要的一点是通过其脉动阵列架构设计大幅度缓解了冯·诺依曼瓶颈;亚马逊AWS部门也通过其定制设计的机器学习推理芯片Inferentia为客户提供数百 TOPS(每秒万亿次运算)推理吞吐量,以允许复杂模型能够进行快速预测。能以极低成本交付高吞吐量、低延迟推理性能。
对于前者来说,因为AI市场潜力巨大,他们做芯片去分一杯羹无可厚非。但对于后者来说,这当中的意义更是巨大。一方面是因为他们拥有了庞大的客户,加入了自研芯片无疑可以降低他们的成本。另一方面,自研的AI芯片在性能和功耗上也有很大的提升空间,厂商甚至可以做一些差异化的设计,提高其竞争力,这也是那么多系统厂商进入这个市场的原因。
依图科技则是这个市场的另一大玩家。
人工智能“老兵”的新疆界
和现在的一大波人工智能的新玩家相比,成立于2012年的依图科技是不折不扣的老兵。在创始人朱珑博士和林晨曦的领导,以及公司员工的脑力下,依图科技在人脸识别、语音识别等多个领域积累了深厚的技术,公司也在多个市场攻城拔寨。这也帮助公司在一轮轮融资中,把市值推高,也让公司创始人有底气说出了”我们很贵,别人买不起“这样的豪言。
而这个主打机器视觉,以“拓展人工智能新疆界”为Slogan的企业不满足于此,他们正在横向和纵向拓展他们的疆界,而芯片就是他们的目标。按照依图的想法,把握住高集成度, 坐上数据、算法、算力这三驾马车,顺利走好AI芯片这条道路,这就是他们的目标。
基于此,依图发布了云端深度学习推理定制化SoC芯片questcore™。
据介绍,依图科技的这款专为计算机视觉领域分析任务推出的芯片是基于自研的芯片架构打造的,它能高效适配各类深度学习算法(包括TensorFlow、PyTorch 等主流深度学习框架),在保持极低功耗的同时能大幅提升计算力,模型兼容性好,可扩展性高,无缝接入现有生态。
另外,questcore™自带的网络支持模块以及对虚拟化和容器化的支持,能将AI云的弹性计算和调度提升一个量级,这可以带来能耗比的大幅提升。能够充分发挥依图世界级算法优势。依图方面强调,在同等功耗下,他们的questcore™芯片能提供市面现有同类主流产品 2~5 倍的视觉分析性能。
为了实现其“极智”目标,依图方面强调,他们从现在开始会在AI芯片和智能硬件垂直发力。
按照依图的了解,在“算法定义芯片”的时代,算法即芯片,以 AI 为中心来思考架构能为芯片设计带来无限的想象空间,而算法则成为在这广袤空间中探寻搜索的指南针,拥有该领域知识的顶级算法厂商在智慧芯片和智能计算革命中开始发挥举足轻重的作用。
又因为依图 questcore™作为服务器芯片可以独立使用,有助于完善中国IC产业生态。这对于国内的人工智能产业乃至整个集成电路产业来说,也是一大幸事。
依图此次也同时发布了基于questcore™打造的原子服务器,一台服务器提供的算力与 8 张英伟达P4卡服务器相当,而体积仅为后者的一半,功耗不到20%。这意味着,这样一台单手可持的小小服务器,就能驱动一条主干道、一整个小型园区所需的智能算力。
依图方面进一步指出,questcore™与依图世界级算法结合,构成软硬件一体化的多元产品和丰富解决方案,将依图研发团队的先进算法和工程团队在智能安防、智能医疗、智慧零售和 AI CITY 等多个人工智能行业应用场景的实践经验相结合,能为客户实现更大价值。
未来无限美好,但仍需谨慎
集成电路是 20 世纪最伟大的发明,而人工智能则是 21 世纪人类的希望。从依图看来,在没有先例可循的智能时代,中国人工智能创业公司与世界巨头站在同一起跑线上,完全有机会成为新时代全球领先的全栈智能解决方案提供商。依图将立足“算法+芯片+数据智能”的极智战略,深入行业,降低人工智能应用落地和推广成本,赋能行业,长期持续地为社会做出积极贡献,与合作伙伴一起,共同推动中国智能产业发展,构建融合创新的智慧生态。
但我们也应该冷静看到,在全民欢呼背后,还有一些问题值得我们关注。就拿AI芯片领域来说,杜克大学教授陈怡然在之前曾提到,AI芯片在设计方面这几大挑战:
杜克大学教授陈怡然就曾提到,AI芯片在设计方面有几大挑战:
第一是大容量存储和高密度计算,当神经深度学习网络的复杂度越来越高的时候,参数也会越来越多,怎么处理是一大难题;
第二个挑战是要面临特定领域的架构设计,因为场景越来越丰富,这些场景的计算需求是完全不一样的。怎么样通过对于不同的场景的理解,设置不同的硬件架构变得非常重要;
第三个挑战是芯片设计要求高,周期长,成本昂贵。从芯片规格设计、芯片结构设计、RTL设计、物理版图设计、到晶圆制造、测试封装,需要2到3年时间,这段时间里软件会快速发展,算法也在快速更新,芯片如何支持这些更新也是难点;
第四个挑战是架构及工艺。随着工艺不断的提升,从90纳米到10纳米,逻辑门生产的成本到最后变得饱和。也许在速度、功耗上会有提升,但单个逻辑生产的成本不会再有新的下降。这种情况下如果仍然用几千甚至上万个晶体管去做一个比较简单的深度学习的逻辑,最后在成本上是得不偿失的;
虽然依图在软件和算法领域独步天下,他们这些软硬结合的想法也能让人遐想连篇,但对于在芯片这个全新领域,依图还是新兵,未来即使商机无限,但也困难重重。
但正如依图科技创始人朱珑所说:“科技进步极大降低了创新所需的经济门槛,但是伟大所需的精神门槛——勇气,从来没有降低过”。换句话说,为理想,没有什么不可以。