01 清华量子信息中心发现具有指数加速可能的量子机器学习算法
寻找具有指数加速能力的算法是量子计算机的一个核心研究方向。迄今发现的具有指数加速可能的量子算法屈指可数,而每个具有指数加速能力的量子算法的发现,都是量子计算机研究的重要突破。
清华大学量子信息中心段路明团队发现了一种具有指数加速可能的量子机器学习算法。他们首次提出了一种基于优化多体量子纠缠态的量子生成模型,并证明了该量子生成模型在学习能力与预测能力方面都存在指数加速。在量子生成模型中,经典图中表示概率的参数由正实数扩大至复数域,这种新的量子图模型所需的参数个数相比于经典图模型(包括贝叶斯网络、马尔科夫随机场、玻尔兹曼机、深度信念网络等)有指数级的减少,这对于生成模型来说,在空间和时间的效率上都是巨大的优势。
基于这一模型,他们进而提出了启发式量子机器学习算法。该算法可以将生成模型的推断和训练问题转化成量子多体哈密顿量的基态制备问题,并由此证明量子算法的指数加速。
这一发现展示了量子计算机在人工智能研究领域中的巨大潜力,该成果也发表在了科学子刊 Science Advances(《科学 • 进展》)上,题目为 A quantum machine learning algorithm based on generative models 。
02 AI 在医疗方面取得革命性突破
人工智能在医疗方面也取得了突破性进展。吴恩达团队利用深度神经网络仅通过心率数据就可以诊断患者是否心律失常。据介绍,心电图数据全部由专家标注,分成 12 种不同情况,包括 10种心律失常,窦性心律以及噪音。
基于这些数据,研究人员训练了一个包含 33 个卷积层和线性输出层的神经网络。只需输入心电图数据,该系统就可以将其拆分成每个时长1.28秒的数据样本,判断每个1.28秒属于12种心率(及噪音)中的哪一种。实验表明其准确度高达 83.7%,超过了人类心脏病医生的 78.0%。目前,该研究成果已经发表在了最新的一期 Nature Medicine 上。
• https://www.nature.com/articles/s41591-018-0268-3
另一研究成果同样发表在最新的一期 Nature Medicine 上, 题目为《通过深度学习识别遗传疾病的面部表型》( Identifying facial phenotypes of genetic disorders using deep learning)。
该研究使用了 17000 多张患者的面部图像来训练神经网络,所有这些患者被确诊的遗传综合征总计超过200种。研究人员利用两个独立的测试数据集测试该深度学习算法DeepGestalt的表现,每一个数据集都包含数百张之前经过临床专家分析的患者面部图像。对于每一张测试图像,DeepGestalt被要求列出每张面部图像可能代表的综合征,并按不同综合征的概率依次排序。在两组测试中,在 90% 左右的情况下,DeepGestalt成功的在提出的前 10 个答案中都包括了正确的综合征。虽然这项研究采用的测试数据集规模相对较小,而且没有和其他已有的识别方法或人类专家进行直接比较,但是研究结果表明人工智能有望在临床实践中,辅助罕见遗传综合征的优先级划分与诊断。
•https://www.nature.com/articles/s41591-018-0279-0.epdf?sharedaccesstoken=62PW4OHG-NDsJk7uOtQZo9RgN0jAjWel9jnR3ZoTv0Os8H3zP0FWM-ifOxgr-DPy08bRFUpsGFc9h1bmip3gmtgoS-0vr5cLbAyWW7ei9mrVX73uG9ODN-yrWpdIFxLc_hyY5xd6TaqA5wVr8FsDwo5mSHnYezC7u-pL90IyE%3D
03 微软公开小冰系统设计
微软小冰团队发表论文公开了其聊天机器人“小冰”的开发过程,详述了设计原则、系统架构和关键组件,包括对话管理器、核心聊天、技能和移情计算模块,展示了小冰是如何在长时间的对话中动态地识别人类的情感和状态,理解用户的意图,并响应用户的需求。
研究团队在文中强调,作为一个独特的人工智能伴侣,小冰可以在情感与人们产生联系,满足人们对交流,感情和社会归属的需求。在小冰的系统设计中,智商与情商的结合是核心,同时又具有独一无二的个性。针对这样的设计原则,他们将人机社交聊天视为基于马尔可夫决策过程 (MDP) 的决策,并针对长期用户参与度和每次会话的对话轮数 (Conversation-turns Per Session, CPS) 进行优化。
自 2014 年发布以来,小冰已与超过 6.6 亿用户进行了聊天,并成功地与其中许多用户建立了长期关系。通过对大规模在线日志的分析,小冰的平均 CPS 已经达到 23轮,显著高于其他聊天机器人甚至人类之间的对话。
论文地址:https://static.aminer.cn/misc/pdf/weixin/XiaoIce.pdf
04 Transformer 再升级
Transformer 是谷歌在 2017 年提出的一个革新性的 NLP 框架。在机器翻译领域 ,Transformer 已经几乎全面取代递归神经网络 RNN。近日,来自卡内基梅隆大学和谷歌的研究人员提出了 Transformer 的升级版:Transformer-XL。
尽管 Transformer 具有学习长期依赖关系的潜力,但在语言模型中受到固定长度上下文的限制。针对这一限制,Transformer-XL可以使 Transformer 能够在不破坏时间一致性的情况下学习超过固定长度的依赖关系。具体地说,Transformer-X 包含一个 segment-level 的递归机制和一种新的位置编码方案。这样不仅可以捕获长期依赖关系,还可以解决上下文碎片问题。
实验表明,Transformer-XL 学习的依赖关系比 RNN 长约 80%,比 vanilla Transformer 长 450%,在短序列和长序列上都能获得更好的性能。并且在评估过程中比 vanilla Transformer 快 1800+ 倍。 此外,这一新架构在 5 个数据集上都获得了强大的结果。目前,研究人员已经公开了 Tensorflow 和 PyTorch 版本的代码、预训练模型和超参数。
代码地址:https://github.com/kimiyoung/transformer-xl
论文地址:https://static.aminer.cn/misc/pdf/weixin/TRANSFORMER-XL.pdf
05 欧盟将投入 200 亿欧元发展人工智能
2018 年 12 月,欧盟宣布计划在 2020 年底实现私人投资和公共投资至少 200亿欧元,用于发展人工智能。经过近六个月的会议讨论,欧盟成员国对以下内容达成一致。
• 通过合作伙伴关系最大化投资效益,投资目标包括:
所有成员国将制定自己的人工智能发展战略;
建立新的人工智能研究和创新合作伙伴关系;
为初创公司提供支持;
开发和连接欧洲人工智能卓越中心,在互联移动等领域建立世界参考测试设施,并通过数字化创新中心鼓励在整个经济中吸纳人工智能。
• 创建欧洲数据空间,致力于开发人工智能技术需要用到大型、安全且可靠的数据集。
• 培养人才、技能和终身学习精神,将通过专门的奖学金等方式支持人工智能领域高等教育,充分利用蓝卡(Blue Card)系统留住和吸引欧洲的高技能人工智能专业人士。
• 开发有道德且值得信赖的人工智能,专家小组目前正在制定开发和使用人工智能的道德准则,让欧洲注重道德的方法进入全球舞台。
欧盟委员会希望通过实施其人工智能(AI)战略,促进人工智能在欧洲的开发和使用。
06 IEEE 计算机协会公布 2019 年十大技术趋势
2018 年 12 月 18 日,IEEE计算机协会(IEEE-CS)技术专家公布了他们对技术发展趋势的年度预测,提出了他们认为 2019 年会被最广泛采用的技术发展趋势。
这些技术发展趋势有:
(1)深度学习加速器,如GPU、FPGA和最近的TPU;
(2)辅助驾驶,该技术高度依赖于深度学习加速器来进行视频识别;
(3)身联网(Internet of Bodies, IoB),物联网和自我监测技术正在更加靠近人体甚至进入人体内部;
(4)社会信用算法,通过生物识别技术和混合型社交数据流的结合,可以将观察转化为对个人的好坏及是否值得得到公众社会认可的判断;
(5)先进(智能)材料和设备,他们将在医疗保健、包装、家电等领域创造激动人心的应用;
(6)主动安全保护,如在新的攻击类型暴露时能被激活的钩子以及识别复杂攻击的机器学习机制等;
(7)虚拟现实(VR)和增强现实(AR),除了游戏方面,VR和AR技术在教育、工程和其他领域也可以发挥巨大的作用;
(8)聊天机器人,除了基本客户服务、虚拟助理,业界也在寻求将这一技术作为提供治疗支持的一种方式,例如扩展到与认知障碍儿童的互动;
(9)自动语音垃圾(robocall)预防,这一技术现在可以阻止被假冒的呼叫者 ID,并拦截可以来电;
(10)人性化技术(特别是机器学习),机器学习、机器人和无人机的大规模使用将有助于改善各行各业的工作流程和工作效率。