2018/12/09 15:38

百度王海峰获得首个吴文俊人工智能杰出贡献奖：坚持走正确的路

12月9日上午，被誉为“中国智能科学技术最高奖”的吴文俊人工智能科学技术奖在苏州举行颁奖典礼。本届吴文俊人工智能奖共对70项人工智能成果授奖，百度高级副总裁、AI技术平台体系（AIG）总负责人王海峰荣获首个吴文俊人工智能“杰出贡献奖”。

确认照片/WechatIMG12579.jpeg

王海峰既是出色的学者，也是工业界的技术领袖。他长期致力于人工智能技术创新及产业发展，在机器翻译、自然语言处理、知识图谱和智能搜索等人工智能技术领域取得大量领先和开创性成果。

王海峰在致辞中表示，收获这些成果是因为“坚持走在正确的道路上”。王海峰自小就对科技有浓厚兴趣，大学期间，他的爱好成为专业，他开始机器翻译的研究；工作后，王海峰学以致用，专业成为事业，他专注于机器翻译、自然语言处理、语音等技术的研究和实际应用，一直“扎根”人工智能领域。

照片/WechatIMG9512.jpeg

王海峰自1993年开始从事机器翻译相关研究，二十多年的科研生涯中，“有过停滞不前的沮丧，曲高和寡的无奈，更多的是研究成果为大众所用的喜悦，以及随之而来的认可。”王海峰表示。硕士期间，王海峰的研究成果就获得了国家863评测第一名及部级科技进步奖。在博士论文中，他已经开创性地探索了神经网络机器翻译的可能性。从初期的基于规则的方法，到1997年左右对神经网络模型的探索，以及后来研究统计机器翻译、枢轴语言翻译等方法，王海峰凭借前瞻的洞察力和持之以恒的耐心，屡破难关，推动了机器翻译技术逐渐成熟，走向实用，服务大众。2015年，他带领团队发布了世界上首个互联网神经网络机器翻译系统，领先国内外其它科技巨头公司1年多时间。目前，百度翻译支持28种语言，756个翻译方向，每天翻译字符数超过千亿，接入超15万家第三方应用，免费服务全球数亿用户。

在专注自然语言处理的同时，王海峰逐步将研究领域拓展至知识图谱、智能搜索等。在知识获取方面，他主持研发了全球最大规模中文知识图谱，在知识图谱规模、图谱数据容量及检索性能等指标上均达到国际领先水平。在智能搜索方面，他主持研发了具有自主知识产权的全球最大中文智能搜索引擎，在融合知识图谱和深度语义分析的需求理解、基于深度学习的层叠式搜索排序、语音语义一体化交互技术等方面取得重大突破，实现对用户搜索意图的深刻理解、搜索结果的精准呈现，以及与用户间基于自然语言的便捷交互。

在人工智能领域辛勤耕耘多年，王海峰受到国内外同行的高度认可。他是自然语言处理领域世界上最具影响力的国际学术组织ACL（Association for Computational Linguistics）50多年历史上唯一出任过主席（President）的华人，唯一来自中国大陆的ACL会士（Fellow），ACL亚太分会AACL创始主席。2017年，他荣获首届全国创新争先奖，是唯一来自互联网行业的获奖人。

百度大脑是百度人工智能的集大成。基于多年的技术积累和全面的技术布局，王海峰带领百度大脑发展进入“多模态深度语义理解”阶段。百度大脑突破了听觉、视觉和语言一体化的语义理解技术难题，实现了覆盖基础设施、核心技术和应用解决方案的全体系人工智能开放平台，对内支撑百度业务智能化升级，对外服务各行各业变革和创新。

“AI的发展最终是要服务于人的。”王海峰认为，在继续加强人工智能基础技术研究的同时，我们要让顶尖技术走出实验室，真正落地成产品、解决方案，赋能社会经济各领域，让人工智能充分发挥驱动力量，促进科技革命和产业变革。

在当天下午召开的2018中国人工智能产业年会上，王海峰阐述了作为新一轮科技革命的驱动力量，人工智能助力行业变革面临的机遇与挑战。

“中国正处在科技变革的重要时期，人工智能作为新一轮科技革命和产业变革的重要驱动力量受到前所未有的重视。”王海峰表示，他希望跟所有同行一起，齐心协力发展人工智能技术，推动产业变革，创造美好的新时代。

产业百度王海峰百度大脑吴文俊

相关数据

深度学习技术

深度学习（deep learning）是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习是机器学习中一种基于对数据进行表征学习的算法，至今已有数种深度学习框架，如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

来源：LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

语义分析技术

语义分析是编译过程的一个逻辑阶段，语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查，进行类型审查。语义分析是审查源程序有无语义错误，为代码生成阶段收集类型信息。比如语义分析的一个工作是进行类型审查，审查每个算符是否具有语言规范允许的运算对象，当不符合语言规范时，编译程序应报告错误。如有的编译程序要对实数用作数组下标的情况报告错误。又比如某些程序规定运算对象可被强制，那么当二目运算施于一整型和一实型对象时，编译程序应将整型转换为实型而不能认为是源程序的错误。

来源：百度百科

知识图谱技术

知识图谱本质上是语义网络，是一种基于图的数据结构，由节点(Point)和边(Edge)组成。在知识图谱里，每个节点表示现实世界中存在的“实体”，每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲，知识图谱就是把所有不同种类的信息（Heterogeneous Information）连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱这个概念最早由Google提出，主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎，知识图谱可用来更好地查询复杂的关联信息，从语义层面理解用户意图，改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候，搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月，家庭情况等等。

来源：机器之心

机器翻译技术

机器翻译（MT）是利用机器的力量「自动将一种自然语言（源语言）的文本翻译成另一种语言（目标语言）」。机器翻译方法通常可分成三大类：基于规则的机器翻译（RBMT）、统计机器翻译（SMT）和神经机器翻译（NMT）。

来源：机器之心

神经网络技术

（人工）神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型，那时候研究者构想了「感知器（perceptron）」的想法。这一领域的研究者通常被称为「联结主义者（Connectionist）」，因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型，它们都是前馈神经网络：卷积神经网络（CNN）和循环神经网络（RNN），其中 RNN 又包含长短期记忆（LSTM）、门控循环单元（GRU）等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习，但也有一些为无监督学习设计的变体，比如自动编码器和生成对抗网络（GAN）。

来源：机器之心

统计机器翻译技术

随着统计学的发展，研究者开始将统计模型应用于机器翻译，这种方法是基于对双语文本语料库的分析来生成翻译结果。这种方法被称为统计机器翻译（SMT）

来源：机器之心

强人工智能技术

强人工智能或通用人工智能（Strong AI或者 Artificial General Intelligence）是具备与人类同等智慧、或超越人类的人工智能，能表现正常人类所具有的所有智能行为。强人工智能是人工智能研究的主要目标之一，同时也是科幻小说和未来学家所讨论的主要议题。相对的，弱人工智能（applied AI，narrow AI，weak AI）只处理特定的问题。弱人工智能不需要具有人类完整的认知能力，甚至是完全不具有人类所拥有的感官认知能力，只要设计得看起来像有智慧就可以了。由于过去的智能程式多是弱人工智能，发现这个具有领域的局限性，人们一度觉得强人工智能是不可能的。而强人工智能也指通用人工智能（artificial general intelligence，AGI），或具备执行一般智慧行为的能力。强人工智能通常把人工智能和意识、感性、知识和自觉等人类的特征互相连结。

来源：维基百科

自然语言处理技术

自然语言处理（英语：natural language processing，缩写作 NLP）是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言；自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

来源：维基百科