本次乌镇人机大战期间,谷歌云机器学习负责人李佳在会场首次接受国内媒体采访。从去年11月加入谷歌以来,李佳在谷歌云的工作主要围绕人工智能四大支柱:数据、计算能力、算法和人才展开。
谷歌云积极拓展企业客户
云计算已成为包括AWS和微软在内等大公司的重要营收渠道,根据亚马逊2017年第一季财报,AWS云服务为亚马逊总收入贡献了10%,而为净利润贡献了80%以上。目前谷歌云也在积极拓宽企业客户市场。
从Mobil first 转向AI First后,谷歌的所有产品中都有机器学习的影子,据李佳介绍,“在消费级产品上,我们有10亿级的用户都能体验到机器学习产品”。谷歌云也会将消费级产品上实现的成功经验和新研发带给企业级别的用户,比如一些游戏公司、旅游公司拓展海外业务时,可以使用谷歌最新的神经机器翻译系统。在自然语言处理上,英国的在线超商Ocado,在谷歌云上使用自然语言处理的 API收集客户的反馈意见,并根据紧急、需要什么样的反馈,来进行分类,实现了更加自动化的客户支持系。
谷歌云也不乏一些大客户。AirBus在使用谷歌云上的API识别复杂的卫星云图,HSBC则使用谷歌云进行反洗钱和风险预估,此外还包括高露洁、汇丰控股和eBay。李佳曾任研究高管的Snapchat也在今年2月成为谷歌云最大的客户,每年支付4亿美元。
李佳提到,很多公司刚找到她们时的想法相当直接,希望机器学习能给他们的公司带来颠覆性的改变,但是谷歌会根据每家公司各自的人工智能背景,来提供适合他们的服务。对于对AI有所准备的公司直接提供一个端到端的API。那些对机器学习还很陌生的公司可以参与谷歌云今年开发的新项目,“先进技术实验室”。这个项目是由原本谷歌内部的AI人才培训项目对外开放而来,它向其他有意培养机器学习人才的公司提供培训机会,让他们的员工进入谷歌,与工程师和技术专家一起做研发。
Visual Genome:升级版的ImageNet
2016年初,李佳等人提出了Visual Genome ,一个相比与ImageNet更加丰富的图像数据集。该数据集是首个提供结构化图片描述的数据集。
李佳告诉机器之心记者,建立Visual Genome数据集也是考虑到数据对人工智能发展的重要性。大家都很了解ImageNet,ImageNet实现了很多算法的训练和发展。但是ImageNet只是对图片进行描述,对图片中的物体进行分类和检测。而Visual Genome相当于ImageNet的升级版,“我们想在视觉理解的方面有更一步的发展,包括物体之间的关系,和对物体更进一步的描述,它会考虑更复杂的场景和更复杂的图像,帮助研究者来思考更深层面的问题,包括怎样对图片和图片中的局部进行深入描述。”同时这个数据集也是开放的。
与李飞飞合作十几年,亦师亦友
提到博导李飞飞,让人意外的是,李飞飞是得知李佳进入谷歌之后才最终选择谷歌。李佳坦言从师生到同事,跟着李飞飞十几年的学习和合作,之间建立了深厚的信任,这在工作中非常重要,“一个人处理一件事,另外一个人可以完全放心”。目前两人在谷歌云的工作相互促进,并没有明确的区分。
离开Snapchat后,李佳选择谷歌云的一个很大原因是她看到很多优秀的AI人才聚集在几家高科技公司或者独角兽公司中,其他传统公司却没有这个机会。谷歌云能够把机器学习和人工智能带给更多的公司,“能看到自己的技术成果能影响到各行各业,让我感觉非常exciting。”