整理 | 邱陆陆
资讯
Facebook 意欲开发智能视频通话设备,而可能放弃智能音箱
Facebook 的 AR 和 VR 实验室 Building 8 正在研发公司的第一款硬件产品:面向家庭的视频通讯设备。这款产品代表了一个新的品类,并会帮助消费者更多元地使用 Facebook 的新闻推送、直播、视频通话等功能。
据悉,该款设备将拥有一个笔记本大小的触屏和一个广角摄像头。Facebook 同时也在研发一款 360 度摄像头,并且在测试相关功能:让摄像头自动扫描范围内的人并跟随他们的活动。例如,相机可以在刚放学的孩子通过摄像头向出差的父母展示自己的画作的时候自动对准并放大这幅画。不过这项功能离面世还有一段距离。
同时,Facebook 也在开发独立的智能音箱,与亚马逊的 Echo 和 Google Home 展开竞争。Facebook 也在招募苹果等公司的资深员工,帮助公司创建类似 siri 的语音助手,在视频通话设备和智能音箱上运行。
这两款设备最早的公布时间有可能是明年春天的 F8 开发者大会,不过也很难说:知情人士称,由于音箱的概念已经十分普及,发布新品需要以更低的价格来与竞争对手抗衡,Facebook 有可能抛弃音箱,优先考虑视频通话设备。
更像 Pinterest 的谷歌和更像谷歌的 Pinterest:图片搜索圈最近的功能更新情况
当地时间 8 月 1 日,Pinterest 在最新的一次更新里把搜索框放进了首页。联合创始人兼首席产品观 Evan Sharp 说:「人们认为我们是个社交网络,但这其实是一种误解。我们认为 Pinterest 更像是一个搜索引擎。」结合今年早些时候 Pinterest 公开的 Lens 功能(你可以用手机拍下任何一个物体的照片,然后 Pinterest 完成识别与搜索相关图片工作),我们可以看到 Pinterest 正在成为「图像搜索界的谷歌」,开拓更广阔的商业场景的尝试。
一天之后,谷歌图片搜索也发布了新功能:在搜索到的图片角落里添加了「小标签」,你可以通过点击一幅食物图片上的标签看到菜谱,也可以点击一件衣服下角的标签直接进行购买。谷歌希望通过这项新功能帮助用户与网站更好地链接:在图片之外,还有图片背后可以继续探索的内容。谷歌也向出版商、购物网站和视频网站提出建议,希望他们更清晰地标记自己的页面,以便谷歌在进行垂直搜索时提供更详细的信息。
这不是谷歌第一次对 Pinterest 的功能做出回应,最近,谷歌还在移动网页端和安卓应用中更新了「类似项目」功能,利用机器学习技术识别照片中的物体,比如太阳镜、手提包和鞋子,以便更方便地定位出售这些商品的商店及其定价。图片搜索领域最近的频繁动作中表明,图像识别领域已经从技术的探讨转移到应用场景和商业模式的探讨。
语音搜索和临时云盘:Mozilla 抢救火狐市场占有率花样百出
火狐浏览器(尤其是桌面端)市场份额的持续下降是困扰着 Mozilla 的一个大问题。为此,团队花了大量的精力重构浏览器的核心功能。8 月 1 日,火狐公布了三个新的测试功能:语音搜索、大文件发送工具和内置笔记。
语音搜索 Voice Fill 现在已经可以在谷歌、雅虎和 DuckDuckGo 上使用,会根据用户的使用逐渐进行个性化设置。笔记功能 Notes 则会以侧边栏的形式出现。上述两项功能都以浏览器插件的形式发布。大文件发送工具是一项基于网页的服务,它允许任何用户——无论你使用什么浏览器——上传 1GB 以内的文件。火狐会对文件进行加密并生成可下载链接,文件将在一次下载或 24 小时之后自动删除。这个类似临时云盘的功能并不是一个新颖的概念,但 Mozilla 内置的加密技术和开源的特性让这一功能仍然具有一定竞争力。
应用
让电脑学会聆听音乐中的情绪
如果你曾经制作过混音带或者 Spotify 播放列表,你就会知道成功的秘诀是找到歌曲中隐含的情感特质。这就是为什么 Gracenote 的音乐数据专家长期以来致力于训练机器来判断一首歌曲是「梦幻的」、「激烈的」还是「单纯的悲伤」。
Gracenote 在十年前就开始了「音乐情绪分类」工作,随着越来越多传统机器学习算法转换为前沿的神经网络,音乐产业对于人工智能的需求也越来越明显。
为了对音乐情绪进行分类,音乐家们挑选出 4 万首歌曲作为范例训练集。Gracenote 的内容架构负责人 Peter DiMaria 解释道:「我们首先要确保我们提供的例子是人们经常听的曲子,然后我们要找出对于某一种情绪来说最典型的例子,有些曲子在情绪表达上过于模棱两可。」专业人士给这些曲目打上数百个标签,而后 Gracenote 的系统浏览数百万首歌曲,将每条音轨分成 700 毫秒的片段,并提取 170 余个不同的与声音相关的变量,比如音色(timbre),并进行进一步的分析。系统寻找歌曲间相似的特征,与有标签的歌曲进行比较,进而通过建立「情绪档案」的方式对每首歌曲进行分类。有一些并不是音乐本身的特质也会被电脑用于分析,公司负责研究的副总裁 Markus Cremer 开玩笑说「比如电脑会觉得,这首歌是 96 kbps 的,所以我很难过。」
较小的媒体服务通常授权 Gracenote 做组织和推荐音乐的端到端解决方案。例如为用户提供「情绪电台」,用户可以选择「柔和的苦乐参半」的情绪,然后 Mazzy Star 的声音响起。苹果和 Spotify 这样的大公司也使用 Gracenote 的数据,他们通常不会透露使用数据的方法,但通常,它们都会开发自己的音乐推荐算法,并利用 Gracenote 的情绪数据来进行训练和改进。
谁是收入被高估最多的足球运动员
Michael Lewis 的畅销书 Moneyball 讲述了 Oakland Athletics 棒球队的总经理 Billy Beane 如何用数据驱动的方法在资金有限的情况下打造出了一支有竞争力的棒球队的故事。劳伦斯科技大学的学者则开发了一个模型,对欧洲超过 6000 名足球运动员做出分析,找出根据其技能,收入被过分高估和低估的球员们。
在体育界,对某一特定技巧的衡量和比较非常常见,然而正如论文合著者之一的 Lior Shamir 所言,「足球是一种需要对多种技巧进行综合的运动,所以仅仅比较进球数并不能很好地体现球员的真实价值。」因此,研究人员开发了一种包含 55 个变量的模型来衡量球员的能力,根据他们在球场上的表现来对其收入做出预测并于其他球员比较。这 55 个变量包括进球数、传球精度等传统数据,攻击性等行为特征,速度、加速度、控球等能力数据。这些变量都由国际足联的专家进行选定,其中有一些变量含有主观判断在其中。
研究表明,大多数情况下,技能和薪酬紧密相连,但还是有很多明星的价值被过分高估,而很多能力不错的球员遭到埋没。巴塞罗那的梅西成为了 16-17 赛季的薪酬过高排行榜榜首,曼城的席尔瓦则领衔薪酬过低榜单。
Shamir 还表示,对于不看球的普通人来说,这项研究也具有一定的意义:「我们现在还很难接受由机器来决定我们的薪酬的想法,但事实上,这一天将会很快到来。」
AI 领衔的动作捕捉:改写视频游戏和大制作电影的行业规则
明星是爆款视频游戏和大制作电影必不可少的要素,然而与明星合作意味着排到好几年后的档期、大量的动作捕捉摄像机和漫长的后期制作流程——换言之,大量的支票。 UBC 的计算机科学教授 Michiel van de Panne 却告诉我们:不用这么复杂,与其在演员脸上贴无数小圆点、给他们穿上全都是电线的衣服并布置几千米的绿幕不如设计一个强大的算法。
van de Panne 设计了一种让计算机角色自行学会走路、跑步等复杂动作的算法。「我们用算法模拟人类,从环境中学习技能。我们指导计算机角色如何在不编写策略(rule)的情况下对环境做出反应,例如保持平衡、通过移动障碍来规划路径等。」研究者通过强化学习(reinforcement learning),让计算机角色进行了无数次尝试和试错,并且给其中成功的动作以奖励。久而久之,系统学习到如何在特定情况下进行更好地操作。
模拟的角色已经学会了如何通过一条狭窄的道路而不摔倒,学会了规避静止的或者移动的障碍物和人。也可以完成复杂的运动技巧:例如把足球踢向球门。「强化学习就像你自己学习一项新运动一样。开始之前不知道注意事项,唯有通过不断的尝试才能获得经验。」
有了这个算法,视频游戏和电影所需要的只是把演员的脸贴在计算机角色上,然后把计算机角色放进场景里了。
观点
想要扩展机器学习的应用场景?先规范你的数据
在昨天的 TechToronto 活动上,生物科技公司 BioSymetrics 的 CEO Shiva Amiri 谈论了公司在应用机器学习处理海量数据时的一些经验。
Amiri 开篇就提到公司在处理健康领域的数据时所面临的挑战:数据多样性。每一个想要以机器学习技术立足的企业都不得不在开发模型前先处理不同来源、不同类型的数据。
另一个重要的问题是缺乏标准。「很多不同类型的数据都以不同的格式出现,这些数据弹性极差。很多不同的机构都拥有大量的数据,然而他们不知道如何在此基础上扩展自己的分析能力,如何能在这一团乱麻之上应用机器学习。」
Amiri 以一项针对全美各地的 1000 名自闭症儿童和对比组患者的研究为例,进一步说明了上述问题:「我们在第一批数据上应用了机器学习模型,然后我们想,wow,我们找到了一种新的自闭症诊断模型。然后,当我们用其他数据集验证我们的模型时,几乎处处都有冲突报告。所以模型没有用,我们必须退回去思考一下我们做错了什么。」
她总结道,尽管数据对构建机器学习技术至关重要,但如果缺乏统一的标准以及未经过专业人士的仔细规范化,再大量的数据也没有价值。
图说
IoT 时代消失的 10 样东西
物联网改变着日常生活的方方面面,这些改变虽小,但经过日积月累,一样会将我们置于巨大转变之中。我们的工作方式、娱乐方式和处理日常事务的方式都会在 IoT 时代变得不同。一些曾经不可或缺的东西会像白垩纪的恐龙一样,变成只有展览作用的化石。
1 物理支付方式
随着信用卡的普及,当下只有 24% 的美国人用现金完成大部分购买行为,然而在物联网时代,这些塑料卡片也会逐渐消失。Apple Pay、Google Wallet(当然还有支付宝和微信支付)这样的移动支付方式正在迅速扩张,并极有可能在未来几年内成为主流支付方式。
2 遥控器
现在一个普通家庭至少有 3 到 4 种遥控器,从电视到空调,从音响到空气净化器。物联网时代我们的家可以通过一个移动设备作为单一枢纽进行控制,智能音箱也在拓展着这种可能性。
3 实体娱乐产品
你上一次买光盘或者 DVD 是什么时候?流媒体服务以其选择的多样性和推荐的个性化吸引着越来越多的用户,订阅了 Netflix 或者 Hulu 后,谁还去购买实体化的娱乐产品呢?
4 键盘
如今键盘是电脑和其他电子设备上必不可少的部分,但是随着语音技术的改善,打字可能变成一项不必要的技能。
5 钥匙
和遥控器一样,钥匙是一种必需品,而且是一种非常容易丢的必需品。电脑控制的家庭、企业以及汽车安全系统正变得越来越流行,RFID 卡已经不是什么新鲜事物了,但是生物特征识别扫描仪、人脸识别技术、远程锁定和解锁功能都是全新的、让人兴奋的,旨在淘汰我们的钥匙的产品。
6 外部存储设备
廉价、便捷的云存储的兴起几乎消灭了外部存储设备的市场,当你可以通过云随时随地访问你的所有文件,为什么要冒着丢失和数据失窃的风险使用实体存储设备呢?
7 服务员
「请问您是否需要搭配薯条?」询问你的将不再是柜台后打暑期工的少年,而是带触屏的机器人。在一些餐厅里,你已经可以通过触屏设备点餐、付款。现在我们仍然需要人类完成烹饪工作,但未来不排除这些工作也由机器完成的可能性。
8 私家车
自动驾驶汽车即将出现。而一些专家预测,最终他们将取代公共交通和私家车,成为所有人的主要交通工具。现有的汽车共享应用(比如 Uber 和滴滴)将不再需要司机的参与。
9 犁
传感器正在改变农业。我们不再需要用犁来改变作物的土壤环境了,自动灌溉、施肥、除虫的设备允许农民和庄园主更好地照料自己的作物从而提高产量。
10 纸质文件
最后,所有上述发展都将导致用纸的减少,从云存储和电子传真到文档管理系统和在线报销系统,很快,我们将没有需要用纸的场景。