撰文 | 高静宜
2018 年,又是一个球迷们释放躁动灵魂、迷妹们大饱眼福的世界杯足球年。
毫无意外,在这种球迷狂欢的日子里,我会再次体验到一种「众人皆醉我独醒」之感。这都是源于我过去与亲友一起看球的经历:
「哎?那边的橙色 7 号是谁?为什么球一到他脚下现场的欢呼声就特别响亮?」
「这个球队连跪很久了吗?为啥才净胜一球场上的球迷就抱头痛哭了起来?」
「啊,为啥刚才那个进球不算啊?谁犯规了?咋犯的?」
……
相信很多朋友和我一样,并非内心里对足球丝毫不感兴趣,而是因为看球的过程中总是一头雾水,即便得到了答案也错过了节奏和时机,让我们这些足球小白大大丧失了看球的乐趣。
我身边的球迷朋友也经常会嘲讽我说:跟你一起看球就像拿着一本《十万个为什么》,我得边看球边答题。有时候给你展开讲多了,回头一看都错过了进球!
这样一来,不想被足球抛弃的我似乎只能寄希望于一个量身定做的看球助理了,它既要具备为我答疑解惑的能力,还要能够传授给我去和一起评头论足的底气。
一个名为「AI 球」的语音交互看球助理,可能要在这季世界杯成为我的陪看机器人。
有问必答的 AI 看球助理
「AI 球」是魔方元科技研发的一款人工智能看球助理。下载安装之后,我和 App 里的语音聊天机器人「小美」进行了简单的交互。事实证明,「小美」的确能够识别并回答出我所提出的一些基本问题,相当于足球领域的 Siri。魔方元科技联合创始人、复旦大学人工智能客座教授邬学宁介绍,「AI 球」背后的三大核心技术分别为知识图谱、自然语言处理和深度学习。
与市面上的其他语音交互助手相比,「AI 球」基于足球行业知识图谱,而非开放域知识图谱。使用开放式的知识图谱意味着,系统难以回答垂直领域的问题,同时广义知识图谱的数据普遍存在质量问题。
而要建立足球行业的知识图谱,团队需要花费大量的时间精力去抓取散布在互联网各处的结构化及非结构化足球信息,然后经过清洗、排歧、表达等处理过程,完成信息的聚合。
只有这样,才能收录历年比赛历程,各球员、球队的数据信息等,达到事无巨细地,从而「喂饱」用户。
而对于一款语音交互助手来说,如何给予用户最佳的交互体验也是非常重要的一环。
「AI 球」基于深度学习的自然语言处理能力来理解用户对话的语境与语义,从而实现人机交互,不仅可以回答用户对足球的简单事实型问题,还能够在一定程度上进行逻辑推理,并以语音、视频、图文等形式向用户传达球员基本信息、赛事数据、社媒资讯等足球比赛相关内容。
与此同时,「AI 球」还会记录用户行为,从而构建独立完整的用户画像。在此基础上通过 AI 和大数据分析,推荐系统算法就能为用户推送个性化内容,帮助用户直接锁定自己心仪球队、球星、感兴趣的比赛资讯。此外,如果用户需要,系统还会根据要求在赛后盘点出每场比赛的高光时刻,从阵型统计、数据统计等多角度展开对维度复盘分析。
事实上,一提到自然语言理解,数据就是一个绕不开的话题。相比于泛领域,垂直行业的语料缺失自然成为团队研发过程中不得不面临的一大难题。
邬学宁用「数据饥饿」来形容垂直行业缺乏语料的问题。其实,团队最初也曾尝试使用康奈尔大学的通用语料来训练,但效果并不理想。
也正因如此,在使用「AI 球」时,我也常遇到「鸡同鸭讲」的情况,这应该是「AI 球」接下来的优化方向之一。
邬学宁透露,团队计划尝试利用强化学习的方法来加强自然语言理解的能力。
AI 能在赛事解说上更进一步吗?
就像从回复固定问题到互动交流解决问题,AI 逐渐改变了客服这一职业,看球助手的下一步同样会指向赛事解说。
2002 年,新华社驻耶路撒冷记者克韩转身进入足球解说行业。
俗话说,隔行如隔山。要想在直播过程中金句频出、妙语连珠,除了个人魅力和语言风格的加持,背后自然少不了系统、全面的知识储备。
可以说,熟知球队、球员的信息数据,掌握一场杯赛的最新战况,了解吸睛人物的历史故事、边角余料甚至花边新闻,这些都是专业解说员的基本功课。
「从入行起,我每天都要看十几份英报去收集、更新信息,平均每天要花 2 到 3 个小时的时间,而且这样坚持了十多年。」克韩回忆说道,
「直到有一天,我的一位程序员朋友给我做了一款 AI 小程序,能够帮我自动完成资料的收集整理。现在,我每天起床先打开电脑再去洗澡,回来以后所需的东西就已经摆在我眼前了。」
与人类解说员相比,AI 聊天机器人的「天份」在于足球相关知识的学习速度及储备量。正如克韩的亲身经历,解说员对于一场比赛需要很长时间的准备,而 AI 则可以自动化地进行知识抽取、表达,对知识的积累量是非常惊人的。
在「AI 球」的发布会上,这款产品就在现场展示了拟人化的比赛解说能力。
现场听来,「小美」的解说虽然略显生硬,但是整体较为流畅,对比赛情况描述准确,也能时不时「抖点机灵」。
那么,这是怎么实现的?
邬学宁告诉机器之能,简单来说,在直播过程中团队会实时接收前方发来的赛事数据信息,然后系统会模型进行分析并实时完成解说。
其实,AI 足球解说员并非魔方元的首创。阿里云团队就曾利用 AI 技术对 2017 年世俱杯半决赛西班牙皇家马德里队与阿联酋阿布扎比半岛队的比赛展开了解说。不同于魔方元直接拿现成数据再进行加工处理的做法,阿里云主要通过对球员 、足球进行定位掌握赛事信息。
邬学宁表示,计算机视觉技术并不是魔方元的主要发力点,「我们不挖石油,而是做加工石油的化工厂。」
他解释说,足球球场较大、摄像头无法全面覆盖、球员不能佩戴传感器、球员号码牌较小等原因,使得基于图像得到的数据源的准确率并不高,因此没有被广泛应用。
那么,「AI 球」是如何像人类解说员那样进行预测和判断?
「把基于统计学的模型与知识图谱相结合起来。」邬学宁说。
也就是说,系统在获得数据「某一球员在相距球门某一距离接到球」时,模型会考虑禁区点上这个位置射门的成功率等历史数据,然后给出相应的进球概率,从而完成整个推理预测过程。
「如果有一天 AI 能够把传球路线、传球选择这些全说出来,那估计我们解说员也就快要失业了。」克韩笑着说道。
眼下看来,AI 技术能力还远远无法替代解说员这个行当。
有一种观点认为,机器人解说员的优点之一就是,不会像黄健翔那样带有浓烈的个人色彩和喜好倾向,能够客观地传达赛事讯息。但不得不说,在肾上腺激素极度飙升的足球项目中,许多人「就好这口」,他们喜欢解说员在整个赛事推进中表现出激情澎湃的感染力,充分感受竞技体育的魅力。
在这之前,阿里云的 AI 解说亮相期间,就有不少网友吐槽机器的解说十分平淡,索然无味,声音僵硬,「让人听着快睡着了」。
「AI 没有真正的情感,但是并不妨碍它表达情绪。」
邬学宁解释道,只要按照预先设定的规则,AI 解说员在风格上也可以激烈、也可以幽默。这需要 AI 提取语料中不同的语言风格,再和要生成的语言融合生成内容。
此外,AI 还可以根据用户画像,为不同的球迷提供个性化的解说内容。
例如,对于主队球迷和客队球迷来说,赛场上的一个进球肯定会让他们产生正好相反的情绪。那么,AI 就可以针对为不同立场的用户提供不同倾向的解说,以便绕过两方球迷的情绪都能得到宣泄和安抚。
「当然,黄健翔的水平暂时是不可能达到的。」邬学宁笑着说。
AI+体育是否会成为下一个蓝海?
成立于 2012 年的魔方元科技针对足球领域推出过「NikeSOP」、「足球魔方」、「进球之王」等产品,旗下囊括数据咨询服务、赛事分析服务、职业体育服务等业务,覆盖了全球六个大洲的 4600 万用户,客户包括 BAT、新浪网、新英体育等。
不过,魔方元此前技术产品主要聚焦在大数据分析上,「AI 球」是魔方元试水 AI +足球的第一款产品。
邬学宁告诉机器之能,早在 2016 年 10 月一次聚餐时,团队核心成员就在讨论打造「AI 球」这样一个项目的可能性。
「互联网流量成本非常高,这是一个很好的获客点。」
在经历了前期的产品概念验证、技术可行性分析之后,公司在 2017 年 7 月开始了线上公测,并在 8 月底接入英超赛事。而今年,团队会把精力主要放在世界杯上。
「AI 球」还在小米「AI 音箱」和叮咚音箱上线相关功能。用户可以直接在智能音箱上与「小美」对话,通过接口调用的方式,智能音箱系统会把用户的语音转成文字发送到「AI球」,然后「AI球」再把处理好的文字传回音箱系统。未来,「AI 球」还会对接小米大脑从而接入小米所有智能终端产品。
提到「AI 球」的营收来源时,邬学宁表示,目前主要还是处于获客阶段,未来可能会跟俱乐部合作,从 B 端收取费用。此外,团队对于「AI 球」这种形式的产品也有很多设想: 「如果未来能够同其他平台建立良好的链接,那么大家看球的时候通过『AI 球』在饿了么上点点啤酒也挺不错的。」
目前,魔方元团队有 200 人左右,研发成员占 50% 以上,近期正在新加坡组建多语种团队。2016 年 8 月,公司完成华人文化近亿元 B 轮融资,并由「欢呼吧体育」更名为「魔方元科技」。更早一些时候,公司在 2013 年年底、2014 年年底获得 Pre-A 和 A 轮融资,分别由平安创投和北极光创投注资。
作为世界第一大球,足球产业的占体育总产值的 40% 以上,具有广阔的市场容量和产业人群,这也是魔方元选择聚焦在足球的主要原因。
不过,AI 在体育上的能力远不局限于此,篮球、棒球、高尔夫,也都是科技公司试图打入的热门领域。
2016 年,度秘也曾尝试了 AI 篮球解说。当时,百度上线了度秘直播解说系统,对中国男篮比赛展开图文直播。不过根据用户反馈来看,当时的技术也并不尽如人意,而这个项目后续似乎也没有了声音。
虽然在解说上,AI 没有发光发热,但在其他方面,AI 的能力已经逐渐展露出来。
智能体育公司 Zepp 曾推出一套名为 Visual Computing 的系统,这套系统通过手机摄像头拍下用户进行高尔夫、篮球、网球等运动的动作,然后利用 AI 技术对视频逐帧进行分析,有利于用户了解自己的运动过程,从而提升运动技巧。
这听起来好像并没有什么新奇,很多俱乐部早已用科技手段帮助教练掌握球队、球员的详实数据,从而帮助球员设计最合理的训练方式,或是给球队制定最佳对阵策略。不同的是,此前体育领域内所依靠的技术手段大多还是数据分析,而使用 AI 技术的仍占少数。
相较于金融、安防、医疗等 AI 应用的热门领域,在体育产业,AI 的价值似乎还没有得到最大程度的挖掘,计算机视觉技术和自然语言理解能力也没有找到能够引发颠覆的着陆点。
或许,「开荒」AI+体育仍然大有可为。