Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Ivy、钱天培编译

跳舞也比不过AI?谷歌AI已可以自行freestyle

近日,谷歌艺术与文化部的Damien Henry与英国舞蹈编导Wayne McGregor合作,共同研发了一种能够预测特定风格舞蹈动作的人工智能

这个工具可以根据数百小时的视频片段生成自创的舞蹈编排,所有的资料都来自于Wayne McGregor自己以及他公司的十位舞者的档案。

在观看了他们的舞蹈动作视频后,AI可以抓取出这些舞蹈家的个人风格,并创造类似风格的独舞编排。

McGregor对科学和技术并不是一时兴起,他拥有普利茅斯大学的名誉科学博士学位。他说,这个新项目是在回顾他25年来的表演视频时想到的,他想知道技术能否帮助保持表演的新鲜感。

McGregor 说到:“我想用一种有趣的方式来利用这个庞大的工作档案,所以我问Damien是否可以用它来产生一些新的东西。所有的这一切最后都归结到了编排中的一个至关重要的问题:如何不断创造新的内容?”

人工智能已经能够预测很多事情,比如你将在手机上输入的下一个单词,或者在上传到社交媒体的图片中识别你的身份。但是,预测手势对人工智能来说是很棘手的。

 Henry说,他在科学网站distill.pub上的一篇帖子中得到了灵感,该帖子使用神经网络,根据你在前一封信中的笔迹去预测下一封信的笔迹形式。他提出了一个类似的算法,可以对给定的运动进行预测。通过视频捕捉舞蹈演员的姿势,然后使用工具提供接下来最有可能的几个舞蹈片段,并在屏幕上实时显示它们。

这项技术录入了McGregor的档案和他的舞蹈演员的录制视频。Henry认为,在某种程度上,人工智能学会了如何跳舞,但它的舞蹈风格与Wayne McGregor十分相似。

该工具的工作原理是利用网络摄像机获取视频输入,并通过绘制不同身体部位之间的点,提取舞蹈演员做出特定姿势的“骨架”。它将这个输入至三种不同的算法来猜测下一个舞蹈姿势可能是什么,这需要考虑到特定舞者的个人风格,也要考虑到公司其他九个舞者的风格。

这总共产生了30个潜在的编排序列,目前持续时间约10秒,并使用类似的"骨架" 视觉显示在计算机屏幕上,McGregor会选择他想用哪一个序列。Henry说:“接下来,无论舞蹈演员跳什么,都可以再次录制,重新输入机器。”

由AI工具读取的舞者"骨架"

对于McGregor来说, 这项技术最引人入胜的一个方面是, 它可以学习和再现舞者的特殊风格。

他说:“我之所以选择某些舞者,是因为他们的身体特征和特殊的运动方式。”Damien的发明的天才之处在于,它抓住了表演的精髓。

实际上,算法在编舞中已经被使用了几十年。

早在1964年,在匹兹堡大学,Jeanne Beaman和Paul Le Vasseur就用计算机从不同的时间变化、空间方向和他们输入的运动类型中产生随机的舞蹈序列。本世纪初,编导们使用了一种叫"choreograph" 的软件,该软件是一种排序工具,可以让编导在时间轴上设置数字变体, 在表演过程中作为舞者的提示表。由于舞台周围安装了传感器, 它能够实时更新舞者的动作。

但是人工智能在舞蹈和创造力方面有局限性。Michael Klien是杜克大学舞蹈项目的编导,也是ChoreoGraph的熟练使用者。他的软件作品在伦敦皇家歌剧院展出,但他解释说,他很快就厌倦了这一过程,并在2002年放弃了系统,转而直接与他的舞蹈演员合作。

他表示:“我们不断在系统中加入更多的算法,使其更加智能,我想实现人工智能编排结构。但我意识到,人工智能不能作为开发舞蹈的中坚力量。我们对智能的假设构建出我们的人工智能机器,这也意味着我们不会突破我们的想象力极限。”

AI工具预测舞蹈演员下一步动作的示例

Henry表示,谷歌的工具无法发明出以前从未见过的动作。像所有的人工智能一样,它通过“插值”来构建结果——也就是说,它预测的是在之前所有学到的事情中最有可能发生的事情。

“我们不是要用AI取代编舞这个角色,”他说。“但是,AI可以以一种非常有效和快速的方式进行创造,这样创造的过程就会永不停止。真正的创造部分将来自Wayne对这些舞蹈序列的选择与使用。”

当然,AI编舞也不是完全不具备创造力。该技术可以画出一张它所识别的不同舞蹈动作的“地图”,并且推荐特定的动作序列。Henry解释说, 它在动作之间转换的方式可能并未在训练数据中出现过。这意味着它必须有潜力想出以前从未做过的动作。McGregor 表示,“我总是对一件我从未见过的东西感兴趣”。

这项技术也可以设置为提供一个混合两个舞者风格的编排舞蹈序列。当公司试用时这一功能时,这引起观看者哈哈大笑,你想象一下你以别人的风格在屏幕上移动,你就能体会到这种乐趣了。

比如说,在McGregor的档案中插入巴西桑巴舞的录像,会发生什么?结果将会是一场以前可能从未见过的混合舞。但是McGregor说,他并不担心AI会编排出四不像的舞蹈。“接下来如何选择还是我来决定的。我是整个舞蹈的源头。我更把这看作一个创造的机会,我很喜欢这种不确定的感觉,像在玩游戏一样。”

McGregor希望这一工具将来可以用于实时工作,每个舞蹈演员都有自己的展示屏幕,并在舞台上可以再现算法传递出的舞蹈序列。但是一些技术细节仍然需要整理——比如,该程序能否同时支持十部手机连接,能否将舞蹈序列同时显示在屏幕上?

McGregor对此很有信心“我们将会实现实时舞蹈编排,这一定会很吸引人。”

相关报道:https://www.wired.co.uk/article/google-ai-wayne-mcgregor-dance-choreography

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

产业谷歌
1
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

插值技术

数学的数值分析领域中,内插或称插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。求解科学和工程的问题时,通常有许多数据点借由采样、实验等方法获得,这些数据可能代表了有限个数值函数,其中自变量的值。而根据这些数据,我们往往希望得到一个连续的函数(也就是曲线);或者更密集的离散方程与已知数据互相吻合,这个过程叫做拟合。

推荐文章
暂无评论
暂无评论~