Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

世界首部生成电影,每次播放都不一样,AI:我剪了52万亿亿个版本

机器之能报道

编辑:Sia

我们的孙子孙女可能会惊奇地看着我们说,你的意思是你曾经一遍又一遍地看同样的东西?

为什么电影就应该是固定、静态的东西?

一部《唐伯虎点秋香》,每次播放都不一样,会是一种什么感觉?你想知道吗?

现在,至少在技术上,已经可以实现了。

「我绝对要崩溃了。」纽约时报影评人 Alissa Wilkinson 在今年圣丹斯电影节上看完纪录片《Eno》后发出感慨,称其是:

「一部难以置信的生成艺术作品。」

官方预告片

《 Eno 》讲述的是著名英国音乐制作人 Brian Eno ,他深刻影响过 Talking Heads、David Bowie、U2、Coldplay 等著名艺术家和乐队的音乐风格。

这部片子的独特之处在于,每次放映,系统都会生成一个全新版本。

Alissa Wilkinson 看了两次,本质上,是两部「完全不同的电影」,她在《纽约时报》的影评中写道。

两个版本会有一些共同部分。

如,难忘的 1984 年档案片段,记录了 U2 创作「 Pride ( In the Name of Love )」的过程;导演拍摄的大量当代访谈;还有一些 YouTube 视频,Eno 展示影响自己的音乐。

但也包含了不同的内容,以致于她认为,第一个版本是在讲述「艺术和身份」,第二个版本更像是关于「创造力」的电影。

图片这些杂志代表不同行业(流行音乐、电影、独立文化评论和商业)对这部纪录片的评价。


-1-

传统电影制作都有一个「最终剪辑版」:

按照剪辑师精细挑选、设计的逻辑,从开头有序、可预测地走向结尾。

每次观影,所有素材都按这种顺序再现一遍。

多亏了 AI 算法,《 Eno 》 打破了 130 年的技术限制,将随机性纳入电影。

图片导演Gary Hustwit在《Eno》播放现场。

图片导演 Gary Hustwit在《Eno》播放现场。

在播放现场,你会看到一个叫「 Brain One 」的铝制盒子,通过转动或按下盒子的按钮,就可以当着观众的面「现场制作」电影。

说得更详细些。

电影制作方首先准备了一个庞大的素材库,包括 30 小时的访谈和 500 小时的影像素材 。然后,让盒子里的 AI ——也是一个叫「Brain One」的决策树系统——负责「剪辑」:

每次操作按钮,就像一道命令,AI 会按照电影制作者预先设定的规则,不断从庞大素材库中选择内容,实时生成一个全新版本的电影。

最令人惊讶的是,系统可以「剪」出 52 万亿亿个版本!52 万亿亿是什么概念?52 后面跟 18 个零,即:

52,000,000,000,000,000,000!

比地球上的沙粒总数还多,也就是说,生成两个完全相同版本的《 Eno 》的概率,几乎为零。

-2-

导演 Gary Hustwit 将这部电影视为「活的文件」:

你可以不断添加新的影像素材、更新软件,作为结果,这部电影也在不断生成中,没有完结,没有终局。

即使用这种技术制作一部每次播放都不一样的漫威电影,也没问题。

图片

这项专有的生成技术,来自一家叫 Anamorph 的电影制作和技术公司,由 Gary Hustwit 和数字艺术家 Brendan Dawes 创立。他们花了五年时间,从零开始构建这个系统。

「Brain One」不是生成式 AI,而是一个生成系统、一种基于代码的决策树系统。

ChatGPT、Midjourney 都是将既有作品作为训练数据,然后根据提示生成新的作品,人类(包括艺术家本人)对输出作品的掌控力其实非常低。

「 Brain One 」是基于人类编写的规则,创造新东西,因此,人类(包括艺术家本人)对输出作品的掌控力比较高。

如,虽然场景顺序会改变,但生成作品仍然保持一个连贯的叙事,一些关键场景固定在特定的时间段。

这种基于规则的方法,既保留了导演的创作意图,又引入了变化和不确定性,允许每个观众有自己独特的体验。

另外, ChatGPT、Midjourney  需要接受大量他人数据的训练。「Brain One」使用的全部是自己的素材,而不是基于他人的作品。

据说,包括许多前所未见的镜头、Eno 档案中未发布的音乐和视觉艺术。

最重要的是,在这个系统配方中,作为专业电影制作者的行业 know-how 非常关键,他们知道一部优秀的纪录片如何讲述故事。


-3-

当然,研发遭遇的挑战也不少。

系统需要能够同时处理成百上千个 4K(超高清)视频文件,而且,每个视频都带有 5.1 环绕声音轨。这需要很强的计算能力。

另外,系统不仅要从现有的场景中选择并排序,还要能够自己创造全新的场景和转场效果,包括生成新的视频内容和原创的 5.1 环绕声音效。

由于是用于现场放映,系统绝对不能崩溃,他们进行了大量测试来确保稳定性。

也许有人会问,除了现场活动、院线发行,能否在流媒体上看到这种作品?

答案是,NO。

目前的流媒体网络还不具备动态生成独特视频文件、并将其流式传输给广大观众的能力。

不过,Anamorph 也正在开发新软件,帮助流媒体平台创建生成的《Eno》。


-4-

也不是所有人都买账。

有现场体验过的豆瓣网友表示,随机生成没意义,「很多段落就被 AI 生硬打断,尤其是 Brian Eno 的配乐刚进情绪状态,就戛然而止。」

也有音乐人、艺术家认为,这很愚蠢,用技术来随机化内容叙事,「有点像垃圾。」

但 Eno 本人为什么会授权这部纪录片的制作呢?

其实,很多年前就有了答案。「我们的孙辈可能会惊奇地看着我们说,『你的意思是你们过去常常一遍又一遍地听完全相同的东西?』」他曾写道。

很早以前,这位先锋音乐人已经开始「生成音乐( generative music )」的试验探索——按照人为设定的规则和偏好,让数字系统自动产生音乐。



参考链接

https://www.theverge.com/24197153/eno-documentary-generative-film-gary-hustwit-interview
https://techcrunch.com/2024/02/28/anamorphs-generative-technology-reorders-scenes-to-create-unlimited-versions-of-one-film/
https://www.nytimes.com/2024/07/11/movies/eno-review-creativity-52-billion-billion-ways.html
https://www.nytimes.com/2024/07/12/movies/brian-eno-documentary.html
https://www.openculture.com/2024/07/eno-the-new-generative-documentary-on-brian-eno-thats-never-the-same-movie-twice.html



图片

产业
相关数据
逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

推荐文章
暂无评论
暂无评论~