Meta 首席 AI 科学家 Yann LeCun 非常看好世界模型,希望创建一个能够学习世界如何运作的内部模型。近日,UC 伯克利、谷歌 DeepMind 等机构的研究者用生成模型来构建交互式现实世界模拟器,对于世界模型具有积极意义。
论文地址:https://arxiv.org/pdf/2310.06114.pdf
论文主页:https://universal-simulator.github.io/unisim/
对应上图 3 右下的导航场景 对应上图3右下的导航场景
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
Meta 首席 AI 科学家 Yann LeCun 非常看好世界模型,希望创建一个能够学习世界如何运作的内部模型。近日,UC 伯克利、谷歌 DeepMind 等机构的研究者用生成模型来构建交互式现实世界模拟器,对于世界模型具有积极意义。
论文地址:https://arxiv.org/pdf/2310.06114.pdf
论文主页:https://universal-simulator.github.io/unisim/
对应上图 3 右下的导航场景 对应上图3右下的导航场景
DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。
https://deepmind.com/人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。
在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。
强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。
视频生成是指利用深度学习等技术生成视频的任务。