LeCun 对「世界模型」给出了最新定义。
观察值 x (t); 对世界状态的先前估计 s (t); 动作建议 a (t); 潜在变量建议 z (t)。
表征:h (t) = Enc (x (t)); 给出预测:s (t+1) = Pred ( h (t), s (t), z (t), a (t) )。
Enc () 是一个编码器(我们可以理解为一个可训练的确定性函数,例如神经网络); Pred () 是一个隐藏状态预测器(也是一个可训练的确定性函数); 潜在变量 z (t) 代表未知信息,可以准确预测将来会发生什么。z (t) 变量必须从一个分布中进行采样,或者在一组中变化。它参数化了(或分布)一系列可能的预测。换句话说,变量 z (t) 定义了一个可能性空间,我们根据这个空间来预测未来可能发生的情况。