本质上说,确定性近似是遵循着一定的原则,使用一个分布来近似另一个分布,近似结果取决于确定的规则。可是在很多预测任务中,完整的后验分布并不是必需的,我们关注的对象只是某个因变量在后验分布下的期望,或者具有最大后验概率的那个取值。这时再使用确定性近似来计算预测结果,尤其是连续函数在连续分布下的预测结果又是个在计算上颇为棘手的问题。

有些时候,即使目标分布的形式是已知的,对它的求解也存在着困难。就拿常见的 Beta 分布来说,其概率密度可以表示为 p(x)=Cxα−1(1−x)β−1p(x)=Cxα−1(1−x)β−1