DC娱乐网

哥伦比亚大学统计学教授 Andrew 分享的使用贝叶斯推断的7个理由!----

哥伦比亚大学统计学教授 Andrew 分享的使用贝叶斯推断的7个理由!

--------------------------------

我并不是说你应该用贝叶斯推断来解决所有问题。我只是想给出使用贝叶斯推断的七个不同理由——也就是说,在七种不同的场景下,贝叶斯推断非常有用:

1️⃣决策分析。 你可以将你的后验不确定性输入到决策分析中,并计算出不同决策选项的期望效用。这是最正统的贝叶斯决策方法,我们在《贝叶斯数据分析第三版》(BDA3) 的第9章中提供了一些例子。实际上,这种方法不仅能处理决策问题中出现的概率不确定性,还能处理效用本身的不确定性。

2️⃣不确定性的传播。 你可以使用后验模拟来获取任何关于参数、潜在数据和预测数据的函数的不确定性。举个简单的例子,假设你拟合了一条直线 y = a + bx + error,并且想对x轴截距(即 E(y|x) = 0 时x的值)进行推断。这只是方程 0 = a + bx 的解,即 x = -a/b。关键在于,如果你拟合了回归并获得了 (a, b) 的后验模拟结果,你就可以直接得到 -a/b 的不确定性。对于越来越复杂的模型,这个问题在分析上可能具有挑战性。不过实际上,我不建议你研究这类比率;这里我只是把它作为一个简单的例子。

3️⃣先验信息。 好的,这一点应该非常清楚了!一个简单的例子可以参见《回归与其他故事》的第9.4节,或者我与 van Zwet 合著的这篇论文。关键在于,在许多实际问题中,先验信息的作用与数据相当,甚至比数据更强,因此能有一种方法来处理这类问题是件好事。

4️⃣正则化。 当你建立一个大型模型而数据又很稀疏时,你的参数估计会充满噪声。使用信息性先验的贝叶斯推断是进行“正则化”的一种方式,也就是说,可以获得更稳定的估计。这一点与上面的第3条不同,用于正则化的先验不必代表特定领域的知识;它完全可以为了产生具有良好统计特性的正则化估计而设定。这种正则化先验在数学意义上仍是“信息”,但它来自不同的地方,并可以以不同的方式映射到外部世界。

5️⃣整合多个信息来源。 想想多层次模型就明白了。这里有一个药理学的例子,我们使用软约束(即信息性先验)来整合来自两种不同药物试验的数据。再比如多层次回归与后层化,即使我们只使用一项调查的数据,我们也能对多个州进行推断,你可以认为这是在整合来自不同州的调查反馈。同时,你也在整合来自调查和人口普查的信息。

6️⃣潜在数据和参数。 当一个模型充满参数——甚至可能参数比数据还多时——你无法估计出所有参数。相反,我们可以将这些参数视为“潜在数据”,并为它们设定一个联合概率模型,然后使用贝叶斯推断进行估计。例子包括选择数据背后潜在的连续偏好、药理学模型中未观测到的内部浓度,以及各种过程模型中的中间状态。

7️⃣促使你进行更深入的探索。 上述许多观点都围绕着一点:对于那些太大或太复杂,以至于无法使用最大似然法或其他传统的点估计方法来估计的模型,贝叶斯推断非常有用。在实践中,这意味着贝叶斯推断不仅让我们能够拟合那些原本难以拟合的模型,还使我们能够拓展知识的边界。既然我们能拟合更复杂的模型,我们就更有可能去这样做。例如,我们会建立潜变量测量误差模型,而在此之前,我们可能只会忽略这些误差或应用某种解析校正。

话虽如此,我承认贝叶斯推断可能需要一些努力,而且贝叶斯推断的任何特定好处也可以用其他方法达到:比如直接使用正则化来估计参数,将不确定量视为潜在数据,以及使用联合预测模拟来总结不确定性。没有理由非要称之为“贝叶斯”,有时对问题的不同部分使用不一致的设定甚至是可行的——甚至是有用的。贝叶斯推断之所以在我研究的问题上行之有效,是得益于我所学习和开发的那些用于构建、拟合、检查、比较、扩展、可视化和使用模型的工具。而其他的工具也将在其他情境下对其他人有效。

写这篇文章的目的是为了阐述使用贝叶斯推断的几种不同动机。人们很容易只选择其中一两个(例如,先验信息和正则化,或决策分析和不确定性传播)而忽略了全局。因此,我认为把所有这些不同的观点放在一起会很有帮助。