人工智能:现代方法(第4版)(上下册)_【美】斯图尔特·罗素;彼得·诺维格_AZW3_MOBI_EPUB_PDF_电子书(无页码)_【美】斯图尔特·罗素;彼得·诺维格
内容节选
14.1 时间与不确定性 我们已经在静态世界的背景下发展了概率推理技术,在静态世界中,每个随机变量都有一个固定的值。例如,维修汽车时,我们假设在诊断过程中,任何损坏的东西一直都是坏的;我们的工作是根据观察到的证据推断汽车的状态,这些状态同样是固定的。 现在让我们考虑一个稍微不同的问题:治疗糖尿病患者。与汽车维修的案例类似,我们有诸如近期的胰岛素剂量、食物摄入量、血糖测量和其他生理指标等证据。任务是评估患者当前的状态,包括实际的血糖水平和胰岛素水平。根据这些信息,我们可以对患者的食物摄入量和胰岛素剂量做出决策。与汽车维修不同,这个问题本质是动态的。考虑到近期的食物摄入量和胰岛素剂量、新陈代谢活动、一天中的不同时间等原因,血糖水平及其测量可能随时间而迅速变化。为了根据历史证据去评估当前状态并预测治疗措施的结果,我们必须对这些变化进行建模。 在许多其他情况下,我们也需要与之相同的考虑,例如跟踪机器人的位置、跟踪国家的经济活动以及理解口头或书面的单词序列。那么我们该如何对这样的动态情境进行建模? 14.1.1 状态与观测连续时间的不确定性可以用随机微分方程(stochastic differential equation,SDE)来建模。本章研究的模型可以看作SDE的离散时间近似。 本章将讨论离散时间模型,这意味着世界被视为一系列快照或者时间片。 我们将时间片编号为0、1、2等,而不是给它们指定特定的时间。通常,片之间的时间间隔 都是相同的。对于任意一个特定的应用,我们必须选择一个特定的 值。有时这是由传感器决定的;例如,摄像机可能以1/30秒的间隔提供图像。在其他情况下,间隔可能由相关变量的标准变化率决定。例如,在血糖监测的案例中,指标可能会在10分钟的过程中发生显著的变化,所以1分钟的间隔可能是合适的。但是,在根据地质时间建模大陆漂移时,100万年的间隔可能是合适的。 离散时间概率模型中的每个时间片包含一组随机变量,其中一些变量是可观测的,一些是不可观测的。为简单起见,我们假定如果一个变量子集在一个时间片是可观测的,则其在每个时间片中都是可观测的(尽管这在接下来的内容中不是严格必要的)。我们用Xt表示时刻t的不可观测的状态变量集合,用Et表示可观测的证据变量集合。对于某一组值et,时刻t的观测值为Et = et。 考虑下面的例子:你是一个秘密地下设施的保安。你想知道今天是否下雨,但你接触外面世界的唯一途径是每天早上你看到主管进来时带不带雨伞。对于每一天t,集合Et包含单个证据变量Umbrellat或简称Ut(雨伞是否出现),集合Xt包含单个状态变量Raint或简称Rt(是否下雨)。其他问题可能涉及更大的变量集。在糖尿病的例子中,证据变量可能是MeasuredBloodSugart(血糖测量值)与PulseRatet(脉搏频率),而状态变量可能包括BloodSugart(血糖水平)与StomachContentst(胃内容物)。(注意,BloodSugart与MeasuredBloodSugart不是同一个变量,这是我们处理实际量的噪声测量的方法。) 我们假设状态序列从t = 0开始,证据从t = 1开始到达。因此,我们的雨伞世界由状态变量R0, R1, R2, …与证据变量U1, U2, …表示。我们使用记号a:b表示从a到b的整数序列(包含a与b),使用符号Xa:b表示从Xa到Xb的变量集(包含Xa与Xb)。例如,U1:3对应U1, U2, U3。(注意,这与Python和Go等编程语言中使用的符号不同,在这些语言中,U[1:3]不包含U[3]。) 14.1.2 转移模型与传感器模型 确定了给定问题的状态变量集合和证据变量集合之后,我们下一步需要指定世界如何演变(转移模型)以及证据变量如何获得它们的值(传感器模型)。 转移模型是指给定先前状态的值时,最新状态变量的概率分布,也就是。现在,我们面临一个问题:随着时间t的增长,集合X0:t的规模将无限扩大。我们通过马尔可夫假设(Markov assumption)(即当前状态只依赖有限固定数量的过去状态)来解决这个问题。统计学家安德雷·马尔可夫(1856—1922 )最早对满足这一假设的过程进行了深入研究,因此这种过程被称为马尔可夫过程(Markov process)或马尔可夫链(Markov chain)。它们有着各种各样的形式,其中最简单的是一阶马尔可夫过程(first-order Markov process)。在一阶马尔可夫过程中,当前状态只依赖前一个状态,而不依赖任何更早的状态。换句话说,一个状态提供了足够的信息使得未来条件独立于过去,我们有 −1 (14-1) 因此,在一阶马尔可夫过程中,转移模型即为条件分布。二阶马尔可夫过程的转移模型是条件分布。图14-1展示了一阶马尔......
- 信息
- 上册
- 内容提要
- 对本书的赞誉
- 序
- 方法不止,智能无疆
- 唯思想永恒
- 中文版致谢
- 前言
- 资源与服务
- 第一部分 人工智能基础
- 第1章 绪论
- 第2章 智能体
- 第二部分 问题求解
- 第3章 通过搜索进行问题求解
- 第4章 复杂环境中的搜索
- 第5章 对抗搜索和博弈
- 第6章 约束满足问题
- 第三部分 知识、推理和规划
- 第7章 逻辑智能体
- 第8章 一阶逻辑
- 第9章 一阶逻辑中的推断
- 第10章 知识表示
- 第11章 自动规划
- 第四部分 不确定知识和不确定推理
- 第12章 不确定性的量化
- 第13章 概率推理
- 第14章 时间上的概率推理
- 第15章 概率编程
- 第16章 做简单决策
- 第17章 做复杂决策
- 第18章 多智能体决策
- 下册
- 第五部分 机器学习
- 第19章 样例学习
- 第20章 概率模型学习
- 第21章 深度学习
- 第22章 强化学习
- 第六部分 沟通、感知和行动
- 第23章 自然语言处理
- 第24章 自然语言处理中的深度学习
- 第25章 计算机视觉
- 第26章 机器人学
- 第七部分 总结
- 第27章 人工智能的哲学、伦理和安全性
- 第28章 人工智能的未来
- 附录A 数学背景知识
- 附录B 关于语言与算法的说明