第4章 朴素贝叶斯法
习题4.1
用极大似然估计法推出朴素贝叶斯法中的概率估计公式(4.8)及公式 (4.9)。
解答:
解答思路:
- 极大似然估计的一般步骤(详见习题1.1第3步)
- 证明公式4.8:根据输出空间
的随机变量 满足独立同分布,列出似然函数,求解概率 的值; - 证明公式4.9:证明同公式4.8。
解答步骤:
第1步:极大似然估计的一般步骤
参考Wiki:https://en.wikipedia.org/wiki/Maximum_likelihood_estimation
- 写出随机变量的概率分布函数;
- 写出似然函数;
- 对似然函数取对数,得到对数似然函数,并进行化简;
- 对参数进行求导,并令导数等于0;
- 求解似然函数方程,得到参数的值。
第2步:证明公式(4.8)
根据书中第4章的第4.1节朴素贝叶斯法的基本方法:
设输入空间
为 维向量的集合,输出空间为类标记集合 。输入为特征向量 ,输出为类标记 。 是定义在输入空间 上的随机向量, 是定义在输出空间 上的随机变量。 是 和 的联合概率分布。训练数据集 由
独立同分布产生。
根据上述定义,
对似然函数取对数,得到对数似然函数为:
求解参数
对参数
从上式可得,
综上所述,
第3步:证明公式(4.9)
根据书中第4章朴素贝叶斯法的条件独立性假设:
朴素贝叶斯法对条件概率分布作了条件独立性的假设。由于这是一个较强的假设,朴素贝叶斯法也由此得名。具体地,条件独立性假设是:
根据上述定义,在条件
与第2步推导过程类似,可求解得到
综上所述,
习题4.2
用贝叶斯估计法推出朴素贝叶斯法中的慨率估计公式(4.10)及公式(4.11)
解答:
解答思路:
- 贝叶斯估计的一般步骤(详见习题1.1第4步);
- 证明公式4.11:假设概率
服从狄利克雷(Dirichlet)分布,根据贝叶斯公式,推导后验概率也服从Dirichlet分布,求参数期望; - 证明公式4.10:证明同公式4.11。
解答步骤:
第1步:贝叶斯估计的一般步骤
参考Wiki:https://en.wikipedia.org/wiki/Bayes_estimator
- 确定参数
的先验概率 - 根据样本集
,计算似然函数 : - 利用贝叶斯公式,求
的后验概率: - 计算后验概率分布参数
的期望,并求出贝叶斯估计值:
第2步:证明公式(4.11)
证明思路:
- 条件假设:
,且服从参数为 的Dirichlet分布;随机变量 出现 的次数为 ; - 得到
的先验概率 ; - 得到似然函数
; - 根据贝叶斯公式,计算后验概率
- 计算
的期望
证明步骤:
- 条件假设
根据朴素贝叶斯法的基本方法,训练数据集
(1)随机变量
(2)
补充说明:
- 狄利克雷(Dirichlet)分布
参考PRML(Pattern Recognition and Machine Learning)一书的第2.2.1章节:⽤似然函数(2.34)乘以先验(2.38),我们得到了参数的后验分布,形式为 该书中第B.4章节: 狄利克雷分布是
个随机变量 的多变量分布,其中 ,并满足以下约束
记
- 为什么假设
的概率服从Dirichlet分布?
答:原因如下:
(1)首先,根据PRML第B.4章节,Dirichlet分布是Beta分布的推广。
(2)由于,Beta分布是二项式分布的共轭分布,Dirichlet分布是多项式分布的共轭分布。Dirichlet分布可以看作是“分布的分布”;
(3)又因为,Beta分布与Dirichlet分布都是先验共轭的,意味着先验概率和后验概率属于同一个分布。当假设为Beta分布或者Dirichlet分布时,通过获得大量的观测数据,进行数据分布的调整,使得计算出来的概率越来越接近真实值。
(4)因此,对于一个概率未知的事件,Beta分布或Dirichlet分布能作为表示该事件发生的概率的概率分布。
- 得到先验概率
根据假设(2)和Dirichlet分布的定义,可得先验概率为
- 得到似然函数
记,可得似然函数为
- 得到后验概率分布
结合贝叶斯公式,求的后验概率分布,可得
根据假设(1),可得
上式表明,后验概率分布
- 得到随机变量
的期望
根据后验概率分布和假设(1),求随机变量 的期望,可得
其中
随机变量
第3步:证明公式(4.10)
证明思路:
- 条件假设:
,其中 ,且服从参数为 的Dirichlet分布;出现 的次数为 ; - 得到
的先验概率 ; - 得到似然函数
; - 根据贝叶斯公式,计算后验概率
- 计算
的期望
证明步骤:
- 条件假设
根据朴素贝叶斯法的基本方法,训练数据集
(1)出现
(2)
- 得到先验概率
根据假设(2)和Dirichlet分布的定义,可得先验概率为
- 得到似然函数
记,可得似然函数为
- 得到后验概率分布
结合贝叶斯公式,求的后验概率分布,可得
根据假设(1),可得
上式表明,后验概率分布
- 得到随机变量
的期望
根据后验概率分布和假设(1),求随机变量 的期望,可得
其中
随机变量
参考文献
【1】极大似然估计的一般步骤(来源于Wiki百科):https://en.wikipedia.org/wiki/Maximum_likelihood_estimation
【2】贝叶斯估计的一般步骤(来源于Wiki百科):https://en.wikipedia.org/wiki/Bayes_estimator
