D-S证据理论
系统学习 数学基础 | 机器学习 0 283

介绍

D-S证据理论是基于不确定性推理的一种数学理论,由DempsterShafer两位数学家在20世纪60年代提出。它是一种集合论的扩展,用于处理不完备、不确定和模糊的信息,尤其是在决策和推理问题中。

D-S证据理论将不同来源的证据(或信息)表示为不同的集合,然后使用数学运算来合并这些集合,得到最终的结论或概率分布。它在人工智能、决策分析、信号处理、模式识别等领域得到广泛应用。

一个简单的应用D-S证据理论的例子是在医学诊断方面。医生需要根据患者的症状和检查结果来判断疾病的种类和严重程度。不同检查方法和症状对于疾病的判断有不同的权重,而这些权重往往是不确定的。使用D-S证据理论,可以将不同检查方法和症状的判断结果表示为不同的证据集合,然后将它们合并成一个总的证据集合。基于这个总证据集合,可以计算出不同疾病的概率分布,从而得出最终的诊断结果。这个例子展示了D-S证据理论可以用于处理不同来源的信息,合并它们并得出最终结论的过程。

它最早是Dempster的工作,他试图用一个概率范围而不是单个的概率值去模拟不确定性。

概念

概率分配函数

  • 定义: 设函数\(\mathrm{m}: 2^{\Omega} \rightarrow[0,1]\), 且满足 $$ \begin{aligned} & m(\phi)=0 \ & \sum_{A \subseteq \Omega} m(A)=1 \end{aligned} $$ 则称\(m\)\(2^\Omega\) 上的概率分配函数,\(m(A)\)称为A的基本概率数。【\(m(A)\)代表依据当前的环境对假设集A的信任程度】

  • 作用: 将\(\Omega\)中任意一个子集都映射为[0,1]上的一个数\(m(A)\)

    1. \(\mathrm{A}\) 包含于 \(\Omega\)\(\mathrm{A}\) 由单个元素组成时, \(\mathrm{m}(\mathrm{A})\) 表示对 \(\mathrm{A}\) 的精确信任度
    2. \(A\) 包含于 \(\Omega 、 A \neq \Omega\), 且 \(A\) 由多个元素组成时, \(m(A)\) 也表示对 \(\mathrm{A}\) 的精确信任度, 但却不知道这部分信任度该 分给A中哪些元素
    3. \(\mathrm{A}=\Omega\) 时, 则 \(\mathrm{m}(\mathrm{A})\) 是对 \(\Omega\) 的各个子集进行信任分 配后剩下的部分, 它表示不知道该如何对它进行分配
  • 区分: 概率分配函数与概率分布函数不同 $$ \mathbf{m}(\mathbf{A}) \neq \mathbf{l}-\mathbf{m}(\neg \mathbf{A}) $$
  • 🌰: 口袋里红黄蓝三个球,取出一个球 $$ m(\varphi,{红},{黄},{蓝},{红,黄},{红,蓝},{黄,蓝},{红,黄,蓝})={0,0.3,0,0.1,0.2,0.2,0.1,0.1} $$

信任函数(Belief Function)

  • 定义: 设函数Bel: \(2^{\Omega} \rightarrow[0,1]\)对任意的 \(A \subseteq \Omega\) 有, $$ \operatorname{Bel}(A)=\sum_{B\subseteq A} m(B) $$ \(Bel(A)\)表示在当前环境下,对假设集A的信任程度,其值为A的所有子集的基本概率之和。

  • 作用: 表示对A的总的信任度,又称为下限函数。 当A为单一元素组成的集合时,\(Bel(A)=m(A)\)

  • 🌰: $$ Bel({红,黄})=m({红})+ m({黄})+m({红,黄})=0.3+0+0.2=0.5 $$

似然函数(Plausibility Function)

  • 定义: $$ P l: 2^{\Omega} \rightarrow[0,1] $$ 对任意的 \(A \subseteq \Omega\) 有: $$ \operatorname{Pl}(A)=1-\operatorname{Bel}(\neg \mathrm{A}) $$ 其中, \(\neg \mathbf{A}=\boldsymbol{\Omega}-\mathbf{A}\)

  • 作用: 似然函数又称为不可驳斥函数或上限函数。 由于 \(\operatorname{Bel}(\mathrm{A})\) 表示对 \(\mathrm{A}\) 为真的信任度, \(Bel(\neg \mathrm{A})\) 表示对 \(\neg \mathrm{A}\) 的信任度, 即 \(\mathrm{A}\) 为假的信任度, 因此, \(\mathrm{Pl}(\mathbf{A})\) 表示对 \(\mathbf{A}\) 为非假的信任度。

  • 🌰: $$ Pl({红}) = 1 - Bel(\neg {红}) = 1 - Bel({黄, 蓝}) = 1 - (0+0.1+0.1) = 0.8 $$ 这里的0.8是"红"为非假的信任度。由于"红"为真的精确信任度为0.3, 而剩下的\(0.8-0.3=0.5\), 则是知道非假, 但却不能肯定为真的那部分。

证据组合函数

  • 定义: 设\(m_1\)\(m_2\)是两个不同的概率分配函数,则其正交和\(m=m_1\bigoplus m_2\)满足 $$ \begin{aligned} & m(\phi)=0 \ & m(A)=K^{-1} \times \sum_{x \cap y=A} m_1(x) \times m_2(y) \end{aligned} $$ 其中: $$ K=1-\sum_{x \cap y=\phi} m_l(x) \times m_2(y)=\sum_{x \cap y \neq \phi} m_l(x) \times m_2(y) $$

  • 注意:

  • 如果 \(K \neq 0\), 则正交和 \(m\) 也是一个概率分配函数;
  • 如果 \(K=0\), 则不存在正交和 \(m\), 称\(m_1\)\(m_2\) 矛盾。比如一个往东, 一个往西。

性质

  1. \(\operatorname{Bel}(\Phi)=0, \operatorname{Bel}(\Omega)=1\), \(\operatorname{Pl}(\Phi)=0, \operatorname{Pl}(\Omega)=1\).
  2. 如果 \(A \subseteq B\), 则 \(\operatorname{Bel}(\mathrm{A}) \leq \operatorname{Bel}(\mathrm{B}), \mathrm{Pl}(\mathrm{A}) \leq \mathrm{Pl}(\mathrm{B})\)
  3. \(\forall A \subseteq \Omega, \operatorname{Pl}(\mathbf{A}) \geq \operatorname{Bel}(\mathbf{A})\)
  4. \(\forall A \subseteq \Omega, \operatorname{Bel}(\mathbf{A})+\operatorname{Bel}(\neg \mathbf{A}) \leq \mathbf{1}\), \(\operatorname{Pl}(\mathrm{A})+\operatorname{Pl}(\neg \mathrm{A}) \geq 1\).

实例

设有规则:

  1. 如果流鼻涕则感冒但非过敏性鼻炎(0.9)或过敏性鼻炎但非感冒(0.1)。
  2. 如果眼发炎则感冒但非过敏性鼻炎(0.8)或过敏性鼻炎但非感冒(0.05)。

事实:

  1. 小王流鼻涕(0.9)
  2. 小王发眼炎(0.4)

问: 小王患的什么病?

设样本空间:

  • \(h_1\): 感冒但非过敏性鼻炎
  • \(h_2\): 过敏性鼻炎但非感冒
  • \(h_3\): 又感冒又过敏性鼻炎

对于第一条规则, 有:

\[ \begin{aligned} & M_1(\{\varnothing\},\{h_1\},\{h_2\},\{h_3\},\{h_1, h_2\},\{h_1, h_3\},\{h_2, h_3\},\{h_1, h_2, h_3\}) \\ & =(0,0.81,0.09,0,0,0,0,0.1)\end{aligned} \]

对于第二条规则, 有:

\[ \begin{aligned} & M_2(\{\varnothing\},\{h_1\},\{h_2\},\{h_3\},\{h_1, h_2\},\{h_1, h_3\},\{h_2, h_3\},\{h_1, h_2, h_3\}) \\ & =(0,0.32,0.02,0,0,0,0,0.66) \end{aligned} \]

可计算\(K\):

\[ \begin{aligned} K^{-1} & =1 /\{1-[M_1(\{h_1\}) M_2(\{h_2\})+M_1(\{h_2\}) M_2(\{h_1\})]\} \\ & =1 /\{1-[0.81 \times 0.02+0.09 \times 0.32]\} \\ & =1 /\{1-0.045\}=1 / 0.955=1.05 \end{aligned} \]

进而计算概率分配函数:

\[ \begin{aligned} M\left(\left\{h_1\right\}\right) & = K\left[M_1\left(\left\{h_1\right\}\right) M_2\left(\left\{h_1\right\}\right) + M_1\left(\left\{h_1\right\}\right) M_2\left(\left\{h_1, h_2, h_3\right\}\right.\right. \left.+M_1\left(\left\{h_1, h_2, h_3\right\}\right) M_2\left(\left\{h_1\right\}\right)\right] \\ & =1.05 \times 0.8258=0.87 \\ M\left(\left\{h_2\right\}\right) & = K\left[M_1\left(\left\{h_2\right\}\right) M_2\left(\left\{h_2\right\}\right)+M_1\left(\left\{h_2\right\}\right) M_2\left(\left\{h_1, h_2, h_3\right\}\right.\right. \left.+M_1\left(\left\{h_1, h_2, h_3\right\}\right) M_2\left(\left\{h_2\right\}\right)\right] \\ & =1.05 \times 0.0632=0.066 \\ M\left(\left\{h_1, h_2, h_3\right\}\right) & = 1-M\left(\left\{h_1\right\}\right) - M\left(\left\{h_2\right\}\right) \\ & = 1-0.87-0.066=0.064 \end{aligned} \]

然后,计算信任函数跟似然函数:

信任函数:

\[ \begin{aligned} & \operatorname{Bel}\left(\left\{h_1\right\}\right)=M\left(\left\{h_1\right\}\right)=0.87 \\ & \operatorname{Bel}\left(\left\{h_2\right\}\right)=M\left(\left\{h_2\right\}\right)=0.066 \end{aligned} \]

似然函数:

\[ \begin{aligned} \operatorname{Pl}\left(\left\{h_1\right\}\right) & =1-\operatorname{Bel}\left(\neg\left\{h_1\right\}\right)=1-\operatorname{Bel}\left(\left\{h_2, h_3\right\}\right) \\ & =1-\left[M \left(\left\{h_2\right\}+M\left(\left\{h_3\right\}\right)=1-[0.066+0]=0.934\right.\right. \\ \operatorname{Pl}\left(\left\{h_2\right\}\right) & =1-\operatorname{Bel}\left(\neg\left\{h_2\right\}\right)=1-\operatorname{Bel}\left(\left\{h_1, h_3\right\}\right) \\ & =1-\left[M \left(\left\{h_1\right\}+M\left(\left\{h_3\right\}\right)=1-[0.87+0]=0.13\right.\right. \end{aligned} \]

由此,可以得出诊断意见: 小王得了感冒。

编写
预览