介绍
D-S证据理论是基于不确定性推理的一种数学理论,由Dempster和Shafer两位数学家在20世纪60年代提出。它是一种集合论的扩展,用于处理不完备、不确定和模糊的信息,尤其是在决策和推理问题中。
D-S证据理论将不同来源的证据(或信息)表示为不同的集合,然后使用数学运算来合并这些集合,得到最终的结论或概率分布。它在人工智能、决策分析、信号处理、模式识别等领域得到广泛应用。
一个简单的应用D-S证据理论的例子是在医学诊断方面。医生需要根据患者的症状和检查结果来判断疾病的种类和严重程度。不同检查方法和症状对于疾病的判断有不同的权重,而这些权重往往是不确定的。使用D-S证据理论,可以将不同检查方法和症状的判断结果表示为不同的证据集合,然后将它们合并成一个总的证据集合。基于这个总证据集合,可以计算出不同疾病的概率分布,从而得出最终的诊断结果。这个例子展示了D-S证据理论可以用于处理不同来源的信息,合并它们并得出最终结论的过程。
它最早是Dempster的工作,他试图用一个概率范围而不是单个的概率值去模拟不确定性。
概念
概率分配函数
-
定义: 设函数\(\mathrm{m}: 2^{\Omega} \rightarrow[0,1]\), 且满足 $$ \begin{aligned} & m(\phi)=0 \ & \sum_{A \subseteq \Omega} m(A)=1 \end{aligned} $$ 则称\(m\)是 \(2^\Omega\) 上的概率分配函数,\(m(A)\)称为A的基本概率数。【\(m(A)\)代表依据当前的环境对假设集A的信任程度】
-
作用: 将\(\Omega\)中任意一个子集都映射为[0,1]上的一个数\(m(A)\)
- 当 \(\mathrm{A}\) 包含于 \(\Omega\) 且 \(\mathrm{A}\) 由单个元素组成时, \(\mathrm{m}(\mathrm{A})\) 表示对 \(\mathrm{A}\) 的精确信任度
- 当 \(A\) 包含于 \(\Omega 、 A \neq \Omega\), 且 \(A\) 由多个元素组成时, \(m(A)\) 也表示对 \(\mathrm{A}\) 的精确信任度, 但却不知道这部分信任度该 分给A中哪些元素
- 当 \(\mathrm{A}=\Omega\) 时, 则 \(\mathrm{m}(\mathrm{A})\) 是对 \(\Omega\) 的各个子集进行信任分 配后剩下的部分, 它表示不知道该如何对它进行分配
- 区分: 概率分配函数与概率分布函数不同 $$ \mathbf{m}(\mathbf{A}) \neq \mathbf{l}-\mathbf{m}(\neg \mathbf{A}) $$
- 🌰: 口袋里红黄蓝三个球,取出一个球 $$ m(\varphi,{红},{黄},{蓝},{红,黄},{红,蓝},{黄,蓝},{红,黄,蓝})={0,0.3,0,0.1,0.2,0.2,0.1,0.1} $$
信任函数(Belief Function)
-
定义: 设函数Bel: \(2^{\Omega} \rightarrow[0,1]\)对任意的 \(A \subseteq \Omega\) 有, $$ \operatorname{Bel}(A)=\sum_{B\subseteq A} m(B) $$ \(Bel(A)\)表示在当前环境下,对假设集A的信任程度,其值为A的所有子集的基本概率之和。
-
作用: 表示对A的总的信任度,又称为下限函数。 当A为单一元素组成的集合时,\(Bel(A)=m(A)\)
- 🌰: $$ Bel({红,黄})=m({红})+ m({黄})+m({红,黄})=0.3+0+0.2=0.5 $$
似然函数(Plausibility Function)
-
定义: $$ P l: 2^{\Omega} \rightarrow[0,1] $$ 对任意的 \(A \subseteq \Omega\) 有: $$ \operatorname{Pl}(A)=1-\operatorname{Bel}(\neg \mathrm{A}) $$ 其中, \(\neg \mathbf{A}=\boldsymbol{\Omega}-\mathbf{A}\)。
-
作用: 似然函数又称为不可驳斥函数或上限函数。 由于 \(\operatorname{Bel}(\mathrm{A})\) 表示对 \(\mathrm{A}\) 为真的信任度, \(Bel(\neg \mathrm{A})\) 表示对 \(\neg \mathrm{A}\) 的信任度, 即 \(\mathrm{A}\) 为假的信任度, 因此, \(\mathrm{Pl}(\mathbf{A})\) 表示对 \(\mathbf{A}\) 为非假的信任度。
- 🌰: $$ Pl({红}) = 1 - Bel(\neg {红}) = 1 - Bel({黄, 蓝}) = 1 - (0+0.1+0.1) = 0.8 $$ 这里的0.8是"红"为非假的信任度。由于"红"为真的精确信任度为0.3, 而剩下的\(0.8-0.3=0.5\), 则是知道非假, 但却不能肯定为真的那部分。
证据组合函数
-
定义: 设\(m_1\)和 \(m_2\)是两个不同的概率分配函数,则其正交和\(m=m_1\bigoplus m_2\)满足 $$ \begin{aligned} & m(\phi)=0 \ & m(A)=K^{-1} \times \sum_{x \cap y=A} m_1(x) \times m_2(y) \end{aligned} $$ 其中: $$ K=1-\sum_{x \cap y=\phi} m_l(x) \times m_2(y)=\sum_{x \cap y \neq \phi} m_l(x) \times m_2(y) $$
-
注意:
- 如果 \(K \neq 0\), 则正交和 \(m\) 也是一个概率分配函数;
- 如果 \(K=0\), 则不存在正交和 \(m\), 称\(m_1\)与 \(m_2\) 矛盾。比如一个往东, 一个往西。
性质
- \(\operatorname{Bel}(\Phi)=0, \operatorname{Bel}(\Omega)=1\), \(\operatorname{Pl}(\Phi)=0, \operatorname{Pl}(\Omega)=1\).
- 如果 \(A \subseteq B\), 则 \(\operatorname{Bel}(\mathrm{A}) \leq \operatorname{Bel}(\mathrm{B}), \mathrm{Pl}(\mathrm{A}) \leq \mathrm{Pl}(\mathrm{B})\) 。
- \(\forall A \subseteq \Omega, \operatorname{Pl}(\mathbf{A}) \geq \operatorname{Bel}(\mathbf{A})\) 。
- \(\forall A \subseteq \Omega, \operatorname{Bel}(\mathbf{A})+\operatorname{Bel}(\neg \mathbf{A}) \leq \mathbf{1}\), \(\operatorname{Pl}(\mathrm{A})+\operatorname{Pl}(\neg \mathrm{A}) \geq 1\).
实例
设有规则:
- 如果流鼻涕则感冒但非过敏性鼻炎(0.9)或过敏性鼻炎但非感冒(0.1)。
- 如果眼发炎则感冒但非过敏性鼻炎(0.8)或过敏性鼻炎但非感冒(0.05)。
有事实:
- 小王流鼻涕(0.9)
- 小王发眼炎(0.4)
问: 小王患的什么病?
设样本空间:
- \(h_1\): 感冒但非过敏性鼻炎
- \(h_2\): 过敏性鼻炎但非感冒
- \(h_3\): 又感冒又过敏性鼻炎
对于第一条规则, 有:
对于第二条规则, 有:
可计算\(K\):
进而计算概率分配函数:
然后,计算信任函数跟似然函数:
信任函数:
似然函数:
由此,可以得出诊断意见: 小王得了感冒。